Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NC_009495 | Clostridium botulinum A str. ATCC 3502, complete genome | 10 crisprs | DEDDh,csa3,DinG,WYL,cas3,cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7,cas6,casR | 0 | 11 | 7 | 0 |
NC_009496 | Clostridium botulinum A str. ATCC 3502 plasmid pBOT3502, complete sequence | 0 crisprs | NA | 0 | 0 | 0 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_1 | 1897862-1898079 | Unclear |
NA
Consensus repeat of NC_009495_1
|
3 spacers
spacers of NC_009495_1
>1.1|1897885|43|NC_009495|CRISPRCasFinder CCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTA >1.2|1897951|40|NC_009495|CRISPRCasFinder TATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAG >1.3|1898014|43|NC_009495|CRISPRCasFinder GTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTA |
cas3 |
CRISPR arrays and Neighbor proteins around NC_009495_1
The CRISPR arrays of NC_009495_1 >merge|NC_009495|1|1897862-1898079|CRISPRCasFinder ATAATAATATAGAAGATATATCTCCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTAAAAATAAAGTAAAAGACATATCTTATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAGATAATAAAATAGAAAATATAGAAGTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTAATAATAGTATTAAGGATTTCTTA >NC_009495|1|1|1897862-1898079|CRISPRCasFinder ATAATAATATAGAAGATATATCT CCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTA AAAATAAAGTAAAAGACATATCT TATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAG ATAATAAAATAGAAAATATAGAA GTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTA ATAATAGTATTAAGGATTTCTTA
>NC_009495.1|WP_011986369.1|1892368_1896826_+|DUF5050-domain-containing-protein MIRGVFAIFSKKFVAKFLLYSSIVIIPMFNHNYVQAASSKQYETKYNVSLDKVWKIRFSREVDKATLNPENIKILDNQGKEMPIDLSLDVDKHYVKIALKSGTYNGVHYSGKYEKDKKYSLIVKEGLMSEPSKNKKSKNLAYETMMDFNTIGDNEYPGLPIEDGLIVIGDKAYSVGYLSKHSSIANEITSNGNYYIAYISKEYGEKIKQVLGNNTTKGNQERANKILYYAPNGNQYEYEWNEAFGEYKIVLPKAYVDVTPGVINGVVNLAVKQVKAVPGAKYFKLAHSNTIKPIGESISYSMTYPTEKLTILSADETPLATALVDVYLPKTGYVSLSSVNETLGNTAGNISNNGSAAMDLDFYVYYVNSADKNSLYRKTLTGRMDTQISLDKAQYINVIGDWIYYSNYNDNGKIYKMKKDGTKKQILCDDTATYITVSGGVVYYANQSDKGRLYKINTDGTIDGGASNRDPAGKVHGMPVMDDYGNYNKATDQANFINVVGDWIYYSNFSDGHKIYTVNKDGNIRRKVNDEWADGIQIVGAWAYYCSGSGAISKVRVDGTGSVIPLRGTTRKVDKGYHLNIVDGWLYYSNAEDGGKLYRIKEDGSGEKKKLADLATDYINIVGDTMYLISGGKTYTLPLNTDGTIKPTLVTKDNNGNTVVDVKDLNITVAYEDANKTIGELEAKYLPQKVAVFMKDDTVQQLPVDWDIKNRKYNGQGIYTYTGTVLGHGKQIKCTLTIPSEMLNATSIIEVYNNGPKNGSIMIKERSFGPSKQDQELKEKLKLAKRVEIGDVIKVYDNPNSEKPLGNIKVDANNANGPLVKSLDLDMYGRSFWITITRKNKAESKPTEVRQLGAAVLSGDVLDEDGEALGVDGRDFTVKGWNNPSIRDDGFISDTTEIAAQGTKSIYVIPGTGKLNMENQGVIPAGITSANYWNGGNARALLTNYDLLTNDSLKNKLKEGNYSIYVVVGYDGKAEEDVNGFGSPLVIGKTASIPKAMKATEEKIPKAPSVTKQYAKSGDTVKISGVTNEDEIYLAPEGASYIAKDITNKPYKSHDNLFFEDQSKSKEEREKEYEKSGKPSIEDGYQCKLVNGKIPQGVRSGKYKVYMVNAIGSSSPASGEIIVDNEDPVVRLDSAKQEDVIKTVTQNGTTTQETTGQKFKVNFAAFDNSFDNSIKEGITVSMARLDSPKSAIKAQEIKDKGNKTFEVIINDPHANLNDYAIYAEDKAGNIGQVNLKVQDPPANINNISLAIRTSNEGVDLVKSRLVGRTKYMTKDLTRASDNYEVTVDGVKYVLQEEALRNLGTSPSIDAFMNALMQAKQWDIANNKPMEDKPKLSSKVSIYKVNDVIYIEGNDNTPIQIEDKTKIDSDTAIVSNMIGLNPNENNTGENSKNQQYVINVTGTAQKNGKLKVCLAGKCFDINMVAGDSRTNIAAKIKEAINNNTILDSYQYPGTNVESNGSEVRLTRKSPGAVVPTFTVEYFNYDN >NC_009495.1|WP_011986368.1|1890769_1892215_+|DEAD/DEAH-box-helicase MNKLTFENYKLSDEILKSLGKLGYKNPSEVQKQVIPLILKDKDIIVKSETGSGKTAAFSIPICEKLELEEKDPQVLVLTPTRELALQIKEEISSIALYKRLRCTAIFGKQPMSLQKRELKQRVHLVVGTPGRTLDHIERENLNLKKIKYFVLDEADEMLNMGFIDQVEAVIKRLPKNRVTMLFSATIPEKVENLCKKYMNNPENININPENITTGTINQCYYEVEDKDKFYLLQKIIYKEVVDNSIIFCNTREKVDEVLKHMKKKGLNAIGLHGGMEQKDRLETMKKFKEGEFQFLVCTDVAARGIHIENISHVINYEMPYEKESYVHRIGRTGRAGKEGVAITFIEPNKVRFLKDIEDYIEKEIPKRKEPSSEEVAKGKKIFEENIKNRIKTKVPKDNKKQKDITKIYISAGRKKKIRPGDIVGAITSIEGINVDNIGIIDIQDNHSYVDILERKGDIVLKASEDMKIKGKKVRIQRAVK >NC_009495.1|WP_011986367.1|1889754_1890591_+|S1-RNA-binding-domain-containing-protein MIKLGEIQKLEIIREAPMGVYLNSKEDKSENDILLPGKQVPKDAKIGDEVEVFVYRDSEDRMIATINRPKITIGEIATLKVIEKTKMGAFLDWGLERDLFLPFKEQTYGIQEGMECLVYLYIDKSDRLCASMNVYRVLSTESPYKEDDEVKGFIYDIKREIGAFVAVDNEYHGLIPKNELYGKFRYGDIVEARVTKVKEDGKLDLSIRKKAYKQMDEDVDTILEKLNSNGGKLYLNDNSDPRAIKELLNMSKNAFKRAVGRLLKEGKIEFIEKGIKLK >NC_009495.1|WP_011986366.1|1888166_1889432_+|DEAD/DEAH-box-helicase MNNSFDTLNLNPKLVQGLKKLNINIPTEIQAEAIPLAMENKDIIGQSETGTGKTLAYLLPIFEKITTEKREMQAIILAPTHELAMQINNEIKNISSNSNMDVKSMAIIGEANIKRQIEKLKEKPHIIVGSPGRILELIKKKKITAHTVKTIVIDEGDKLLDKNNLKVVKEVIKTTLRERQLMLFSATITESTLNIAKDLMKDSVIVKVKEKNTVNENIKHLYITGEHRERIEILRKLIAATNPKRAIVFINRNEEIELTTLKLQYHKIKAYGIYGAAEKEQRKKALEDFRSGKVQILVSSDLSARGLDVKDVTHIFNLDLPENPKEYLHRVGRTGRASKEGIAISIITEKEKALIRKYEKEFNINIEEKKIYKGTLISSKGERSSQPKSKNKSTSAHKDNNKKKRSSSINKSKNNHKKKKY >NC_009495.1|WP_003403172.1|1886904_1887798_-|chemotaxis-protein-CheV METNILLESGTGEVEIIEFLVNNKHYAINVIKVKEVIEVDNVTKVPQSDPAIEGLILCREKIFPLIDLSYILGQKNTSKKKFKTIICEFNRVSVAFKIDEIVAVHRIGWDKILKPDDIAANPLVIGNILLKDKIILLLDFEKIVTDINPSTGISEERIVNVDYKDRSHIKVFLADDSSLIRKLLKDTLTKAGFKKLTIFDDGKQVLDKLLELVEKKGEDFTEDVQILITDIEMPQMDGHTLTRKVKEHPILKRLPVIIFSSLITKDLKHKGTSVGADEQLSKPDIGELVNIIDNYIE >NC_009495.1|WP_011986365.1|1885910_1886765_+|4Fe-4S-binding-protein MKMISKNEIAKLKGEGFLAQKQEGYFSVRILSRAGNFTSKQIIKLAEIADNYGKGYLGVTTRLATEIPWIRYEDIEAVKKEIVSSGMSHGGTGKRVRPLVSCKGTVCVHGLYDTQKLCGELHDKYFGYELPSKFKITLVGCPNNCAKASINDIGIMGQAYVEFDEEKCKVCGICTKSCRQKAVTVENKKIVYKKDLCVNCGKCATVCPFEAMTIKEQGLQVYLGGRFGREYRMGNRLKGLYKEEEIPALVQKIFDVYSEMGNPGERLAKMIERVGFDKVEEAIL >NC_009495.1|WP_012047671.1|1884881_1885340_+|YbaK/EbsC-family-protein MSLEGVKKQFTDENLNLKILEFDESTATVELAAKALGVEPGQIAKTLAFHVKGENMLIVAKGDARIDNKKFKAYFNGKGKMMAPEVVLEVTGHAIGGVCPFGLENPINIYLDQSLKEFEKVYPAAGNANTAVEVTLDELEGITKGLWIDVCK >NC_009495.1|WP_011986363.1|1882962_1884543_-|ABC-F-family-ATP-binding-cassette-domain-containing-protein MITVTNLSLRYGDKKLFEDVNLKFTPGNCYGVIGANGAGKSTFLKILSGEIEANTGDVSIQPGVRMSILKQDHFKYDEFPVLETVIMGNERLYEIMKEKDAIYAKTPFTDEDGIKASELEGEFADLNGWEAEAEASSLLQGLGIGTELHEKNMKDLSGSEKVKVLLAQALFGNPGVLILDEPTNHLDIKSVNWLEEFLINFEGTVIVVSHDRHFLNKVCTHMADVDFGKIKLYVGNYDFWYESSQLALQMAKDQNKKKEEKIKELQEFIARFSANASKSKQATSRKKLLDKIDLDNIQPSSRKYPYIAFKPERKVGNDILRVEGLTKTIDGTKILDNISFIIGKDDKIAFVGDELSITTLFKIISGELEPDSGEYKWGITITNAYFPKDNSEYFNDVDLNLVDWLRQYSEEKSESYLRGFLGRMLFSGEEALKEVKVLSGGEKVRCMLSKMMLNNANVIILDQPTNHLDLESITALNNGLMDYKSNILFTSHDHQFIQTIANRIIEVSEAKFVDKKVTYDEYLESK >NC_009495.1|WP_011986325.1|1880678_1882682_+|methyl-accepting-chemotaxis-protein MKFKTMKGKMLTYFLSLFLIICIAISFMAYFMSKRMIERKASSLMSEVSRQAVQNIEARLNGTLDSIETVANMPTIKDPKLGWDKKKTILDEEIKLHGHVKMGIVGKDGQSIQTDGTTVNIKDRNYFKETMEGKRTISEPIVSKVDGKVVIIYTVPIKNGNTIMGALTAVREGNDISNISNSIKVGESGGAYLIDSTGTVIAHKNKESVIKRENSIKDAQSNEELKPIAAIEKSMIEGKEGIGQYKYKGAEKYISYSPMKSTGWSLAIYAPKNEILKEVSEITRNIIIVSILGIGIALVCIWFISTQISNNLISMRDSLNIVATGDLTTNVDSKIEKEKDEIGHMARALSKTVLSIGNMINSLKGSSFNIDDKANNLAAISEEFTATTENVSTAIQEVATGATNQAQALTEIVSMLNDFSDKINSTVNNIEEIDGMSKEIDEKANVSNKDMKELLNSIENLTKVFENFETKIWTMESNVQKINEITNLINDIAEKTNLLALNAAIEAARAGESGKGFAVVAEEIRKLAEMSRKSSEDIYTIVNGVLEDTKDMVKSSNEVNEKLNGQRSTADEAMNSFMEISKSVTNMIPKIRNINNSANIIEKNKNEILNKSETIASISQEISASAEEISASSEEMSASSEEVANTAQSLNDMTQDMLDEMNKFKTE >NC_009495.1|WP_011986324.1|1880093_1880303_+|cold-shock-domain-containing-protein MSMHTGTVKWFDNERGYGFIAGNNGKDVYVHSMQIKEKTLNKDLHEGEEVLFDIVEKEKGPIAINVQKL >NC_009495.1|WP_011986371.1|1901709_1902639_+|glucosaminidase-domain-containing-protein MKKATGLILKLMILVLLAFTIFIMFNSLILNKKNERFLPENAMNIYIKAADEVSENKLQVNWKYIAALDGVKNKEDFSKANIEDSKVLGEKFLEISKSTKFKNTNYRLLTLDEVISKMSFTEEEKKNVHKYLDKLNNIYPITPDEYKRQFIDELIPISKELYDEYGILPSVTIGQAILESDWGRSELSKKGNNLFGIKATPSWQGKVLNMETSENYNDKIKDNFRYYSSKEDSIKDYANFLVKNKRYRENKVFRATEYKTQAKAIEKAGYSTKKDKDGNLLYSSLLGKIIREYNLQLIDSKTQEEISKK >NC_009495.1|WP_003403076.1|1902764_1903280_-|ferritin MLSEKLLEALNNQINFEFYSSYIYLAMASYAESEDLAGFANFFRVQAQEEIFHAMKFYDYVNQMGGRVILEKIDQPKAEYKNILECFEDGFNHEKIVTSRIYNLTDIATEEKEHATISLLKWFIDEQVEEENNFNTIIRKLRRAESNPAVLYMLDDELSARVFTPPTNTGA >NC_009495.1|WP_011986373.1|1903684_1904539_+|response-regulator MKDTKVVIVDDSPFSISIIKDILEENGLTVVGEAGNLEEVINVVKDKKPDIVTMDMTLPGTDGIECIKAINKINKNVKVIVISSMMDEEIVKKANKNKVCGYIQKPIDPEELIATIEKVVMKEELFLQLENDYFQIFKESFKDALNKFTKTTAEFSEDTKCTISETSRGMVVVIGIIGNFSGRMILDLSQETANSMVNFMLKREPKDMNEVLNVIGEFSNIVAGNACSMLNRKSKVFGLRIAPPSIFYGKSLNISQSLIKSLSVESNTEFGQIYMNVGFKRGES >NC_009495.1|WP_004450459.1|1904538_1905000_+|chemotaxis-protein-CheX MDAKYINPFIDSFYNVLPQLGFSNVTREDVAIKNNVESLGILINLGIVGDIRGNIVYNIQGENGKKIASKMMMGLPVEELNEMAQSALSELSNMLTANASINFSNIGVNVNISTPTLMYGQDIKIKLNTDKILNIKIVADDIPIDVNIAFEKI >NC_009495.1|WP_011986374.1|1905182_1906541_-|YjiH-family-protein METQKNNKYSFSELFKFICPSLIGFILFIIPISYDGEITIPIAVLSKIVLAGLGSILPQLMGIIICITFICTAITKIFKPKAILENKFFNNLFNVSPVWVLARILGFIFIVSTFFKIGPEWMWSKNTGGLLLYDLLPILFSVFIFAGMLLPLLLDFGLLEFVGALLTKVMRPIFNLPGRSSIDCMASWLGDGTIGVLLTSKQYEEGYYSEREAAVIGTTFSAVSITFSLVVISQVKLAHMFVPFYLTVCLSGIIAAILIPRIPPLSRKPDTYLNGGESKNSEALPEGYTPFTWGLEKAVAKAGSNGDPLNFIRQGLQNVLDMLLGVTPVVMAMGTSALILAEYTPLFKWLGLPFIPLLNLLKIPEAALASQTIVVGFADMFLPSVIAATIQSEMTRFIIACLSVTQLIYMSEVGGLLLGSKIPVSLKDLVIIFLERTLVTLPIITLVAHILF >NC_009495.1|WP_003403080.1|1907278_1907482_+|alpha/beta-type-small-acid-soluble-spore-protein MPSNKNSNNLVVPEAQQGLNQLKMEVANEVGIANYDSMDKGNLTSRQNGYVGGNMVKKMVEAYERNL >NC_009495.1|WP_003363259.1|1907542_1907743_+|alpha/beta-type-small-acid-soluble-spore-protein MANRNSNNLVVPEAKHGLNQLKMEVANEVGIANYDAVDKGNLTSRQNGYVGGNMVRKMVEAYERNL >NC_009495.1|WP_011986375.1|1907946_1908276_-|HesB-like-protein MILVNMSDLAYKEFKNFIKENNVNSNIFRIFLAGNGUGGPVFNIVLDEQTSEDLLSPIGELSFLVHKDLFSEFGGFIIKCAEENGKGGFTIDPIIQSENISCSTCSSCS >NC_009495.1|WP_003358892.1|1909193_1910174_+|tyrosine-recombinase-XerC MKYNIQQLYDANFPQRLNDFLNYLRTIKGKSENTIESYKLDLIMFFRFLKLYKGMVPGETEFNDIEIKDISDEDIKNISLTDLFAFVSFVENYRNNGSYAKARKVATLKSFFRFLQGKVKIIKENPALELESPKISKRNPVYLTLDESKRLLSSIDGKFKERDLCIVTMFLNCGLRLSELCGINISNIKNDILTVVGKGNKERTVYLNKACIKTLNDYLNVRKEMGEKIVDKDALFLSKNYTRINKRSVEMLVKKYVKKAGLDGEKYSPHKLRHTAATLMYKHGGVDIRSLQMILGHENISTTQIYTHVDSDRLREAVKSNPLSDE >NC_009495.1|WP_011986376.1|1910496_1910970_-|hypothetical-protein MNRETCIFNYTKKCTDCGECEICDLDQNKKCDNCGECLQREGIDTQAIKIDEIKEDKNFVDKEDLKKVLKEDEKELESLKEFEEDLENEILQETQLLKDYDENFKEQGLYAIENVEGVQIEYIEDVDGLSELMEDESRLKKVAYEEFPGLIKIRENK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_2 | 2302049-2302408 | TypeIII |
III-B
Consensus repeat of NC_009495_2
|
5 spacers
spacers of NC_009495_2
>2.1|2302079|36|NC_009495|CRISPRCasFinder,CRT TTATATGGTATTTAAGGTTATAGATAAATTAACTGG >2.2|2302145|35|NC_009495|CRISPRCasFinder,CRT CTTAAATATATAGGTATAGATCAAGACGCTAAAGA >2.3|2302210|36|NC_009495|CRISPRCasFinder,CRT TCTTAACCTTTAATTACATTATATATTATAAGTTCA >2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT ATTTCATCAAATCCGCATCAATAAATGAGATAAACT >2.5|2302342|37|NC_009495|CRISPRCasFinder,CRT TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA |
CRISPR arrays and Neighbor proteins around NC_009495_2
The CRISPR arrays of NC_009495_2 >merge|NC_009495|2|2302049-2302408|CRISPRCasFinder,CRT GTTTAAATACATCCTATGTTAATGTTCAACTTATATGGTATTTAAGGTTATAGATAAATTAACTGGATTTAAATACACCTCATGTTAATGTTCAACCTTAAATATATAGGTATAGATCAAGACGCTAAAGAATTTAAATACATCTCATGTTAATGTTCAACTCTTAACCTTTAATTACATTATATATTATAAGTTCAATTTAAATACATCTTATGTTACTGTTCAACATTTCATCAAATCCGCATCAATAAATGAGATAAACTATTTAAATACATCTCATGTTAATGTTCAACTAAATTATACCTTAATGCTTATCAATATAGTCTTGTAATTTAAATACATCTCATGTTAATGTTCAAC >NC_009495|2|2|2302049-2302408|CRISPRCasFinder GTTTAAATACATCCTATGTTAATGTTCAAC TTATATGGTATTTAAGGTTATAGATAAATTAACTGG ATTTAAATACACCTCATGTTAATGTTCAAC CTTAAATATATAGGTATAGATCAAGACGCTAAAGA ATTTAAATACATCTCATGTTAATGTTCAAC TCTTAACCTTTAATTACATTATATATTATAAGTTCA ATTTAAATACATCTTATGTTACTGTTCAAC ATTTCATCAAATCCGCATCAATAAATGAGATAAACT ATTTAAATACATCTCATGTTAATGTTCAAC TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA ATTTAAATACATCTCATGTTAATGTTCAAC >NC_009495|2|1|2302049-2302408|CRT GTTTAAATACATCCTATGTTAATGTTCAAC TTATATGGTATTTAAGGTTATAGATAAATTAACTGG ATTTAAATACACCTCATGTTAATGTTCAAC CTTAAATATATAGGTATAGATCAAGACGCTAAAGA ATTTAAATACATCTCATGTTAATGTTCAAC TCTTAACCTTTAATTACATTATATATTATAAGTTCA ATTTAAATACATCTTATGTTACTGTTCAAC ATTTCATCAAATCCGCATCAATAAATGAGATAAACT ATTTAAATACATCTCATGTTAATGTTCAAC TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA ATTTAAATACATCTCATGTTAATGTTCAAC
>NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NC_009495.1|WP_011986657.1|2298932_2299667_-|hypothetical-protein MDKFRNMKKSHIALLVIMYMVLMGSFPRFTGWATIFSAIAVGGYFLKNKKDLKGLTRKNKNFIFAGIIILAIIGSLNVAVGNNIQNEKLMADKAKQEQEIKQEEQKKVEEKKLAEEQKRVQEEEAKKKAAEEKRKQEEEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKGDSNSQSNESQNADDNQNYTVYKTRTGSKYHSSGCRYLKKSCYETTVSQARNEGLTPCSVCNP >NC_009495.1|WP_011986656.1|2298190_2298595_-|membrane-protein MNILMLTCSIAIPVLMILIGILFKCNSYKKIDRTLDLIIPIATFFTGFSERDREHLYKNTNNLASVNRKCSLIWSISGVCTLLLTIISLILNKSDIYNTSVILLEPELLILVIVFISVEYILKRNFNKKISEQY >NC_009495.1|WP_011986655.1|2297239_2297956_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTAPLIKKLSEKGYHLNVTAIFTIDQVKEVVGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDVLKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >NC_009495.1|WP_011986654.1|2296778_2297216_-|PTS-sugar-transporter-subunit-IIA MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDMVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >NC_009495.1|WP_003361919.1|2296465_2296750_-|PTS-sugar-transporter-subunit-IIB MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >NC_009495.1|WP_003358211.1|2295088_2296453_-|PTS-ascorbate-transporter-subunit-IIC MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE >NC_009495.1|WP_011986653.1|2292783_2294877_-|transcription-antiterminator MLNKRCSNILQMIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFVTINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKILKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNGSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTLTEDHKPSLKELLKPDFIKLNEEAENWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISKVKNIKASSEIDSILYS >NC_009495.1|WP_011986652.1|2292104_2292458_-|zinc-ribbon-domain-containing-protein MIIWGWGKVTKKIIGAVFQRTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK >NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_3 | 2309045-2309340 | TypeIII |
III-B
Consensus repeat of NC_009495_3
|
4 spacers
spacers of NC_009495_3
>3.1|2309075|36|NC_009495|CRISPRCasFinder,CRT TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT >3.2|2309141|36|NC_009495|CRISPRCasFinder,CRT ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT >3.3|2309207|38|NC_009495|CRISPRCasFinder,CRT TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA >3.4|2309275|35|NC_009495|CRISPRCasFinder,CRT GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA >3.5|2309077|36|NC_009495|PILER-CR TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT >3.6|2309143|36|NC_009495|PILER-CR ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT >3.7|2309209|38|NC_009495|PILER-CR TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7 |
CRISPR arrays and Neighbor proteins around NC_009495_3
The CRISPR arrays of NC_009495_3 >merge|NC_009495|3|2309045-2309340|CRISPRCasFinder,CRT,PILER-CR GCTTAAGTACATCTCATGTTAATGTTCAACTGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTTATTTAAATACATCTCATGTTAATGTTCAACATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGTATTTAAATACATCTCATGTTAATGTTCAACTTAAGTATGATAATATAAAACCTTGGTAAATATATTAAATTTAAATACATTTCATGTTAATGTTCAACGAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGAATTTAAATACATCTCATGTTAATGTTCAACC >NC_009495|3|3|2309045-2309340|CRISPRCasFinder GCTTAAGTACATCTCATGTTAATGTTCAAC TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT ATTTAAATACATCTCATGTTAATGTTCAAC ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT ATTTAAATACATCTCATGTTAATGTTCAAC TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA ATTTAAATACATTTCATGTTAATGTTCAAC GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA ATTTAAATACATCTCATGTTAATGTTCAACC >NC_009495|3|2|2309045-2309339|CRT GCTTAAGTACATCTCATGTTAATGTTCAAC TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT ATTTAAATACATCTCATGTTAATGTTCAAC ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT ATTTAAATACATCTCATGTTAATGTTCAAC TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA ATTTAAATACATTTCATGTTAATGTTCAAC GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA ATTTAAATACATCTCATGTTAATGTTCAAC >NC_009495|3|1|2309047-2309274|PILER-CR TTAAGTACATCTCATGTTAATGTTCAACTG AACTTATGAAAGAACTAGAGTGTGGAGAACCCTTAT TTAAATACATCTCATGTTAATGTTCAACAT TAGGTTTGCCACCACATTCCGTTACTGCAGTAGTAT TTAAATACATCTCATGTTAATGTTCAACTT AAGTATGATAATATAAAACCTTGGTAAATATATTAAAT TTAAATACATTTCATGTTAATGTTCAAC
>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_6 | 2310339-2310434 | TypeIII |
III-B
Consensus repeat of NC_009495_6
|
1 spacers
spacers of NC_009495_6
>6.1|2310369|36|NC_009495|CRISPRCasFinder AGGTGGAGTATTAGAAGATATGCATCTATATAAAGA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7 |
CRISPR arrays and Neighbor proteins around NC_009495_6
The CRISPR arrays of NC_009495_6 >merge|NC_009495|6|2310339-2310434|CRISPRCasFinder GCTTAAATACATCTCATGTTAATGTTCAACAGGTGGAGTATTAGAAGATATGCATCTATATAAAGAATTTAAATACATCCTATGTTATTGTTCAAT >NC_009495|6|6|2310339-2310434|CRISPRCasFinder GCTTAAATACATCTCATGTTAATGTTCAAC AGGTGGAGTATTAGAAGATATGCATCTATATAAAGA ATTTAAATACATCCTATGTTATTGTTCAAT
>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_4 | 2309620-2309716 | TypeIII |
III-B
Consensus repeat of NC_009495_4
|
1 spacers
spacers of NC_009495_4
>4.1|2309650|36|NC_009495|CRISPRCasFinder ATGTTGTAAATGTTGTGGTATAACAGAATGTAAATA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7 |
CRISPR arrays and Neighbor proteins around NC_009495_4
The CRISPR arrays of NC_009495_4 >merge|NC_009495|4|2309620-2309716|CRISPRCasFinder GCTTAAATACATCTTATGTTATTGTTCAACATGTTGTAAATGTTGTGGTATAACAGAATGTAAATAATTTAAATACATCTCATGTTAATGTTCAACC >NC_009495|4|4|2309620-2309716|CRISPRCasFinder GCTTAAATACATCTTATGTTATTGTTCAAC ATGTTGTAAATGTTGTGGTATAACAGAATGTAAATA ATTTAAATACATCTCATGTTAATGTTCAACC
>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_5 | 2309834-2310065 | TypeIII |
III-B
Consensus repeat of NC_009495_5
|
3 spacers
spacers of NC_009495_5
>5.1|2309864|37|NC_009495|CRISPRCasFinder TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTAT >5.2|2309931|36|NC_009495|CRISPRCasFinder AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAA >5.3|2309997|38|NC_009495|CRISPRCasFinder ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAAT |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7 |
CRISPR arrays and Neighbor proteins around NC_009495_5
The CRISPR arrays of NC_009495_5 >merge|NC_009495|5|2309834-2310065|CRISPRCasFinder GCTTAAATACATATCATGTTAAGGTTCAACTGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTATATTTAAATACATTCTATATTACTGTTCAACAAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAAATTTAAATACATCTTATGTTACTGTTCAACACGAATAGGGGGTGATAAATATTGTTATTTGGACAAATATTTAAATACATCCTATGTTACTGTTCAACC >NC_009495|5|5|2309834-2310065|CRISPRCasFinder GCTTAAATACATATCATGTTAAGGTTCAAC TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTAT ATTTAAATACATTCTATATTACTGTTCAAC AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAA ATTTAAATACATCTTATGTTACTGTTCAAC ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAAT ATTTAAATACATCCTATGTTACTGTTCAACC
>NC_009495.1|WP_011986665.1|2308304_2308826_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NC_009495.1|WP_011986664.1|2307113_2308004_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_009495.1|WP_011986663.1|2306366_2307107_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NC_009495.1|WP_011986662.1|2304857_2306264_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_009495.1|WP_021134338.1|2304610_2304784_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NC_009495.1|WP_079995891.1|2304164_2304527_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NC_009495.1|WP_011986661.1|2303235_2303850_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NC_009495.1|WP_012047734.1|2302698_2303193_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NC_009495.1|WP_011986659.1|2301427_2301916_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NC_009495.1|WP_011986658.1|2300006_2300600_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NC_009495.1|WP_011986666.1|2310724_2312722_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_009495.1|WP_011986667.1|2312818_2313616_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_009495.1|WP_011986668.1|2313663_2313957_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_7 | 2323921-2324079 | TypeIII |
III-B
Consensus repeat of NC_009495_7
|
2 spacers
spacers of NC_009495_7
>7.1|2323951|35|NC_009495|CRISPRCasFinder GGTTACTGGCTTTCTAATACATATAATTAAATTAG >7.2|2324016|33|NC_009495|CRISPRCasFinder CTATATAAAAGCCATTGGGAATTTTGTTTATAC |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around NC_009495_7
The CRISPR arrays of NC_009495_7 >merge|NC_009495|7|2323921-2324079|CRISPRCasFinder ATTTAAATACATCTCATGTTAATGTTCAACGGTTACTGGCTTTCTAATACATATAATTAAATTAGATTTAAATACATCTCATGTTAATGTTCAACCTATATAAAAGCCATTGGGAATTTTGTTTATACATTTAAATACATCTCATGTTAATGTTCAACC >NC_009495|7|7|2323921-2324079|CRISPRCasFinder ATTTAAATACATCTCATGTTAATGTTCAAC GGTTACTGGCTTTCTAATACATATAATTAAATTAG ATTTAAATACATCTCATGTTAATGTTCAAC CTATATAAAAGCCATTGGGAATTTTGTTTATAC ATTTAAATACATCTCATGTTAATGTTCAACC
>NC_009495.1|WP_011986678.1|2322994_2323684_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >NC_009495.1|WP_011986677.1|2322600_2322975_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >NC_009495.1|WP_011986676.1|2320845_2322549_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NC_009495.1|WP_011986669.1|2314148_2314487_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NC_009495.1|WP_162266011.1|2324488_2324650_+|hypothetical-protein MLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >NC_009495.1|WP_011986679.1|2325422_2327078_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >NC_009495.1|WP_012047738.1|2327854_2328703_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NC_009495.1|WP_011986681.1|2328993_2329914_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NC_009495.1|WP_011986682.1|2330237_2331731_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NC_009495.1|WP_011986683.1|2332655_2333111_+|staygreen-family-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >NC_009495.1|WP_011986684.1|2333190_2333658_-|helix-turn-helix-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >NC_009495.1|WP_012047739.1|2333825_2334857_-|alpha/beta-hydrolase MKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NC_009495.1|WP_011986686.1|2335122_2336475_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >NC_009495.1|WP_011986687.1|2336683_2338027_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_8 | 2324983-2325212 | TypeIII |
III-B
Consensus repeat of NC_009495_8
|
3 spacers
spacers of NC_009495_8
>8.1|2325013|36|NC_009495|CRISPRCasFinder AATAGAGTATTCAGATGAATATAAATTCTTGGAAGA >8.2|2325079|37|NC_009495|CRISPRCasFinder TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAA >8.3|2325146|36|NC_009495|CRISPRCasFinder CGACCCTATAACAGTTTCAGAAGTAGAACAAAATAT >8.4|2325013|37|NC_009495|CRT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGAA >8.5|2325079|38|NC_009495|CRT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAG >8.6|2325146|37|NC_009495|CRT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATATG >8.7|2325081|36|NC_009495|PILER-CR AGAGGTGATTTTATATGAAAAAGGAAAACATAACAA >8.8|2325148|35|NC_009495|PILER-CR GACCCTATAACAGTTTCAGAAGTAGAACAAAATAT |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around NC_009495_8
The CRISPR arrays of NC_009495_8 >merge|NC_009495|8|2324983-2325212|CRISPRCasFinder,CRT,PILER-CR TTTTCAATACATTTAATGTTAATGTTCAATAATAGAGTATTCAGATGAATATAAATTCTTGGAAGAATTTAAATACATCTCATGTTAATGTTCAATTAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAGTTTAAATACATCTCATGTTAATGTTCAATCGACCCTATAACAGTTTCAGAAGTAGAACAAAATATGTTTAAATACATCTCATGTTAATGTTCAATC >NC_009495|8|8|2324983-2325211|CRISPRCasFinder TTTTCAATACATTTAATGTTAATGTTCAAT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGA ATTTAAATACATCTCATGTTAATGTTCAAT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAA GTTTAAATACATCTCATGTTAATGTTCAAT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATAT GTTTAAATACATCTCATGTTAATGTTCAAT >NC_009495|8|3|2324984-2325211|CRT TTTCAATACATTTAATGTTAATGTTCAAT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGAA TTTAAATACATCTCATGTTAATGTTCAAT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAG TTTAAATACATCTCATGTTAATGTTCAAT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATATG TTTAAATACATCTCATGTTAATGTTCAAT >NC_009495|8|2|2325050-2325212|PILER-CR TTTAAATACATCTCATGTTAATGTTCAATTA GAGGTGATTTTATATGAAAAAGGAAAACATAACAAG TTTAAATACATCTCATGTTAATGTTCAATCG ACCCTATAACAGTTTCAGAAGTAGAACAAAATATG TTTAAATACATCTCATGTTAATGTTCAATC
>NC_009495.1|WP_162266011.1|2324488_2324650_+|hypothetical-protein MLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >NC_009495.1|WP_011986678.1|2322994_2323684_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >NC_009495.1|WP_011986677.1|2322600_2322975_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >NC_009495.1|WP_011986676.1|2320845_2322549_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NC_009495.1|WP_011986670.1|2314498_2315392_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NC_009495.1|WP_011986679.1|2325422_2327078_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >NC_009495.1|WP_012047738.1|2327854_2328703_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NC_009495.1|WP_011986681.1|2328993_2329914_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NC_009495.1|WP_011986682.1|2330237_2331731_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NC_009495.1|WP_011986683.1|2332655_2333111_+|staygreen-family-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >NC_009495.1|WP_011986684.1|2333190_2333658_-|helix-turn-helix-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >NC_009495.1|WP_012047739.1|2333825_2334857_-|alpha/beta-hydrolase MKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NC_009495.1|WP_011986686.1|2335122_2336475_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >NC_009495.1|WP_011986687.1|2336683_2338027_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV >NC_009495.1|WP_012047740.1|2338462_2339362_+|hypothetical-protein MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_9 | 2327430-2327590 | TypeIII |
III-B
Consensus repeat of NC_009495_9
|
2 spacers
spacers of NC_009495_9
>9.1|2327460|36|NC_009495|CRISPRCasFinder ACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATA >9.2|2327526|35|NC_009495|CRISPRCasFinder TTTAATATTTTTTCTATATCCATAGGCTTAAAATC |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11 |
CRISPR arrays and Neighbor proteins around NC_009495_9
The CRISPR arrays of NC_009495_9 >merge|NC_009495|9|2327430-2327590|CRISPRCasFinder GCTTAAATACATCTTATGTTACTGTTCAACACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATAATTTAAATACATCCTATGTTAATGTTCAACTTTAATATTTTTTCTATATCCATAGGCTTAAAATCATTTAAATACATCCTATGTTAATGTTCAAC >NC_009495|9|9|2327430-2327590|CRISPRCasFinder GCTTAAATACATCTTATGTTACTGTTCAAC ACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATA ATTTAAATACATCCTATGTTAATGTTCAAC TTTAATATTTTTTCTATATCCATAGGCTTAAAATC ATTTAAATACATCCTATGTTAATGTTCAAC
>NC_009495.1|WP_011986679.1|2325422_2327078_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >NC_009495.1|WP_162266011.1|2324488_2324650_+|hypothetical-protein MLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >NC_009495.1|WP_011986678.1|2322994_2323684_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >NC_009495.1|WP_011986677.1|2322600_2322975_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >NC_009495.1|WP_011986676.1|2320845_2322549_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >NC_009495.1|WP_011986675.1|2319645_2320833_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >NC_009495.1|WP_011986674.1|2317932_2319645_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NC_009495.1|WP_011986673.1|2316716_2317916_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NC_009495.1|WP_011986672.1|2315865_2316705_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NC_009495.1|WP_011986671.1|2315403_2315838_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NC_009495.1|WP_012047738.1|2327854_2328703_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NC_009495.1|WP_011986681.1|2328993_2329914_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NC_009495.1|WP_011986682.1|2330237_2331731_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NC_009495.1|WP_011986683.1|2332655_2333111_+|staygreen-family-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >NC_009495.1|WP_011986684.1|2333190_2333658_-|helix-turn-helix-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >NC_009495.1|WP_012047739.1|2333825_2334857_-|alpha/beta-hydrolase MKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NC_009495.1|WP_011986686.1|2335122_2336475_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >NC_009495.1|WP_011986687.1|2336683_2338027_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV >NC_009495.1|WP_012047740.1|2338462_2339362_+|hypothetical-protein MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR >NC_009495.1|WP_011986689.1|2339702_2341022_+|APC-family-permease MLEKKYGLWTTVSMVIGIVIGSGVFFKADNILMASGGNVKTALLAWLVGAISMIFGALVFAECANRFERSNGIVDYAEGMLSEKFAYLIGWFNGIIYYPAIAAVLAWAAGNYTAILFNKDGNFVWIMAAIYMIGIYILNYISPILSGKFQIASTAIKLVPLMLIAILGTFQGLNNGILIENFSKVSTIGDSGSGFAAAVLGAAFAYEGWIIATTINGEIKDAKNTLPKALVFGSLVIVIIYILYFLGIVGMIPTETILKQGDNTVNVAARTVFGNFGASILTTFIIVSCLGTLNGLILGGSRSFYSLAIRGQGIKPEAFSKLDSKTNIPTNSTIANFILICIYLVVWYMNFKGLFPNKMFVDISELPIALIYGIYIIIYIAYMMKMKDLSFIKRFVIPSLALMGALIVVYGGLSKPSVIIDLGISVFVFLSGLLFYNKK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_009495_10 | 3774243-3774350 | Unclear |
NA
Consensus repeat of NC_009495_10
|
1 spacers
spacers of NC_009495_10
>10.1|3774270|54|NC_009495|CRISPRCasFinder ATGAACCGAATGCTCTAGCCAGCTGAGCTATTCCGCCACAATGGTTGCGGGGGC |
CRISPR arrays and Neighbor proteins around NC_009495_10
The CRISPR arrays of NC_009495_10 >merge|NC_009495|10|3774243-3774350|CRISPRCasFinder AGGACTTGAACCTACGACACTTCGGGTATGAACCGAATGCTCTAGCCAGCTGAGCTATTCCGCCACAATGGTTGCGGGGGCAGGACTTGAACCTACGACCTTCGGGTT >NC_009495|10|10|3774243-3774350|CRISPRCasFinder AGGACTTGAACCTACGACACTTCGGGT ATGAACCGAATGCTCTAGCCAGCTGAGCTATTCCGCCACAATGGTTGCGGGGGC AGGACTTGAACCTACGACCTTCGGGTT
>NC_009495.1|WP_012048377.1|3771514_3773902_-|stage-II-sporulation-protein-E MQYGAELLPYQRLKKIDKQKYKKSINFSSIVNMIIFFISSFLVSRVIFINNMAPFGIAFLLSISRQKEYNKYLFISAVGSIVGYISLINNIGYISLNMLEVVTITLLSYVFKNVEDKKNTIIICMIIYLEIFTYKIFVTKISTTMAMLGATFEIGCIFPIYYIINYSILCFKNMNTSHLYSNEEIVSMAITLSLVVSGTWGANIAGINLMNLISITMILIIGYVKGSTSASAIGVAMGAISGLSSNNMMIYISIYGLCGLISGVFKETGKLMTGISYLVSFLILKFYSNINYDFKIIEVLISLTLFYIIPNKIYMKMEYELDYQKKQKNLQENYMDKIKGIITDKLGNFSDVLYNMGNILEKLVDNEKLAMKNKSGALIENLADRVCSSCNMNHICWKREGYYTYNALGELIQNYQENKKELPYEIERKCVKRTQLINNTEDIANNYIINEMWKKRLSECREVLANQINTMAYSVEEITKEFGQSIRFSNLTEKDIRRMLNKNNIKYKDIFCYNNENGRLIINLKIDACTGKQKCVKEILPLINKVTGKLMCVANESCNLDLKNNDCNIIFEETPKYHVASYVNKMAKDGEQCNGDSYSFGKLQSGSYMTIISDGMGSGPQAVQESSAVVELIERFAQSGFSKITAINTINSIMSIKFSQDEKFSTVDLSNIDLYEGKIDFMKVGAVASFIKRGTEVYTIRSKTLPIGVLDKVDIDIETRDLKNGDIIVMVSDGVLDYESSSAGKVEWVVEFLKNTTLNNPKEISEELIENAKKLSKGKVKDDMTAIVQKVYSLY >NC_009495.1|WP_012048376.1|3769959_3771366_-|tRNA-lysidine(34)-synthetase-TilS MKDVVINTIKKYNMIEANDKIIVGVSGGPDSMCLLHMLCLLKNQLRIKDIYVAHINHGVRGAESDADEKYVENFCYTNNLGFFSKTINMDKIAKEKGISSESAGREARYDFFNYLRKELGAQKIATAHNANDQAETVLMRIMRGTGLQGLIGINPIRDDLYIRPLINVLREDIENYCDKYELNPRIDKTNLQSIYTRNRIRLELIPYIKDNFNEDIVNTLCRFSNIVSKDNNYLEEVSKDKFERYCTKKLQRVIIDKRAFLEHESISTRILREAILYINQNLYNLEMRNIYDVLELSLNTTGKFVNLPSNIKAENIYGDIHLYKEDNFIKKVNNVQCELKIGFNQVEDLNINLKIYSIKDHNYNINDNKYIQYFDYDKVSNEKIYLRNRKNGDKFTPLGMKGSKKLKDFFIDSKIPREQRDKLKLVCFGEEIAWIIGCRTGNNFKIDKNTKNVLEITVERGEANGFDK >NC_009495.1|WP_003359412.1|3769430_3769976_-|hypoxanthine-phosphoribosyltransferase MDLISRDIEKILISEEQIQSKINELGDQISKDYDGKNLMLVGILKGSVPFMADLLKRITIPCTMDFMAVSSYGNSTTSSGVVRILKDLDFEIEGKDILIVEDIIDSGITLKYLLENLRARKPASINIACLLNKEERRKAEIDVHYLGFNVPDYFLVGYGLDFAEKYRNLPYIGILKEEVYK >NC_009495.1|WP_003359327.1|3767543_3769349_-|ATP-dependent-zinc-metalloprotease-FtsH MKKFSSATAWIVVLILVIFSSLMLVRTGTNSTAINFSEFQKSWIQNEIKSFQVKDDKMTVVGTLKDGKQYETIVPSERLFQFINEHPKNGEVKEVYVKPASVPIWVQYLPMILIVLMLLGFWFMFMQQAQGGGGNRNVMNFGKSKAKMATPDKKKVTFDDVAGADEEKEELAEIVDFLKSPKRYIDMGARIPKGVLLVGPPGTGKTLLAKAIAGEAGVPFFSISGSDFVEMFVGVGASRVRDLFEQAKKNSPCIIFIDEIDAVGRQRGAGLGGGHDEREQTLNQLLVEMDGFGANEGIIMIAATNRPDILDPALLRPGRFDRQIVVGAPDVKGREAILKVHSKNKHLAEEISLGILAKRTPGFTGADLENLMNESALLAVRKRKELIDMEDLEEAVTRVIAGPEKKSRVIDEEDRKLTAYHEAGHAVVMKLLPHADPVHQISIVPRGMAGGYTMHLPEKDSSYMSKSKLEDEIVGLLGGRVAEKLIIGDISTGAKNDIDRATTIARKMVMDYGMSNTLGPIAFGSGHDEVFLGRDLGKGRNFSEDVAYKIDQEIKKLIDTGYNEAERLLNENISKLHAVAQELLKKEKLEADEFEEIFKNS >NC_009495.1|WP_012048375.1|3765667_3767341_-|formate--tetrahydrofolate-ligase MFKSDIEIAQESKMKNIKNIAEKIGLTEEDIDLYGKYKCKISLDVLKRNKDKKDGKLILVTAINPTPAGEGKSTVTVGLGQALWKKNKKAVIALREPSLGPVFGIKGGAAGGGYSQVVPMEDINLHFTGDMHAITSANNLLAAAIDNHIHQGNILKIDQRRILFKRVMDMNDRALRNVIVALGGKINGFPREDGFMITVASEIMAILCLAEDLMDLKNKMGEILVAYSTEGKPIYCEDLEVQGAMALLMKDAIKPNLVQTLENTPAIIHGGPFANIAHGCNSILGTKMALKLGDYVITEAGFGADLGAEKFFDIKCRKANLKPNCVVIVATVRALKYNGGIPKENLKEQNMEALSKGIKNLGKHIENVNKFGVPAVVAINKFISDTEEEIEFIKKYCKELGAEVSIAEVWEKGGNGGLELADKVLDTIENKESKFNPIYEETLSIKQKIETIAEEIYGAEGVDYSKEAEKQISEIEKLDLDKKPVCMAKTQYSLSDDAKLLGRPCGFRINVKEVRISNGAGFIVVLTGNVMTMPGLPKKPAANNMNVLSDGNIVGLF >NC_009495.1|WP_003359441.1|3764736_3765513_-|type-III-pantothenate-kinase MILVLDVGNTNIVLGIYKNKELIANWRLATDNKRTADEYGIQVIELFSHNNLSFSDIEGVIISSVVPNIMYSLEHMISKYFNIKPIIVGPGVKTGINIKYDNPKEVGADRIVNAVAAHEIYKKPLIIIDFGTATTFCAVTKEANYLGGTICPGIKISSDALFDKAAKLPRVELVKTPGVICKNTVASIQSGIIYGYAGQVDYIVSKMKKEMMDLGEEEPFVVATGGFAKLISEESKSIDEINAILTLEGLRVIYEKNK >NC_009495.1|WP_012048374.1|3763755_3764727_-|tRNA-dihydrouridine-synthase-DusB MNIGNLIFHNNVFLAPMAGFTDIAFREICKELGCGLVYTEMVSAKALYYESNNTKELCVISNKEKPVALQLFGHEPEIMANAVEFFNNNDDVCILDVNMGCPAPKIVKNGDGSALMKDPKLASEIIKAMKKVAKKPITVKFRKGFDKNNINAVEFAKIMEQSGVDAITIHGRTREQMYEGKADWAIISKVKNSVSIPVIGNGDVFSSEDALEMINKTYCDGIMIGRGAQGNPWIFKQINEKIKGEHVYYPTPQERIDICINHYKKSLEYFEEHKAVREMRKHVAVYVKGLKNCTDIKDKVNMEKDPDKVLEELIKYRETLREF >NC_009495.1|WP_012048373.1|3762878_3763706_-|hypothetical-protein MKPIIDISSNIIKDYNKNNFIFKIKDEFLTHFRGNCFIEELNLVISKVRISPNFNEKAYHKNIKRSIKYSRHKDFVLAPKTFRFLDYYLLNSFQKELFALSVCESIKTVLRLKGKTIRNSCIVIFDAKEEYVFNIINCVSKEAKYIILVSEDLNKLANLNDYIIANYGITPIITKDTKASFSKADFIITTKDVEIMKDIPVWYINNSKIYKNKGNCNINNIIYKVPWKTNLNFNPELLGAILCQMDKKNVEEAIRYNGIVLDKIMFNKDIVKIIR >NC_009495.1|WP_012048372.1|3762265_3762748_-|transcription-elongation-factor-GreA MSEAKKYVMTYEGVKKLEEELEFLKTVKRKEITEKIKVALSFGDLSENSEYDEAKNEQAFVEGRIIQLENMLKNASIVDENEVPKDVVSVGSIVKVKDYEFDEEVEYIIVGSAEADPMNNKISNESPVGHGLIGKKAGDIIEVAVPDGVSKYEILEVNRA >NC_009495.1|WP_012048371.1|3760732_3762247_-|lysine--tRNA-ligase MSKEDNVMNSFEEQANELMKERFQKLKELQSNGKDPFDVYKVERTHTSKEVKENYEDLEGKTVTVAGRLMSKRVHGKAGFSDIHDRYGKIQLYIKINDVGEEKLKEYKTFDIGDIISVTGTVFKTKTGETSIHITDFQLVCKSLRPLPEKWHGLKDPDLRYRQRYVDLIINQDVRDTFMKRTAIIKTMREYLDNKGFLEVETPILSPIAGGAAAKPFITHHNALNIDMYLRIATELYLKRLIVGGFEKVYEIGRNFRNEGMDIRHNPEFTVIELYEAYADYNDMMEITENMIAYICEKVLGTTKVQYEGTEIDFTPPWRRLTMVDAVREYAGVDFNTIKDDIEARTIAKEKHIEFKKELKDCTKGDVLIGLFEEFCEDKLMQPTFICDYPVENSPLTKKKRGNEAFTERFEGFVFGREVCNAYSELNDSIVQKERFMQQLKERELGDDEAYMMDDDFITSLEVGMPPTGGLGIGIDRLIMFLTDTHSIRDVILFPTMKPQPNNQ >NC_009495.1|WP_003359471.1|3774620_3775025_-|RNA-binding-protein-S1 MTLNAGSILEGTVVNITNFGAFVEIEGKTGLVHISEVSDSYVKDIREYLKEQDKVKVKVISIDDKGKISLSIKQAMQQKKSCKPAEIDWSREKPKKNEANFEDRLSKFLKDSEERFQDLKKHQDSRGRGSKKSY >NC_009495.1|WP_003359350.1|3775086_3775356_-|septum-formation-initiator-family-protein MKKINVKKLIFFLAIVYSTVIFINQQITMHKIRDQISEKKIELKEVKEKNQKLQDEVKLSKSKDYIEKLARERLRLIKKGETPVINNTQ >NC_009495.1|WP_003359440.1|3775450_3775849_-|spore-cortex-biosynthesis-protein-YabQ MVISISKQLGLLIFSFLSGLITGVFFDIYRSIRMDKNLSPIIKIIEDILFWCLAAIVIFIFLLYNDCAFIGVYVYLWIAIGLYIYIFFISKYLNPIFIYVVQNINKFFRISINIIVYPFKILIYKIKSNKMH >NC_009495.1|WP_003361720.1|3775863_3776154_-|sporulation-protein-YabP MEKKEFKNDDKISNLNLESRKKLILSGINEVISFNEEEIMLKTTLGDLDIKGSNLKMNKLDVQNGDVVIVGTINSCTYLNNESKANRSNIFSKLFK >NC_009495.1|WP_012048379.1|3776273_3776513_-|RNA-binding-S4-domain-containing-protein MRLDKFLKVSRIIKRRTVAKEACENERVFVNSKIAKPGTEVKEGDILEIQYANKTMKYEIISVLEHVKKEDAENMYKII >NC_009495.1|WP_003359333.1|3776586_3776865_-|HU-family-DNA-binding-protein MNKSELITSMAEKSKLTKKDAETALKAFIESVEEALEGGEKVQLVGFGTFETRERAERVGRNPRTKEEITIPASIAPVFKAGKELKEKVNKK >NC_009495.1|WP_012099544.1|3776992_3778438_-|nucleoside-triphosphate-pyrophosphohydrolase MINIIGLGPGSKESITLGTIDSLKTVDKVFLRTEKHPTVEYINKLGITYETFDGEYEVGESFDDVYNSIAKSLIEASKNYSDIIYAVPGHPLVAEKSVDILIKLCRQNDIKFKILPAVSFVDALMESLLLDPVEGLKIIDAFDIKKQAMDKRIGTIITQVYDKFIASEVKLNLMNYYKDDTEIFFVRAAGIEGLEEIRKIPLYELDRQHNIDHLTSVYIPKVPNNNYDFMDLLDIMDKLRGEDGCPWDREQTHVSLKKYLIEESYEVIEAIDNKDVDMLIEELGDVLLQVVFHSQIGKEDGFFEIKDVIQSICDKMINRHPHVFGDLEINNSIEVLENWDKIKSKEQGTETYTDSIRHIAKTLPALMRADKVQKKASKVGFDWDNIEDAMKKIIEEYKEIEDVYKSKNKVKILEEIGDLLFSVVNVARFLDIDPENALNYSIDKFINRFQYIEDEAISMGRQLDNMSLEEMDKLWKEAKNK >NC_009495.1|WP_012048381.1|3778452_3779988_-|polysaccharide-biosynthesis-protein MKKQSLIKGTFILGVAGIIAKFLGLFFRWPLQMLIGDEGIGYYQMSYPLYMFFIAAASGIPVAVSKLVSERNAVRDEGGIISVLKEAMIFMFIMGMGFTIILLLFSKDIIRFLKWDTRSYYSLIGISLAPLFISIMSVFRGFFQGMQNMNYTAISQLIEQLGRVIFGVGLAYILLPKGIEYSAGGAAIGAAAGGLLGGIYLFLKYLGVKKEFRVKKVKRNFKIMNTILYTAIPISIGSAVGTIMSLIDSALVPQKLLEAGFTYKQSTILYGQLTGKAFTLVNVPLTLSVSLCAALVPIIAEDYILNRKMAVLKKVELAIKISMVIAVPSCLGLNFMAKPILNLIFPGQEAGYEILKHLALSIPFIVLCQTSTAILQGIGRYIRPIINLCIGCILKIVITLILVPMNNINIYGAVIGTIAGYVISAILNMMSLKRSLNISINYYEIMIKPLIASTIMIIAVVFIYFYAYNYTISSKIACLIAVFLGMIIYFIIIGLIGILDYNYIKRKIIKR >NC_009495.1|WP_003359411.1|3780120_3780672_-|stage-V-sporulation-protein-T MKATGIVRRIDDLGRVVIPKEIRRTLRIREGDPLEIFTDREGGVILKKYSPIGDLSEFSKGYTDSLQQTIGNIIMICDKDTIISISGAPKKEYLEKKISYDLEKIIEERKTVYFGDDNKAVSIYDDEDVDEKYSAQVISPIIAEGDTVGAVIIVSKEGGKKFNELEMKLAETASSFLGKQMEE >NC_009495.1|WP_012048382.1|3780870_3781881_-|peptidylprolyl-isomerase MKSAKKLLSVLCLGIFILTFTACDMVEKTPEAKAKSTIAKVNGEKIQRKDLDESPSMQQVLSQIKTQYGEEFEKSEQGKEVIKEQKKQILENLITEKVLLQKGKELKVIPKDEELNKEADKKVNEIKAVYNNDEKKFEETLKSTGFTKETLKEYLRDQIVIEKVINEVTKDVKVEDKDAQKYYNENQSMFTEKPNTMNVSHILVKTEDEAKKVKKRLDAKEDFAKVAKEVSQDPGSKDKGGLLGDISYSDSNYDPTFMKAAIALKEGTISNPVHTQWGYHIIKVNSKKEYPVKKFDSVKEDIKKQLKQEKQQEAYTKKIEEWKKASKIKTYEKNLL |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
NC_009495_2 | 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT | 2302276-2302311 | 36 | NC_012654 | Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence | 174503-174538 | 0 | 1.0 |
NC_009495_2 | 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT | 2302276-2302311 | 36 | NZ_CP006909 | Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence | 62802-62837 | 0 | 1.0 |
NC_009495_2 | 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT | 2302276-2302311 | 36 | NZ_CP031095 | Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence | 207645-207680 | 0 | 1.0 |
NC_009495_4 | 4.1|2309650|36|NC_009495|CRISPRCasFinder | 2309650-2309685 | 36 | NZ_CP014152 | Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence | 149447-149482 | 0 | 1.0 |
NC_009495_4 | 4.1|2309650|36|NC_009495|CRISPRCasFinder | 2309650-2309685 | 36 | NZ_CP013684 | Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence | 128281-128316 | 0 | 1.0 |
NC_009495_4 | 4.1|2309650|36|NC_009495|CRISPRCasFinder | 2309650-2309685 | 36 | NZ_CP013710 | Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence | 129903-129938 | 0 | 1.0 |
NC_009495_4 | 4.1|2309650|36|NC_009495|CRISPRCasFinder | 2309650-2309685 | 36 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 80344-80379 | 0 | 1.0 |
NC_009495_4 | 4.1|2309650|36|NC_009495|CRISPRCasFinder | 2309650-2309685 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 37712-37747 | 0 | 1.0 |
NC_009495_2 | 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT | 2302276-2302311 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 219276-219311 | 1 | 0.972 |
NC_009495_4 | 4.1|2309650|36|NC_009495|CRISPRCasFinder | 2309650-2309685 | 36 | NZ_CP013700 | Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence | 47769-47804 | 2 | 0.944 |
NC_009495_8 | 8.1|2325013|36|NC_009495|CRISPRCasFinder | 2325013-2325048 | 36 | GU949551 | Clostridium phage phiCD6356, complete genome | 4906-4941 | 2 | 0.944 |
NC_009495_2 | 2.2|2302145|35|NC_009495|CRISPRCasFinder,CRT | 2302145-2302179 | 35 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 30926-30960 | 3 | 0.914 |
NC_009495_2 | 2.2|2302145|35|NC_009495|CRISPRCasFinder,CRT | 2302145-2302179 | 35 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 163878-163912 | 3 | 0.914 |
NC_009495_8 | 8.4|2325013|37|NC_009495|CRT | 2325013-2325049 | 37 | GU949551 | Clostridium phage phiCD6356, complete genome | 4906-4942 | 3 | 0.919 |
NC_009495_8 | 8.8|2325148|35|NC_009495|PILER-CR | 2325148-2325182 | 35 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17536-17570 | 4 | 0.886 |
NC_009495_8 | 8.3|2325146|36|NC_009495|CRISPRCasFinder | 2325146-2325181 | 36 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17535-17570 | 5 | 0.861 |
NC_009495_8 | 8.6|2325146|37|NC_009495|CRT | 2325146-2325182 | 37 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17535-17571 | 6 | 0.838 |
NC_009495_8 | 8.8|2325148|35|NC_009495|PILER-CR | 2325148-2325182 | 35 | MN693403 | Marine virus AFVG_25M412, complete genome | 14464-14498 | 6 | 0.829 |
NC_009495_9 | 9.2|2327526|35|NC_009495|CRISPRCasFinder | 2327526-2327560 | 35 | MN694042 | Marine virus AFVG_250M538, complete genome | 50649-50683 | 7 | 0.8 |
NC_009495_2 | 2.3|2302210|36|NC_009495|CRISPRCasFinder,CRT | 2302210-2302245 | 36 | MT795651 | Vibrio phage vB_VnaS-AQKL99, complete genome | 5039-5074 | 8 | 0.778 |
NC_009495_9 | 9.2|2327526|35|NC_009495|CRISPRCasFinder | 2327526-2327560 | 35 | NZ_CP054613 | Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence | 1277029-1277063 | 8 | 0.771 |
NC_009495_8 | 8.3|2325146|36|NC_009495|CRISPRCasFinder | 2325146-2325181 | 36 | MN693403 | Marine virus AFVG_25M412, complete genome | 14464-14499 | 10 | 0.722 |
NC_009495_1 | 1.2|1897951|40|NC_009495|CRISPRCasFinder | 1897951-1897990 | 40 | NC_018689 | Bacillus thuringiensis MC28 plasmid pMC429, complete sequence | 417214-417253 | 11 | 0.725 |
NC_009495_8 | 8.6|2325146|37|NC_009495|CRT | 2325146-2325182 | 37 | MN693403 | Marine virus AFVG_25M412, complete genome | 14463-14499 | 11 | 0.703 |
1. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
2. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
3. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
4. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
5. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
6. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
7. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
8. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
9. spacer 2.4|2302276|36|NC_009495|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 1, identity: 0.972
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagattaact Protospacer ******************************* ****
10. spacer 4.1|2309650|36|NC_009495|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 2, identity: 0.944
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaagtgttgtagtataacagaatgtaaata Protospacer *********.******.*******************
11. spacer 8.1|2325013|36|NC_009495|CRISPRCasFinder matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 2, identity: 0.944
aatagagtattcagatgaatataaattcttggaaga CRISPR spacer aatagagtattcagatgaatataagttcttagaaga Protospacer ************************.*****.*****
12. spacer 2.2|2302145|35|NC_009495|CRISPRCasFinder,CRT matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.914
cttaaatatataggtatagatcaagacgctaaaga CRISPR spacer ttgaaatatataggcatagatcaagacgctaaaga Protospacer .* ***********.********************
13. spacer 2.2|2302145|35|NC_009495|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 3, identity: 0.914
cttaaatatataggtatagatcaagacgctaaaga CRISPR spacer ttgaaatatataggcatagatcaagacgctaaaga Protospacer .* ***********.********************
14. spacer 8.4|2325013|37|NC_009495|CRT matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 3, identity: 0.919
aatagagtattcagatgaatataaattcttggaagaa CRISPR spacer aatagagtattcagatgaatataagttcttagaagat Protospacer ************************.*****.*****
15. spacer 8.8|2325148|35|NC_009495|PILER-CR matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 4, identity: 0.886
gaccctataacagtttcagaagtagaacaaaatat CRISPR spacer aaatctataacagtttcagaagtagaaaaaaatat Protospacer .* .*********************** *******
16. spacer 8.3|2325146|36|NC_009495|CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 5, identity: 0.861
cgaccctataacagtttcagaagtagaacaaaatat CRISPR spacer taaatctataacagtttcagaagtagaaaaaaatat Protospacer ..* .*********************** *******
17. spacer 8.6|2325146|37|NC_009495|CRT matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 6, identity: 0.838
cgaccctataacagtttcagaagtagaacaaaatatg CRISPR spacer taaatctataacagtttcagaagtagaaaaaaatata Protospacer ..* .*********************** *******.
18. spacer 8.8|2325148|35|NC_009495|PILER-CR matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 6, identity: 0.829
gacccta-taacagtttcagaagtagaacaaaatat CRISPR spacer -acagtactaacagcttcagaagtagcacaaaattt Protospacer ** ** ******.*********** ******* *
19. spacer 9.2|2327526|35|NC_009495|CRISPRCasFinder matches to MN694042 (Marine virus AFVG_250M538, complete genome) position: , mismatch: 7, identity: 0.8
tttaatattttttctatatccataggcttaaaatc CRISPR spacer tttaatatttcttctttatccatagtgtttataac Protospacer **********.**** ********* ** * * *
20. spacer 2.3|2302210|36|NC_009495|CRISPRCasFinder,CRT matches to MT795651 (Vibrio phage vB_VnaS-AQKL99, complete genome) position: , mismatch: 8, identity: 0.778
tcttaacctttaattacattatatattataagttca CRISPR spacer gcttaacctttaaatacattatacattaccaaccca Protospacer ************ *********.****. *...**
21. spacer 9.2|2327526|35|NC_009495|CRISPRCasFinder matches to NZ_CP054613 (Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence) position: , mismatch: 8, identity: 0.771
tttaatattttttctatatccataggcttaaaatc-- CRISPR spacer agtaatattttttctatattcataggc--agcttccg Protospacer *****************.******* *. **
22. spacer 8.3|2325146|36|NC_009495|CRISPRCasFinder matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 10, identity: 0.722
cgaccctataacagtttcagaagtagaacaaaatat CRISPR spacer cacagtactaacagcttcagaagtagcacaaaattt Protospacer *. . ******.*********** ******* *
23. spacer 1.2|1897951|40|NC_009495|CRISPRCasFinder matches to NC_018689 (Bacillus thuringiensis MC28 plasmid pMC429, complete sequence) position: , mismatch: 11, identity: 0.725
tatttaaaggatttaaactta---catcatttagatctaagag CRISPR spacer tatttaaaggatttaaacttagttcattacataggttatc--- Protospacer ********************* ***.*. ***.*.
24. spacer 8.6|2325146|37|NC_009495|CRT matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 11, identity: 0.703
cgaccctataacagtttcagaagtagaacaaaatatg CRISPR spacer cacagtactaacagcttcagaagtagcacaaaatttt Protospacer *. . ******.*********** ******* *
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
901880 : 913599
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NC_009495|901880:913599|DBSCAN-SWA ATTAATTAGTAATATCTATATGCAATCTTATATTATAGTTATTTAATTCTGTAACTTCTACTTTTAATATATAAATTGCACCATTTAATAAACGTATTGAATTGGTATTATTTAAGAGGTGTAAATTTTGTTGTATATTAATTAAATTATAGCCGTCAATAGTTTCAGTGACTCTAAATAAAGTACCTATTCCTTGGTTATAACTAGTATAAAGCCTAATGTTAGATGTATCTTTATTATTAAAGTTACCAGGTATTGTAAATTCATATGAAATATAGTCATGGACATCAGGGCTTTGTCTTGTATAGTAATGTGCACCTGTTGAATTAAGATTATCTATTATATTAACTGAAGAATTCATTAAATTTCGGAGATCCCCTTCTTCTCTCTTGAATTGTATTTGATTTTCTATATTAGAAGAAGTTTGTGGTACTCTAATGTAGTAATTTTTATCCTTATTAAGCAAAACAACTAAATAACTTTTAGCATTAGGACTGTCAAACCCAGTAATATAATTTATTGCTTTAATATCATCATCACATAAATTCCCAGATTGGAAATTTCTATTACCAGAACCTATCGCTTCATATATTTTTAATGATGGTAGATTATTTTGAGCATTAATTTTATAAATTCCTGTAGTATTTACTGTAAATAATATATAAAATGGATTATTATTTACAATACCTGGAATGTTATATGTGTAATTATCTGAAATAGCAGTATTTATTTCTTGTATATTTTCAGATGGGTCTATGACACCTACTACAATTTCTTCCTCGGGACCATTTTGTATAAATCCATCTTCAGCCACTTGCATTTTAACTACTTCAGATTCAGGTGAAGGAGCATTAGTTACTTCACAATATCCTAAGGAAGGAAGATAATACTCAGCTTTATTAACAATACTTCCATTTTGATAGTCTATTAATTCATATTTTTCATAGGTATTATAAGCCTTTATGCATATATTTTTATCTGAAGGAGCTTCTTCTACAAATTTAAATAACGATGTTGATGTATTAAATAATTGTACATTGAAAGCGTCTTTAAGTCTTTCTTCAGTATATTGTTGTGAGAATTTTGTATCATTACTTGTGGTGAATAATGGTCTAGTTGTATTTCTTAATCGAGGTTGTATAATACTTCCTGATGAACCTGCTTCGATTAATAATGTACCTATCAAATCTTTATCATTTGTTCTTATATATCCATCACCCTTATTAATAACATATAGCCCATTACTATAAGGCAATACTCGTTGTGTGCTACTAACTTTAGAATTAAAAATATTGTTAGTTGGTATATTTTTAGTAGTTTCTAAAATTTTTTTATATAGGAATTGTTCATTTAAAATGCACTTATCATTAGTTAGAAAGTAAAAATCTTTATTTATTTTTTCCCCTGGATTAAATTCTATAGACTTAACATATCCAAGAGATGGAACATATAAAACTGCTCTTTCTATAATTTCATGTTGTAAGACTTTTATTATTTCATATCTAATGTAGGTATATTGTAAATACATATATAAGTTTTTATTTGAGGGAGCGGTTTTACTAAATTCAAATCCTATTGGAATTTGATTAGCTTCAGTAAAGTTAGTAAATACAGTTTGTATATTATTTTTTATATATTCTTCATTGAAAGATGGTGTTGGATAATAATATGGTATCGCATTATCATTTACACGTAGGTCCCCAACTATTCCTGTTGATCCATTACTAATTACACTTCCACCTAATATTTGATTTTGTCTAGATAATATCCATCCATCCCCTCTTCTAACTACATAATTACCATCAGCTAAATCAATAGTATCACTATAGTTTATAACTTTTTCTTGTATATCATTATAAATTTTTTTTATAGATGAATTCATACACTTTTCTCCTTTATATTTTTTCAAGTTTGAACATTTGATTTGAATTGTATATATCAAAATTCGGTAATAGGAGTAGTGGTTGGCTTAAAATATTTTCATTAGTATCATAAATGTCCCAGGCATAATCTAATTCATTCACTTTATTTAAACTTAACATAATATAAGTATTTACAGCAATTTTAATAGGAAACCAGTAGCATCTATTGGATAATGAATCTAAAGAAATAAATCCAAAGTTATCGTAACTTAAATACTTATTTGGTTCTGCTACATTAGAGATTTTAAAGCATCTATTTTCAGCCATATATTCTACATTCCATTTTTGATTATTTGCAGAAGATTCATTTGAAAATGTTAATGATTTCGATACAGGATTTAAATATAAAGAACCAGAAAAGATAGATTTTATATTGTAATTACCATTAGGTAGAAAAGTTCTTTCAACTGACATATAATTCACCTCTTTATAAATTAGATGATAGTACTCATATTAAATCTTTGTTAATATTAATTTTATGGGTTACGAATATTCCATTTCTGATTATCATCTCCATGATAATTAAATACTTGAATAGCAGTTCCGTTTGCTGTTTGGCCGCCATATAAATCTAGAGCTTTAGTTGTATCGCGTAGATTAGTAATTGTATATGTTTCATCAGTATCTGAAACAGGATTTATAAGCCAATATTGGGCGTCATTATTTTGATCATTAGAAGAAGAAACCCTTACAGTATTACCATTTGAAAAAATCCATGTTAGAACTCCGTTTGAAAGTATTGTATTAAAAAACTGGTATGCTGCTTTTTCTTCATTATATCTAATTGTCCATTTTTGATTGCGACCATAGTCCCAAGTATATAAATTAACATTTAGATTTGTCACATCCACTTGTTGTACAACTTTATTAAGATCTAATATTGGACTTATTTTACATGTGAAATTGTTAAGATCTGATATTATATAATCTTCTATGATAAATTTTATATAATTTGAATTATTAAGTGTGCTAAGCTTCAAATTACGAGCTACGGTATCAGCATATAATACTAAGTTAGGGTTTTTATAACTTGCAATAATAAATGAATTGTTACCAATGTCTTTTAATAATAACCAATATTGATTATCTGCATTTGAATCTTGTTGCGTTGATATATTATGTGTTGGTGCATTCCATGTTAAAACTAAATTAGTATTATGGATATCCATACTTTTTATTTTATAAGCAGCTTTATTAGAATCATATATAAGTCTCCATCTTTCAAGGTAATTTCTAGTTTGTTGAAATAAGCTAACGTTACCGGCAACTTGATAAAAAAATAAATTAGTATCGGCCTTACAGGAGATGGTAACAATTTTGTCATTTAATGAATTTTGGATTACTGAATAGTGTTCCATTATGATTCCTCCTTTATTTAAGAATTAATCTTACATATAACATATAACATAATCAAATTATTTTTTGTAAACCTAAAATTTAAATATATCAAATTTTTATTAGTATGTTTACATAATTGATTATGGATATTTCGTAAAAATGGCTTATTAAAAATTTAAAGGCAATTAGTTTATTTATAGTATAATAAAAAAATAATATGTATATTATGGAAGGGTAGTGGTAAATATGAATAAATTGTTTTTACAAATTAAAATGTTAAAAAATGACAATAGGGAGTTTCAAGAAATTTTTAAGCATTTTGAAAAAACTATAAATATATTTACTAGAAAATATAATATATATGATAATTACAATGATATTTTGTACCATTTATGGTATACACTTAAAAAAGTTGATTTGAGCAATTTCAATACACAAAATGATTTAGAGAGATATATTAGTAGGACTTTAAAAAGATATTGCTTAGATATTTGCAATAAAAGAAAGATTGATAAGAAAATAATATATAATTCAGAAATTGTAGATAAGAAATTAAGCTTAATAGCAAATAGTTATTCAAGTTATTTAGAATTTGAATTTAATGATTTAATATCCATATTACCTGATGATCAAAAGAAAATTATATATATGAAATTTGTTGAAGATATTAAGGAGATAGATATAGCTAAAAAACTTAATATAAGTCGTCAATCTGTATATAAAAATAAAATAATGGCTTTAGAGAGATTAGAACCCATATTGAAAAAATTAATTAATATGTAGTTTATATTTTTAAAAAATTTTAGGTTTACAAAAAATAGTGTGGCTATGTTATATATAAATGATAAGAATATACTGAAAAATGTATCCAAAATTTAAGGGGGCGTGTATAGTAAATAATTAAAAGTATGTGCGTTGAAATAAATTTAGGAGGGTGGTTAGATATGAATATAAATGACAACTTAAGTATAAATTCCCCGGTAGATAATAAAAATGTTGTAGTAGTTAGAGCTAGAAAAACTGATACGGTTTTTAAGGCTTTTAAGGTTGCTCCCAATATTTGGGTGGCGCCAGAGAGATATTATGGCGAATCTTTGAGTATAGATGAAGAATATAAAGTTGATGGGGGAATATATGATTCTAATTTTCTTTCACAAGATAGTGAAAAAGATAAGTTCTTACAAGCCATTATTACTTTGTTAAAAAGAATTAATAGTACTAACGCTGGGGAAAAGTTATTATCTTTGATTTCTACAGCTATTCCATTTCCTTATGGATATATAGGTGGAGGGTATTATGCACCTAATATGATTACTTTTGGATCAGCACCAAAATCTAATAAAAAATTGAATTCTTTAATTTCAAGTACTATTCCATTTCCTTATGCAGGATATAGAGAAACAAATTATCTTTCATCTGAAGATAATAAAAGTTTCTATGCATCTAATATAGTTATTTTTGGTCCAGGAGCAAACATAGTAGAAAACAATACTGTTTTTTATAAAAAGGAAGATGCAGAAAATGGAATGGGAACAATGACTGAAATATGGTTCCAACCATTTCTAACCTATAAATATGACGAATTTTATATTGATCCTGCAATAGAATTAATAAAATGTTTAATAAAATCTCTTTATTTCTTATATGGTATAAAACCTAGTGATGATTTAGTTATTCCATATAGATTAAGAAGTGAATTAGAGAATATAGAATACTCACAATTGAATATAGTTGATTTACTAGTATCTGGAGGCATTGATCCTAAATTTATAAATACAGATCCATATTGGTTTACAGATAATTATTTCTCAAATGCAAAAAAAGTGTTTGAAGATCATAGGAATATTTATGAAACAGAAATTGAAGGAAATAATGCCATTGGTAATGATATAAAATTGAGATTAAAACAAAAGTTTCGAATCAATATCAATGATATATGGGAATTAAATTTAAATTATTTCTCTAAAGAGTTTAGCATTATGATGCCAGATAGATTTAATAATGCACTTAAACATTTTTATAGAAAACAATACTACAAAATAGATTATCCAGAAAATTATAGTATAAATGGTTTTGTTAATGGTCAAATTAATGCTCAATTATCTTTATCAGATAGAAATCAAGATATTATAAATAAACCTGAAGAAATAATTAATTTATTAAATGGAAATAATGTTTCATTAATGAGAAGTAATATTTATGGTGATGGATTAAAAAGCACTGTAGATGATTTTTACAGTAATTATAAAATCCCATATAATAGAGCCTATGAATATCATTTTAATAATTCAAATGATTCTTCTTTAGATAATGTTAACATTGGAGTAATAGACAATATTCCAGAGATTATAGATGTAAATCCTTATAAGGAAAATTGTGATAAGTTTTCACCGGTACAGAAAATTACAAGTACTAGAGAAATTAATACAAATATACCATGGCCTATAAATTATTTACAAGCTCAAAATACTAACAATGAAAAATTTAGTTTATCCTCAGATTTTGTAGAAGTAGTTTCTTCTAAAGATAAATCTTTAGTGTATTCTTTCTTATCTAATGTAATGTTTTATTTAGATTCCATAAAGGATAATAGTCCTATTGATACAGATAAAAAATATTATTTATGGTTAAGAGAGATTTTTAGAAATTATTCTTTTGATATTACTGCAACTCAAGAAATTAATACTAATTGTGGTATTAATAAAGTAGTAACTTGGTTTGGGAAAGCATTAAATATTTTAAATACATCTGATTCTTTTGTAGAAGAATTTCAAAATTTAGGGGCAATTTCACTTATTAATAAAAAAGAAAATTTAAGTATGCCAATAATTGAGAGTTATGAAATCCCTAACGATATGTTAGGATTACCACTAAATGATTTAAATGAAAAATTATTTAACATATATTCTAAAAACACAGCTTATTTTAAAAAAATCTACTATAATTTCCTAGATCAGTGGTGGACACAATATTATAGTCAATATTTTGATTTAATTTGTATGGCTAAAAGATCAGTGTTAGCTCAAGAAACTTTAATAAAAAGAATAATACAAAAAAAATTGAGTTATTTAATAGGAAATTCTAATATATCATCTGATAACTTAGCATTGATGAATCTTACAACAACAAATACATTAAGAGATATTTCAAACGAATCACAAATAGCAATGAATAATGTAGATAGTTTTTTAAATAATGCCGCTATATGTGTTTTTGAAAGTAATATATATCCTAAATTTATTTCTTTTATGGAACAATGTATTAATAATATAAATATTAAGACAAAAGAATTTATACAAAAATGTACTAATATTAATGAAGATGAAAAATTACAATTAATTAACCAGAATGTTTTTAATAGCTTAGATTTTGAATTCTTAAATATTCAAAATATGAAAAGTTTATTTAGTTCAGAGACAGCATTACTTATAAAGGAAGAAACTTGGCCTTATGAACTAGTGTTATATGCTTTTAAGGAACCAGGTAATAATGTTATCGGAGATGCATCTGGTAAAAATACATCAATAGAATATTCTAAGGACATAGGTTTAGTTTATGGAATAAATAGTGATGCATTATATTTAAATGGATCTAATCAAAGTATAAGTTTTTCTAATGATTTCTTTGAGAATGGATTAACTAACAGTTTTTCAATTTATTTTTGGTTGAGAAATTTGGGCAAAGATACTATTAAATCTAAGTTAATAGGTAGTAAGGAAGATAATTGTGGTTGGGAAATTTATTTTCAAGATACTGGGTTGGTTTTCAATATGATAGATTCTAATGGAAATGAGAAGAATATATATCTATCTGATGTTTCTAATAATAGTTGGCACTATATAACTATATCTGTAGATCGTTTAAAAGAACAATTATTAATATTTATTGATGATAATTTAGTGGCTAATGAAAGTATTAAGGAAATTTTAAATATCTATTCAAGTAATATAATTTCTTTATTAAGCGAGAATAATCCAAGTTATATTGAGGGATTAACTATTTTAAATAAACCCACTACAAGTCAGGAAGTTTTGAGTAATTATTTTGAAGTTCTAAATAATTCATATATAAGAGACAGTAATGAAGAACGATTAGAATACAATAAGACATATCAATTATATAATTATGTATTTTCAGATAAGCCTATATGTGAAGTTAAACAAAATAATAATATATATTTAACAATTAATAATACAAACAATTTAAATCTACAAGCTTCTAAATTTAAATTATTAAGTATAAATCCAAATAAACAATATGTTCAAAAACTTGATGAGGTAATAATTTCTGTATTAGATAATATGGAAAAATATATAGATATATCTGAAGATAATAGATTGCAACTAATAGATAACAAAAATAACGCAAAGAAGATGATAATTAGTAATGATATATTTATTTCCAATTGTTTAACCCTATCTTATAACGGTAAATATATATGTTTATCTATGAAAGATGAAAACCATAATTGGATGATATGTAATAATGATATGTCAAAGTATTTGTATTTATGGTCATTTAAATAATTAATAATTTAATTAATTTTAAATATTATAAGAGGTGTTAAATATGCCATTTGTTAATAAACAATTTAATTATAAAGATCCTGTAAATGGTGTTGATATTGCTTATATAAAAATTCCAAATGCAGGACAAATGCAACCAGTAAAAGCTTTTAAAATTCATAATAAAATATGGGTTATTCCAGAAAGAGATACATTTACAAATCCTGAAGAAGGAGATTTAAATCCACCACCAGAAGCAAAACAAGTTCCAGTTTCATATTATGATTCAACATATTTAAGTACAGATAATGAAAAAGATAATTATTTAAAGGGAGTTACAAAATTATTTGAGAGAATTTATTCAACTGATCTTGGAAGAATGTTGTTAACATCAATAGTAAGGGGAATACCATTTTGGGGTGGAAGTACAATAGATACAGAATTAAAAGTTATTGATACTAATTGTATTAATGTGATACAACCAGATGGTAGTTATAGATCAGAAGAACTTAATCTAGTAATAATAGGACCCTCAGCTGATATTATACAGTTTGAATGTAAAAGCTTTGGACATGAAGTTTTGAATCTTACGCGAAATGGTTATGGCTCTACTCAATACATTAGATTTAGCCCAGATTTTACATTTGGTTTTGAGGAGTCACTTGAAGTTGATACAAATCCTCTTTTAGGTGCAGGCAAATTTGCTACAGATCCAGCAGTAACATTAGCACATGAACTTATACATGCTGGACATAGATTATATGGAATAGCAATTAATCCAAATAGGGTTTTTAAAGTAAATACTAATGCCTATTATGAAATGAGTGGGTTAGAAGTAAGCTTTGAGGAACTTAGAACATTTGGGGGACATGATGCAAAGTTTATAGATAGTTTACAGGAAAACGAATTTCGTCTATATTATTATAATAAGTTTAAAGATATAGCAAGTACACTTAATAAAGCTAAATCAATAGTAGGTACTACTGCTTCATTACAGTATATGAAAAATGTTTTTAAAGAGAAATATCTCCTATCTGAAGATACATCTGGAAAATTTTCGGTAGATAAATTAAAATTTGATAAGTTATACAAAATGTTAACAGAGATTTACACAGAGGATAATTTTGTTAAGTTTTTTAAAGTACTTAACAGAAAAACATATTTGAATTTTGATAAAGCCGTATTTAAGATAAATATAGTACCTAAGGTAAATTACACAATATATGATGGATTTAATTTAAGAAATACAAATTTAGCAGCAAACTTTAATGGTCAAAATACAGAAATTAATAATATGAATTTTACTAAACTAAAAAATTTTACTGGATTGTTTGAATTTTATAAGTTGCTATGTGTAAGAGGGATAATAACTTCTAAAACTAAATCATTAGATAAAGGATACAATAAGGCATTAAATGATTTATGTATCAAAGTTAATAATTGGGACTTGTTTTTTAGTCCTTCAGAAGATAATTTTACTAATGATCTAAATAAAGGAGAAGAAATTACATCTGATACTAATATAGAAGCAGCAGAAGAAAATATTAGTTTAGATTTAATACAACAATATTATTTAACCTTTAATTTTGATAATGAACCTGAAAATATTTCAATAGAAAATCTTTCAAGTGACATTATAGGCCAATTAGAACTTATGCCTAATATAGAAAGATTTCCTAATGGAAAAAAGTATGAGTTAGATAAATATACTATGTTCCATTATCTTCGTGCTCAAGAATTTGAACATGGTAAATCTAGGATTGCTTTAACAAATTCTGTTAACGAAGCATTATTAAATCCTAGTCGTGTTTATACATTTTTTTCTTCAGACTATGTAAAGAAAGTTAATAAAGCTACGGAGGCAGCTATGTTTTTAGGCTGGGTAGAACAATTAGTATATGATTTTACCGATGAAACTAGCGAAGTAAGTACTACGGATAAAATTGCGGATATAACTATAATTATTCCATATATAGGACCTGCTTTAAATATAGGTAATATGTTATATAAAGATGATTTTGTAGGTGCTTTAATATTTTCAGGAGCTGTTATTCTGTTAGAATTTATACCAGAGATTGCAATACCTGTATTAGGTACTTTTGCACTTGTATCATATATTGCGAATAAGGTTCTAACCGTTCAAACAATAGATAATGCTTTAAGTAAAAGAAATGAAAAATGGGATGAGGTCTATAAATATATAGTAACAAATTGGTTAGCAAAGGTTAATACACAGATTGATCTAATAAGAAAAAAAATGAAAGAAGCTTTAGAAAATCAAGCAGAAGCAACAAAGGCTATAATAAACTATCAGTATAATCAATATACTGAGGAAGAGAAAAATAATATTAATTTTAATATTGATGATTTAAGTTCGAAACTTAATGAGTCTATAAATAAAGCTATGATTAATATAAATAAATTTTTGAATCAATGCTCTGTTTCATATTTAATGAATTCTATGATCCCTTATGGTGTTAAACGGTTAGAAGATTTTGATGCTAGTCTTAAAGATGCATTATTAAAGTATATATATGATAATAGAGGAACTTTAATTGGTCAAGTAGATAGATTAAAAGATAAAGTTAATAATACACTTAGTACAGATATACCTTTTCAGCTTTCCAAATACGTAGATAATCAAAGATTATTATCTACATTTACTGAATATATTAAGAATATTATTAATACTTCTATATTGAATTTAAGATATGAAAGTAATCATTTAATAGACTTATCTAGGTATGCATCAAAAATAAATATTGGTAGTAAAGTAAATTTTGATCCAATAGATAAAAATCAAATTCAATTATTTAATTTAGAAAGTAGTAAAATTGAGGTAATTTTAAAAAATGCTATTGTATATAATAGTATGTATGAAAATTTTAGTACTAGCTTTTGGATAAGAATTCCTAAGTATTTTAACAGTATAAGTCTAAATAATGAATATACAATAATAAATTGTATGGAAAATAATTCAGGATGGAAAGTATCACTTAATTATGGTGAAATAATCTGGACTTTACAGGATACTCAGGAAATAAAACAAAGAGTAGTTTTTAAATACAGTCAAATGATTAATATATCAGATTATATAAACAGATGGATTTTTGTAACTATCACTAATAATAGATTAAATAACTCTAAAATTTATATAAATGGAAGATTAATAGATCAAAAACCAATTTCAAATTTAGGTAATATTCATGCTAGTAATAATATAATGTTTAAATTAGATGGTTGTAGAGATACACATAGATATATTTGGATAAAATATTTTAATCTTTTTGATAAGGAATTAAATGAAAAAGAAATCAAAGATTTATATGATAATCAATCAAATTCAGGTATTTTAAAAGACTTTTGGGGTGATTATTTACAATATGATAAACCATACTATATGTTAAATTTATATGATCCAAATAAATATGTCGATGTAAATAATGTAGGTATTAGAGGTTATATGTATCTTAAAGGGCCTAGAGGTAGCGTAATGACTACAAACATTTATTTAAATTCAAGTTTGTATAGGGGGACAAAATTTATTATAAAAAAATATGCTTCTGGAAATAAAGATAATATTGTTAGAAATAATGATCGTGTATATATTAATGTAGTAGTTAAAAATAAAGAATATAGGTTAGCTACTAATGCATCACAGGCAGGCGTAGAAAAAATACTAAGTGCATTAGAAATACCTGATGTAGGAAATCTAAGTCAAGTAGTAGTAATGAAGTCAAAAAATGATCAAGGAATAACAAATAAATGCAAAATGAATTTACAAGATAATAATGGGAATGATATAGGCTTTATAGGATTTCATCAGTTTAATAATATAGCTAAACTAGTAGCAAGTAATTGGTATAATAGACAAATAGAAAGATCTAGTAGGACTTTGGGTTGCTCATGGGAATTTATTCCTGTAGATGATGGATGGGGAGAAAGGCCACTGTAA
Protein sequences of DBSCAN-SWA_1 >NC_009495|901880:913599|901880_903761_-|WP_011948507.1|DBSCAN-SWA MNSSIKKIYNDIQEKVINYSDTIDLADGNYVVRRGDGWILSRQNQILGGSVISNGSTGIVGDLRVNDNAIPYYYPTPSFNEEYIKNNIQTVFTNFTEANQIPIGFEFSKTAPSNKNLYMYLQYTYIRYEIIKVLQHEIIERAVLYVPSLGYVKSIEFNPGEKINKDFYFLTNDKCILNEQFLYKKILETTKNIPTNNIFNSKVSSTQRVLPYSNGLYVINKGDGYIRTNDKDLIGTLLIEAGSSGSIIQPRLRNTTRPLFTTSNDTKFSQQYTEERLKDAFNVQLFNTSTSLFKFVEEAPSDKNICIKAYNTYEKYELIDYQNGSIVNKAEYYLPSLGYCEVTNAPSPESEVVKMQVAEDGFIQNGPEEEIVVGVIDPSENIQEINTAISDNYTYNIPGIVNNNPFYILFTVNTTGIYKINAQNNLPSLKIYEAIGSGNRNFQSGNLCDDDIKAINYITGFDSPNAKSYLVVLLNKDKNYYIRVPQTSSNIENQIQFKREEGDLRNLMNSSVNIIDNLNSTGAHYYTRQSPDVHDYISYEFTIPGNFNNKDTSNIRLYTSYNQGIGTLFRVTETIDGYNLINIQQNLHLLNNTNSIRLLNGAIYILKVEVTELNNYNIRLHIDITN >NC_009495|901880:913599|905385_905922_+|WP_011948509.1|DBSCAN-SWA MNKLFLQIKMLKNDNREFQEIFKHFEKTINIFTRKYNIYDNYNDILYHLWYTLKKVDLSNFNTQNDLERYISRTLKRYCLDICNKRKIDKKIIYNSEIVDKKLSLIANSYSSYLEFEFNDLISILPDDQKKIIYMKFVEDIKEIDIAKKLNISRQSVYKNKIMALERLEPILKKLINM >NC_009495|901880:913599|904277_905159_-|WP_011948508.1|DBSCAN-SWA MEHYSVIQNSLNDKIVTISCKADTNLFFYQVAGNVSLFQQTRNYLERWRLIYDSNKAAYKIKSMDIHNTNLVLTWNAPTHNISTQQDSNADNQYWLLLKDIGNNSFIIASYKNPNLVLYADTVARNLKLSTLNNSNYIKFIIEDYIISDLNNFTCKISPILDLNKVVQQVDVTNLNVNLYTWDYGRNQKWTIRYNEEKAAYQFFNTILSNGVLTWIFSNGNTVRVSSSNDQNNDAQYWLINPVSDTDETYTITNLRDTTKALDLYGGQTANGTAIQVFNYHGDDNQKWNIRNP >NC_009495|901880:913599|906083_909665_+|WP_011948510.1|DBSCAN-SWA MNINDNLSINSPVDNKNVVVVRARKTDTVFKAFKVAPNIWVAPERYYGESLSIDEEYKVDGGIYDSNFLSQDSEKDKFLQAIITLLKRINSTNAGEKLLSLISTAIPFPYGYIGGGYYAPNMITFGSAPKSNKKLNSLISSTIPFPYAGYRETNYLSSEDNKSFYASNIVIFGPGANIVENNTVFYKKEDAENGMGTMTEIWFQPFLTYKYDEFYIDPAIELIKCLIKSLYFLYGIKPSDDLVIPYRLRSELENIEYSQLNIVDLLVSGGIDPKFINTDPYWFTDNYFSNAKKVFEDHRNIYETEIEGNNAIGNDIKLRLKQKFRININDIWELNLNYFSKEFSIMMPDRFNNALKHFYRKQYYKIDYPENYSINGFVNGQINAQLSLSDRNQDIINKPEEIINLLNGNNVSLMRSNIYGDGLKSTVDDFYSNYKIPYNRAYEYHFNNSNDSSLDNVNIGVIDNIPEIIDVNPYKENCDKFSPVQKITSTREINTNIPWPINYLQAQNTNNEKFSLSSDFVEVVSSKDKSLVYSFLSNVMFYLDSIKDNSPIDTDKKYYLWLREIFRNYSFDITATQEINTNCGINKVVTWFGKALNILNTSDSFVEEFQNLGAISLINKKENLSMPIIESYEIPNDMLGLPLNDLNEKLFNIYSKNTAYFKKIYYNFLDQWWTQYYSQYFDLICMAKRSVLAQETLIKRIIQKKLSYLIGNSNISSDNLALMNLTTTNTLRDISNESQIAMNNVDSFLNNAAICVFESNIYPKFISFMEQCINNINIKTKEFIQKCTNINEDEKLQLINQNVFNSLDFEFLNIQNMKSLFSSETALLIKEETWPYELVLYAFKEPGNNVIGDASGKNTSIEYSKDIGLVYGINSDALYLNGSNQSISFSNDFFENGLTNSFSIYFWLRNLGKDTIKSKLIGSKEDNCGWEIYFQDTGLVFNMIDSNGNEKNIYLSDVSNNSWHYITISVDRLKEQLLIFIDDNLVANESIKEILNIYSSNIISLLSENNPSYIEGLTILNKPTTSQEVLSNYFEVLNNSYIRDSNEERLEYNKTYQLYNYVFSDKPICEVKQNNNIYLTINNTNNLNLQASKFKLLSINPNKQYVQKLDEVIISVLDNMEKYIDISEDNRLQLIDNKNNAKKMIISNDIFISNCLTLSYNGKYICLSMKDENHNWMICNNDMSKYLYLWSFK >NC_009495|901880:913599|909708_913599_+|WP_011948511.1|DBSCAN-SWA MPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPL >NC_009495|901880:913599|903774_904215_-|WP_003356711.1|DBSCAN-SWA MSVERTFLPNGNYNIKSIFSGSLYLNPVSKSLTFSNESSANNQKWNVEYMAENRCFKISNVAEPNKYLSYDNFGFISLDSLSNRCYWFPIKIAVNTYIMLSLNKVNELDYAWDIYDTNENILSQPLLLLPNFDIYNSNQMFKLEKI |
6 | Clostridium_botulinum_D_phage(50.0%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
1684282 : 1691348
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NC_009495|1684282:1691348|DBSCAN-SWA ACTATGTCATATTTGAATATATATCATTAATTTTTTTACATTTATCCTTTATAATTTCTCTAATATGATTGGGTTCAAGTACTTCCACACATTCTCCGTAACTTAATATCATGGAATATATCCAGTCATCTTCTAATAAATATGTATCTACAATTACACTACCATCTTCTTGAAACTTTATTTCATCTTTATCAAAACAATCGTCTATTCTATATCTAACTCTTTCAGAAAACTTTAATACAACTCTTGTAGGTACTTGTTCACTCTCACTAATATTTATATATTCTTTATAGGAAATTCTATTTTCATTAATTTTTTCATGTGGAACAGTTAAATTTTCCATTCTTGATAATTTGAAAAGTCGGTAATCATTTTTTAATTTGCAAAAGGAAAATAAATACCATGAGAAACCTTTAAAAACAAGAGTTAATGGCTCTATCTCCCTCCAATTATATTCACCTTTTGAGTTTCTATAATCAAAGGCTATACAGTTTTTGTTATCTACAGCATCATATATAATTTTGTATTTTAAGTTTTCTTCTTCACATTTTTTAAAGCCCCAAGGTAATGTATCTATACACATTTGCTCAAAATGCAAATCAAATACTTCTTTTTTTTCTTTAGGAACAATATTTTTTACCTTTTCAATGGCCATTTCAACATTTTTATTATCTAAAAATTTATTCATATTTTTTAGAGCTTCTATAATTGAAATCATATCTTCTAATGTTAAAAGTTGATGATTGATTTTATAGTTATCTATAATATAAAATCCTCCATTATTTCCAATTTGAGAAACTATAGGAATTCCAGCAAGATTAATTGCTTCAATATCTCTATAAATTGTTCTTACAGAAACCTCAAATTTTTCAGCTAATTCTGATGCAGATATTTTTTCTCTATTTAAAAGCATTACAACAATTGCCAATAATCTATTAATTTTCATGAATCTATAAACCCCCCATAATTTGAAATGACTATTTTATTATATCAAATTAATAACTTGTAAGATTGGTTAGAGAGAAATTGTTGAGGGAATTGCATAAGAAAGTTTTAAAAGAATAAATTCTAATATGGTAATTTTTGGGTTATCCATGGGTATGAACTTGACTTAACAAATGTACTATAGTAAACTTATATCGTAAAAAAGAATAAAGACAGTTCGTAACCATCCTGTCTATAAATAAAACTAGGACGTAGCTACCGCCTTAGGTAGTTTTTTTGTTGATGGGCATTTAATGCCCTTTTTTATTTGCAAAAAATTTACAAATAGGATTTTTGTTTTAGGTGAAATTTTTAATTTATATAAAGTTTAGAAATTGTTATTTAAGGACGCAGAGGTCTTATCCAATGAATTTTTTAACTTAAATATAACAGTAACAGTATAAGGCTGTTTTTTATAAAGATTGTCCAAATATAACTTAAAAACCTTACAAGGTAGGAAACTTTAAATAGTTGTAAAATATCCTAATAAATAATAATTTATCATAACCATTATAACTGTTTAATGTTTTCAAGTCTAAGTGAGTGTAATAGATTGAAAAATCTATAGCACAAGGAGGAATGAAAATGAAAAAAATAGGACTAACAACTACAGTGCCAGTGGAAGTTATTGTTGCAGCAGGATATACACCAGTAGATTTAAATAATATGTTTATAACTTCAGAGAATTATTTAAAATATATAGACATAGCTGAAAGAGACGGTTTCCCTAAAAGCTTATGTGCTTGGATAAAGGGAATTTATGGAGCATGTCTAGAAAATAATATTAAAGAAATAGTTGGAGTTATGGAGGGGGATTGTTCTAACACTAAAGCCCTCATCGAGGTTTTTAAACTAAGAGGAATAAAAATTTATCCATTTTCATTTCCACATAGCCATAGTTTAAAGGATGTAGAAATTGAAATAAGAAAGTTCATGGATATCTTCAATGTTAACGAGGATAAGGTAGAACAGGTTAGAAAAAGATTAAATAGAGTTAGGAAGCTAGCAAAAAAAATAGATGAAATGACTTATATAGATAATAAGGTTAATGGTTTTGAAAACCACCTATATCAGGTGAGCTTAAGTGACTTTAATGGAAACATAGATGAATTTGAAGAACACCTTAAAAAAGTCATTGAGGGTATGGAGAAAAGAGAGCCAATAAATAAAAAATTAAGATTAGGCTATATAGGAGTTCCTCCAATGACTGGAGATATATATGAGTTTAGTGAAAAATTAAATGCTCATTTTGTATATAACGAAGTTCAAAGAGAATTTGCTTTTCCTAGGGGGATAGAAGCTGCAAATATATTTGAACAGTATTATAATTACACCTATCCTTATGATAATGAGTTTAGAATTAAGGAATTGAAAAAGCAAATAGAAAAGAGAAAAATAGATGCTATAATTCACTACACTCAGGCTTTTTGCCATAGAGCTGTTGAAGATATAGTATTAAAAGAAGAATTAAATATTCCTATGTTAAATATTGAAGGTGATAAGTTAAATACATTAGATGCAAGAACTAAACTAAGATTAGAAGCCTTTCTGGATATGTTGCTGGACTTAAAGCAGAAGTAATAGGTGATCTAGTAAGAATTTTTATCTTAATATATTGTTGGATTTAAAGCAAAAGTAATAGACGGTATATAAAAGAAGTTCATGTTTTCTTTATATTTAGCGAAGGAGGGGAATTAATGAGATTGTTAGGAATAGACCTTGGAAGTAGAGAAGTTAAGATTGTTTTAATGGAAAACAATATTATAGTTCAAAAGAAAAAAGTAAGTACCATGAAATTTTATAGAGATTACTGTAGCTTTCATGGCAAGATTGTAGTAGATTTAGAAAAACTTAATATAGAAGGAATAGATAAAGCGATATCAACGGGTTATGGAAAAAATAATACGGATTTAGAATTTTTTACACCTATAAATGAGATAAAAGCCCATGTTTATGGTGGGATCTATCAAAGTAATTTAAAGGATTTTATACTTTTAGATGTAGGTGGTCAGGACGTTAAGGTGGTAAAGGTAGAAAAGGGTGTTGCAACAGATTTGGAGCTTAATGAAAAATGTGCTGCTTCCTGTGGAAGATACTTGGAGAATATGGCAAATGTACTTGAAATATCCCTAGATGAAATGAGCCAGTACTCGGAAAATCCCGTGGATTTAAATTCCACCTGTGCAGTATTTTCTGAATCAGAATTAATTGGAAAAATAGCCGAAGGGGTACACATAGAAAGGTTATGTGCTGGGGTTAATTACTCTTTGTATAAAAGGCTACAACCTCTTTTAAGTAAGTTTAGGGGGAAGAAATTAGTTATAACCGGTGGTGTTGCAAATAACCATTCAATAAAAAAATATTTAAATAATGATTATGAAGAAATAGTATCCGTAAAAGATCCTCAGTTTAATGGGGCTATTGGATGTTGTTATTACGGAAGCAAATTTTTAAAATAAACTTAGGAGGAAAAAACATGTATACTTTAAAAGTAGAACATAATTTTGATAGTGCTCATTTTCTTGCAGGTTATGAAGGTAAATGTGGAAATATTCATGGACACAGATGGAAGGTTGAAATTCAGGTTCAGGCAGAATCATTAGTACAAGGTGGTCAACTTGACGGGATGATAATAGACTTTGGAGACTTAAAAAAAGATGTTAAATCTATGGTAGATTATTATGATCATGCACTTATAATAGAGAAGGGAACTATGAGGGGGCAATCATTAAGCTCATTAAAGGAGGATGGATTTCGTATAATAGAAGTTAATTTTAGACCAACAGCGGAAAATTTTGCAGCTTTTTTCTATAAAATTATGAAGGATAGAGGATATAATGTAAAAAGTACTACAGTTTATGAAACACCTAATAATAGTGCTACCTATGAAGAAAGTGGGGTAATTTAAAATGGATTTTAAGGTGGTTGAAAGGTTTGTAAGCATAAATGGAGAAGGAAGGCGTTGTGGACAACTGGCTATATTCATAAGATTCGCGGGTTGTAATTTAAACTGTAGCTATTGTGATACACTTTGGGCAAATGAAAAGGATGTACCCTATGAAGTATTAAGTTCCAAAGATATATATGAATATATTAAGTCCAAAGAGGTTAAAAATGTAACTTTAACAGGAGGAGAACCTCTTCTACAAAAGGGAATAATGGAGTTATTAAAACTTTTGTCTAAGGATAAAGAGCTTTATGTGGAAATTGAGACAAATGGCAGCATATTATTAGATGAATTTTTGAATATAGAAAATTCACCAAGTTTTACTATGGATTATAAACTTCCTTTAAGTAATATGGAAAATAAAATGGCATTAGATAACTTTAAATATTTAACTAAGAAGGATACAGTAAAATTTGTATCAGGTAGTATAGAGGATTTAGAAAAAGCTAGAGAAATAATAAATAAGTATAACTTAGTAGATAAAACTAATGTATATATAAGTCCTGTTTTTGGAAAAATTAATTTAGATACTATTGTAGAATTTATGAAAAATAATAGAATGAATGGAGTTAATTTACAACTGCAGCTTCACAAGATTATATGGGAGCCTAGTAAGAGAGGAGTATAGCATATGGCAATTGATGTTAAAGCAATTGAAGAACACATAAGGGGAATTTTGATAGCTTTAGGAGACAACCCAGAAAGAGAAGGTCTAAAGAACACACCAAAACGTGTAGCTAAAATGTATGAAGAAGTATTCAAAGGTATGTGTTATAGCAATGATGAAATTGCAGAAATGTTTAATGTAACCTTTGAAGATGATTTATGTATAAATGATAATGAAAATGACATGGTTTTTATGAAGGAAATAGAAATATTTAGTCATTGTGAACATCATTTAGCACTTATGTACAATATGAAAGTAGCCATAGCATATATACCTAAGAAAAAAATTATTGGTTTAAGCAAAATAGCACGAATAGCAGATATGGTAGGACGTAGACTACAGCTTCAAGAGAGGATTGGAAGTGATATAGCAGAAATACTTCAGAAGATAACTGACTCAGAAGATGTAGCTGTTATTATAGAAGGAGAACATGGCTGTATGACTACTAGAGGAATAAAGAAGCCAGGTACTAAAACTATAACAACTACATTAAGGGGAAAGTTTAACACAGATCCTATTGTAAGCAATAAATTAATGATGCTTTATACGAAATAAAGAAATTTTTAGTTCTAGTTAGAGTTTTATTAAAATAAATATATTAAATTCGTACAAGATTAAAAAATCTTACACATGAGTAGAACAGTTTATATAAAGAGAGTGTATTAAAGAAGCATAACTATAACAAAGATTTTTGTAGATTGTAGGATGATAATAAAATAATAAAGGGATGTGTAGTAGATGAATAAGGAAAAAGCAATAGTAGTATTTAGTGGTGGACAAGATAGTACAACCTGTTTGTTTTGGGCAAAGAAAAAATATAAAGAAGTTATAGCAGTATCCTTTGATTATAATCAAAAACATAAATTAGAGTTAGACTGTGCAAAGGATATATGTAAAAAATATAATATTGAACATCATATTTTAGATTTAAATTTGTTAAATCAATTAGCACCAAATTCACTAACTAGGCAGGATATAACTGTTGATAAAAGCGCACCTAAAGAAGGGGTGCCTAATTCCTTTGTAGATGGAAGAAATTTATTGTTTTTAAGCTTTGTCGCAGTATTTGCAAAACAAAAAGGAATAAACACTATTATAACTGGTGTGTCACAGAGTGATTTTAGTGGATATCCAGATTGTAGAGATGTATTTATAAAATCTTTAAATGTTACATTAAATTTAGCTATGGATTATGAATTTGAAATAATTACACCACTAATGTGGATCAATAAAGCAGAAACGTGGAAAATGGCTTATGATTTAGGGGTTCTTGATATCGTTAAAGAAGAAACCTTAACATGCTACAATGGAATAAAAGCAGATGGATGTGGGGAATGTCCAGCTTGTAAATTAAGAAAAAAGGGATATTGGGAGTTTGAAAAAGAGTATTTAAAATAGTAATTTTATATGTGTTGCTTGAGCAATACCTCCTTTTTATATTTCGTATTTAGTTTTTGTAAATTTTGTCGATAATTTAATATTAGAAGTATGAAATATTAGGAGGATTATACTATGATAAATATTTTTAGTAAAAAAGATAGTGAAAAGGATAATAAAAATGATACTATTGAGCAGGAAGTTATTGTTGAAGAAAAACATGAAGTTGAAACTATAGATACTATGAAATTTCTAAAAGAAATGACTATACAGATAGAGGGTATAATACAGCAGCATAATAAAGTTAATGGTGAACATGAAGTGCTTGAAAAATTAGCAAAACAGATTGAAAATCATATGGTAACAGTATCAAATTTAACTGAAAGGACTAATGAATCAACAGATAAGCTTTTTAGTCAAGGAGAAAGTCTGTTAGAGATTACAAAAGATACTGTAAATAAATCCTTAGAAGGTAAAAAGTCAATTGAGGGTATGGTTAAAGTAATTGAAAATCTTGACATAGAAACAAAGGATACATACGAGAATATTAATGCTTTGGGCGAAAAACTAAAGGAGATTGGAGAAATTGCTCAATTAATAAGTGGAATAGCCTCAAAAACAAATCTTCTTGCTCTTAATGCTGCCATAGAAGCAGCCCGTGCAGGAGAACAAGGCAAAGGCTTTGCAGTAGTTGCTGATGAAGTTAGAAAATTGGCAGAAATGACCGGTGAAAGCAGTAGTAATATAACTAATTTAATTAGTGGCATAGACTCACAAACTGAAAATGTTTTAAATAGTGTTGAAAAGAGTACATTAGTAGTTATAGAAGGAGTAAAATCCTCTAAAGGAGCACTTGAAAAAATAGAAGAAGTTCTAGATTCATTTAACAGAGTTGAAGATGACACTGATAGCCTAATAAAAACAATTAATACTCAAAAAGAAGATATAAGTAAAATTTTTAACGGAATAAATGGAGTAGATAAAATTCTTACTGAAACCAATGAGCAAATTATAAAGCATATAGATGAGGCACACAAAGTAGATGAGAAATTAGAAAAAAGTGTATATCATATAGCTCAATATGTAAAATAA
Protein sequences of DBSCAN-SWA_2 >NC_009495|1684282:1691348|1684282_1685227_-|WP_011949098.1|DBSCAN-SWA MKINRLLAIVVMLLNREKISASELAEKFEVSVRTIYRDIEAINLAGIPIVSQIGNNGGFYIIDNYKINHQLLTLEDMISIIEALKNMNKFLDNKNVEMAIEKVKNIVPKEKKEVFDLHFEQMCIDTLPWGFKKCEEENLKYKIIYDAVDNKNCIAFDYRNSKGEYNWREIEPLTLVFKGFSWYLFSFCKLKNDYRLFKLSRMENLTVPHEKINENRISYKEYINISESEQVPTRVVLKFSERVRYRIDDCFDKDEIKFQEDGSVIVDTYLLEDDWIYSMILSYGECVEVLEPNHIREIIKDKCKKINDIYSNMT >NC_009495|1684282:1691348|1690391_1691348_+|WP_011949103.1|DBSCAN-SWA MINIFSKKDSEKDNKNDTIEQEVIVEEKHEVETIDTMKFLKEMTIQIEGIIQQHNKVNGEHEVLEKLAKQIENHMVTVSNLTERTNESTDKLFSQGESLLEITKDTVNKSLEGKKSIEGMVKVIENLDIETKDTYENINALGEKLKEIGEIAQLISGIASKTNLLALNAAIEAARAGEQGKGFAVVADEVRKLAEMTGESSSNITNLISGIDSQTENVLNSVEKSTLVVIEGVKSSKGALEKIEEVLDSFNRVEDDTDSLIKTINTQKEDISKIFNGINGVDKILTETNEQIIKHIDEAHKVDEKLEKSVYHIAQYVK >NC_009495|1684282:1691348|1687741_1688173_+|WP_011949100.1|DBSCAN-SWA MYTLKVEHNFDSAHFLAGYEGKCGNIHGHRWKVEIQVQAESLVQGGQLDGMIIDFGDLKKDVKSMVDYYDHALIIEKGTMRGQSLSSLKEDGFRIIEVNFRPTAENFAAFFYKIMKDRGYNVKSTTVYETPNNSATYEESGVI >NC_009495|1684282:1691348|1688174_1688840_+|WP_011949101.1|DBSCAN-SWA MDFKVVERFVSINGEGRRCGQLAIFIRFAGCNLNCSYCDTLWANEKDVPYEVLSSKDIYEYIKSKEVKNVTLTGGEPLLQKGIMELLKLLSKDKELYVEIETNGSILLDEFLNIENSPSFTMDYKLPLSNMENKMALDNFKYLTKKDTVKFVSGSIEDLEKAREIINKYNLVDKTNVYISPVFGKINLDTIVEFMKNNRMNGVNLQLQLHKIIWEPSKRGV >NC_009495|1684282:1691348|1685850_1686846_+|WP_011949099.1|DBSCAN-SWA MKKIGLTTTVPVEVIVAAGYTPVDLNNMFITSENYLKYIDIAERDGFPKSLCAWIKGIYGACLENNIKEIVGVMEGDCSNTKALIEVFKLRGIKIYPFSFPHSHSLKDVEIEIRKFMDIFNVNEDKVEQVRKRLNRVRKLAKKIDEMTYIDNKVNGFENHLYQVSLSDFNGNIDEFEEHLKKVIEGMEKREPINKKLRLGYIGVPPMTGDIYEFSEKLNAHFVYNEVQREFAFPRGIEAANIFEQYYNYTYPYDNEFRIKELKKQIEKRKIDAIIHYTQAFCHRAVEDIVLKEELNIPMLNIEGDKLNTLDARTKLRLEAFLDMLLDLKQK >NC_009495|1684282:1691348|1686962_1687724_+|WP_003358645.1|DBSCAN-SWA MRLLGIDLGSREVKIVLMENNIIVQKKKVSTMKFYRDYCSFHGKIVVDLEKLNIEGIDKAISTGYGKNNTDLEFFTPINEIKAHVYGGIYQSNLKDFILLDVGGQDVKVVKVEKGVATDLELNEKCAASCGRYLENMANVLEISLDEMSQYSENPVDLNSTCAVFSESELIGKIAEGVHIERLCAGVNYSLYKRLQPLLSKFRGKKLVITGGVANNHSIKKYLNNDYEEIVSVKDPQFNGAIGCCYYGSKFLK >NC_009495|1684282:1691348|1689617_1690277_+|WP_011949102.1|DBSCAN-SWA MNKEKAIVVFSGGQDSTTCLFWAKKKYKEVIAVSFDYNQKHKLELDCAKDICKKYNIEHHILDLNLLNQLAPNSLTRQDITVDKSAPKEGVPNSFVDGRNLLFLSFVAVFAKQKGINTIITGVSQSDFSGYPDCRDVFIKSLNVTLNLAMDYEFEIITPLMWINKAETWKMAYDLGVLDIVKEETLTCYNGIKADGCGECPACKLRKKGYWEFEKEYLK >NC_009495|1684282:1691348|1688843_1689434_+|WP_004451708.1|DBSCAN-SWA MAIDVKAIEEHIRGILIALGDNPEREGLKNTPKRVAKMYEEVFKGMCYSNDEIAEMFNVTFEDDLCINDNENDMVFMKEIEIFSHCEHHLALMYNMKVAIAYIPKKKIIGLSKIARIADMVGRRLQLQERIGSDIAEILQKITDSEDVAVIIEGEHGCMTTRGIKKPGTKTITTTLRGKFNTDPIVSNKLMMLYTK |
8 | uncultured_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1822763 : 1878926
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NC_009495|1822763:1878926|DBSCAN-SWA ACTAAAATAAATCATCTAATTTATCAGCTATAGAAGCACCTTTGTTAGGATAAAGATGTGAATAAGTATCTAATGTAGTTTGAATATTCTCATGTCCTAGCCTTTCTTTAATTAATAAAGGACTAAATCCAAGTTCTATAAGTAAGCTAGCATGGGAATGTCTTAGATCATGAATCCTTATTTCTTTTACACTGCTTTTCTCACATGCATCTCTCATTGAGTTTTTTAAAATGTGTCTACCTACTGGGAATATTCTTTCATTCTTATCAAAGTTATATAATTTCTTCTTATAATTTTCTATATCTTCACATAGGAAGTCTGATATAGATACTTTCCTTTTACTCTTTGGAGTTTTAGGAGGATTTATTATATCTTTTTTATTTATTCTAGTATATGTTTTGGTAATAGATATAATTTTATTTTTAGTATCTATATCACTAAATGTGAGTGCTTCTAGTTCTCCCTTTCTTAAACCTGTCCAAAATAATATCTCAAAGGCTAATTTACACATAGGATTATCAACACACTTTATAAATTCTTTATACTCTTCCAAAGTCCAAAATTGCATACCTTCAGAATCTTTCTTGCCCATTGGTCCAGCCTTTAAAGCAGGATTACTATTTAAATTATAATACTTTATAGCAAAATTAAAGATTGCATTAAGTTGTTTATTTACTGCTTTTAAATACGTTTGTTTGTAATCTTTACTCATAAGCTTATTTTGCCATTTTCTAATATTGTTAGGTGTAATGTTATTTACATTCATATCTTTAAAATAAGGTAATATTCTTTCTTTTATAATTATTTCTTTAACTTGAAAAGTTGTTACTCTTATTCTAGTCTTTGAATGTTCTAAATATAAATCTGAAAGTTCTTTAAAATTCATATCACAATTATTTTTCTGTTTATTTAAAAATTCTCTTTCAAAATCTGCAGCCTCTTTTTTCTTCTTAAATCCTTCTTTCTTTTTTCTTTTCCTTTTACCTGTCCAATCAGTGTAATAAAAAGTACAAAAATAAGTTCCTCTTTCTTCATTTTTATAAACAGCCATTTTTTTTCCCTTTCCTTTCTTCTTTCAATAATATTTCTAAAAGCTTTACAGGATGAACTTGTAAAGCATGAGATAATTTTTTTAGTTTGCCTATTGTCATAAATTCTATTTCGCCATTTTCTAATCTGCTTATATAAGGTTGCTCTACTCCAATTCTTTCTCCTAGAGTTTCTTGTGTGTACCCTAGTTTCGTCCTTAGTTTCCTCAATTCGACATCACCCATTATAATTGTATAATATTCTACAAAAAAGTAACGTGAAAAATGTCGGAAATATATCTACCAGTTATATTTTTTGTGTTAATATTATGACACAGAGGGGGGAATCATATGAATAAAACAAAAGGAGAAACTATGGAGGAAACTATACTAAAATTATTAGATTTACAAAGTACTCTATTCTGTTTCTAACATTTGCAATTTTAATTTTATTTCTAACTCTAAAGAAGTCCAGATAAGTTGTTTTACTTCATCACTTATTGGGACTTCTTTTATTTGCCCTCTATTTATTAAACTATCTATTAACATATTTGTAGTTTCTAATGTTGATAATTTTTTTATTTTCTTATTTCCTATTAGTTCAGTAATAGGCTTTCCGAAATATTGGGACAATTTCTTAGAAGTATCTATAGAAGGTTCTCTGCCACGCTCTAAATGGGAAAGAGTGCCTCTTGTTATACCTATTAACTTAGCGTATTCCTCTTGTGTCATTTCTTTCTGTTTTCTATCATTTTTCAAAATATCTTTTAAACTCATCATTATTCCTCGCTTTCTTTGTACATAATAGCACATGCAAGCGCGTTTTGCAAAATGAAAAAAATTACATTTGGCAATAATTCTTTGAAAATAGTAGTAATATCTAGCATTATCTAGCTAATTCATCTATTTACTATGTAATGCATTTTCAAATATTTGCGCGATATTGTGCGCGCATATATAATTAAATTGTAGCAAGGGCGAACACGAAAAACCTTGAATGTTCTTTGAAAATTGAATATCAGACAAAAGAAAACTTACTAAAGAAGGGCAGAGAAGTTAAGCATTTAGCGAACCAAGCCCAACGCTTTTAATGTAGCCACGAAAGTGACAGTCCCAAGCCTGATAAATACAGAGGGAAAGTGAAAACAAGGGGGATTACACATGGAAGAATTAATAATTAAGTTGTTGCAAATACAAAAAGAAATAAAGGAAGGGGAGTTAGAGGGTGACAGTAAGTAAGACATTAAAATACGAAAGGCTTAAAAGGGGAATGACACAAAAGGAATTTGCCAAACTACTAGAAACAGACAGGGGGTCTATAGCACATTACGAAAATGGGAGGATACCACTCCCAGCAACATTAAAAAAATTTAGTGATAAATTAGATGTTGATTTAGCAAAAGCGCTTATGGAAGGGGATATGTAAATGAAAGAATTGCAAGTATTAAACAATAAAAACTTAACTTTAGAAAGTACAGAAGTATCTGAAATGACAGGCAAAGAACATAAAAACTTAATGAGGGATATAAGAAATTATGTTGGTATTCTGGAAGGCTCAAATTTGAGCAGTCATGATTATTTCATAGAATCAACTTATATAAATTCACAGAATAAAGAACAACCATGTTATCTACTTACAAAAATGGGTTGTGAAATGGTAGCAAATAAAATGACAGGTAAAAAAGGAGTTTTATTCACTGCTAAATATGTTAAAAGATTTAATCAAATAGAACAAAATGAATTACCAAAAATAAGTACAGAGTTAAGAGCTATATTAATGCTAGATAATAAAACAATTGAGATAGAAGAAAAGGTAACTAACTTAGAAAATAATATCCCACTTTTTAATGTGGAATGTAAAGAACTCCAAGCATTAGTAAGAAAAATAGGTATTAAAACACTAGGAGGTTATAAGACACCAGCCTATAATGATAGATCATTACGTACAAAGGTATATACAGACATCCAACACCAGTTAAAAAGGGAATTCGGTGTTACTAGATATGAAGCAATAAAGAGAAAACAATTAGATAAAGCAAAAGAGATATTAGTAAGCTACACAGTTCCAGTTTATTTAAAAGAAGAAATATTTAATACAAACAATCAAGAAGAATGGGAGTGCTAAAATGAGTAGTTTTTATAAAGCGAAGGAAGTAGCGAAAATATTAGATATAAGCGTTACCCAATCTTATAGAATAATAAAAAAACTTAATGAAGAATTAGACAAGAAAGGCTATATCACTATAGCTGGTAGAGTTCCTAAAAAGTATTTTGAAGAAAAATATTATATCTAAGGAGTGTTATGTATGAATAAAGAACAAATTGTAAAAGAGAAAATAGTATCTCTTTTCAGAAAGCATAATATGGAAGGTTCAATTACTCAACTGTTTGTGTGTAGATATTTTGATACTAAGGATATTGAAGATTTAAGAGTATTAGAACGAGCAAAATTAAATCCGCAATTAAAAATGGAATTAACTAATTTACTAAGAAGTTATTTTAACTCAACTAATAAAATGACACCATATGAACAACTTATAAAACAAATAGAAGAAAGCTTTAACTACAGTAATACAGATGCAGAGGAGTACGCTAAAAAGCTAAAAAACTTGTCTTTAGTAGCATTAGAAGAAATAGAAAGAGAATTTAAAAATGCTTAGAATAGGTGAAGTTATATTAGCTATATACAGCTTAGTAATACTTTTAGCTTTTATAGGTGTAGATATCAAACAACTAAAAAAGATTAAGGACAATGGATGGCTTACAGTAATATTTATACCTATAATAATATTCCTATTAAACATTATTTGGAGGTGTTAAAGATGGATAAAAACTGGTGTGCGTTATTAATAGCGATATTGAGAGAAAAACCATGCACCAGAGAACAAGCGGCAGAACTTTACGACAAAGGGACATTATTTAGAAATAAAAGACCTAAAGAGGATATAGAGGAAATGATTAGACTAAGAAAACAAGGTCTTAAATTTAAAGAAATAGCAGAAATATTTTGTTTGGATCCAAGCACAGTATGTACTTTAGTAAATAAAAAAAAGCTTCCTGCAAGAAGCTAAACATTTAAATAAAAAATCGTTAGATACATTTTATAACAGAATAGAGGTTTTGTAAAGTGCGAGTAATTAAAGGTTGTAAGAGTTGTACACATTATGTATTACAAGTAGTAATAGGCAATAATAGGCAACAGTTATTATGGAAGCCTGCTTGCATGACAATTCAATGTATTAAAGAGGGGGATATAAATAATGAGCCAAAAGAAAATATTTGAATTAAGAATTTTAAATACAATGGACATTAGAACAATGAAAGAATGTAAGGGAATGAAGAAGGGTTTTCACTATAAAAGACAAATACACCATTTAAAATTTTATAGAAATGATAGAAATATAACCGCAGTAATAACAAATGAAAGCAGAACAATCAAAGGGATAGGTATTGCTAAATGTAACCCAAAAGATAAATTTGATATCAGAAAAGGATTACAACTAAGTGAAATAAGAGCCAGAGGAGATTTTTATAAAAATACAGCTGAAAGATTTTTAAGGGAGGAGTTTTAATGGCTAAACAATTTGTAGAAGGTAATAAATATGTTTTTAGTGCTAAAAAGTTTAAAAATCATATGGGAAAGAAAAAATATGAAACAAATAAATGTTGGGTTAATGAAAGTAATGGTCGTGAAGTAACTATTGAATCAAGTGTTACCGGAGGGTATAAATATTATGGAATAGTTCCACAATGGTGCAAGTGTATAGAAAATAATCAAGGCAGGCTATAACATGGAAGATTATTGCGAAGATTGTATTCATTTTGTATTGCAAAAAGTTATATGTCAAACGGATAGAGGAGAACAAATCTTATATGAACCTAGCTGTATGGCGATTAGATGTAAGAAGGAGGTAAAAGAAGAATGAAAAATCAAGAAACTTTTAAAATAGAAGACTTGAAAGGTGCTAGTTGGGCATTAAGAAAGATAAAAGAATGTAAGGAAAGCATTTTAGAAAAAGAAGAACTCGCAAAAATAGAAAAAGAAAGAATAGAAGAATGGCTTAATAATGAAACCAAGAGCGATTTAGCGACACTTGAATACTTTAATGGATTATTAATGCAATACTATAAAGTAATAAAGCAGAATGACCCTAAAGCTAGAATAACAACACCTTATGGACAAGTAACAAGTAGAAAGAATAAAAAATGGAATTATGGTAATGAAGAAACACTATTAAAATATCTAAATTCCAACGGATATAAAAATCTAATTAGAACCAAACAGGAAATCAATAAAACAGATCTTAAAGAATCATTTTTAATAAAAGATGGAATTGTATTAGATAAAAATACAGGGGAGGTCATTCCAGAGATTAGCATTGTAGAAGAAGAAAATATAAATGTGAAGGTGGAAGAGTAATGAATGTATATGAAAAGTTAATGAATGTACAGGCAACTTTAAAAGCACCTAAGAGCCAATACAATTCATTTGGAAAGTACAGCTATAGAAGTTGTGAAGATATATTAGAAAGTCTTAAACCACTTTTAAAAGAAAATAAAGCAATAGTAAATATAACAGATGAAGTTGTGGAAATAAATAATAGGTTTTATATAAAAGCTACTGCCACTTTTATGGATATAGAAAAAGGGGATAAGGTACAAGCGTCCGCATTAGCCAGGGAAGATGAAACAAAGAAAGGTATGGATCTAGCACAAGTTACTGGGAGTGTAAGTTCTTATGCTCGTAAATATGCCTTAAACGGGTTATTTGCAATAGATGACAACAAAGATAGTGATAGTACCAATACCCATGGGAAGGGTAATAAACAAGATAATACAACACAAGAAACCAATAAAGCATACAAATGCAATAAATGTGGTGTTCCAGTAGCAGAAAAGGTAGCTAAATTTAGTTATGGGAAGTTTAAAAAAGTATTATGCTTTGATTGCCAAAAGAAGGAGGGTTAATATGTTAAGTTCAACCTTATACGCAGATAAGGAAACTCAATTAACCATGGATCAACAAGATGATAGATTTTGCTTAAAGTTAAGCCAACTATATAACTATGATTTCAGCGTAGTTGGACAAAGAAAAGTGTTTGAAAAGCTATTAGAGCTGATAGAAAAAAATCTATATGATGAAACAACAACAAATGAACTATATGAAAGGCTAGTAGAGAAAGAATTATTACTAGAACAAGCAGAAAGCCAAATACAAAGCCTAGAGGACAGGATAGAGTTTTTGCAAAGATAAGGGGGATTATATGGGGGAAGTAAAATGGAAAGTAAAATGGATAAAAATTGTTACAGATATATTTGACGATGAAAAAATACTACTAATAGAAAATATGCCAGAAGCAGACAGCATTATAGTGATTTGGTTTAAATTATTATGCTTAGCTGGGAAGATGAACAATAGTGGAGTGTTCATGTTAAATGAAAAAATAGCGTATACAGATGAAATGTTAGCAACCATATTCCGCAGACCTTTAAACACTGTAAGACTTGCTATAAATACATTCCAGCAATTCGGAATGATTGAAGTAATAGACAATGTTATAACTATTCCTAATTGGAGTAAACATCAAACCTTAGACCAATTAGAAGAAAGAAAGGAATACATGAGGGAATATATGAAAGGATACAGAGAAAAACAAAAATTATTAGCTACTGGGGAATGTAAAGTTAACAGTAAAACTAACGGTAATGTTAACAGTAAAGCTAATGTTAACTCCCTAGATATAGAAGAAGATAAAGATATAGATATAGATATAGAAGAAGATATAGATAGTACAACTGAAGTTGTTAGTAGTAACAAGTTACAACCAATAGTAGATAAATGGAACTCTTTAAACCTTAATAAGTTAATTGCTATTAATAAAGGGACTATCAGATATAAATTATTAAATGCAAGGATAAAAGAGTATGGTATTGATAATATCTTGAAAGCTATTGAAAATATAGAAACCAGACCATTTTTAAAAGGACAAAATAAAAAAGGATGGACTATAACCTTTGATTGGTTTGTAAAGCCTAACAATTTTATAAAAGTCCTAGAAGGTAATTACACAGATAAGGAGGGAGTTAATGGAGGGATTAAACAGAATACTGAAGGAAGTAAGAAGCAAGAATATAACTTCTCCAAATACGAAGGTTGATTATAAATGTAATAAGTGCCAAGATACAACTTTTATAAAAACTGAAAATGGCTTTACAAGATGTGAGTGTTATAAAAAAGATTTAACAAAAAGAAGATGGGCGCATTTTGGAATAGACCCATCCAAGGTTAAAAAAATAAGCCAATATGCAGACTATAGCGACATAACTAAAAGAGCTAAGCAAGTCGCCATAGACTATATAAGGGATTATACCACAATAAAAACAAAAGAGGAAAATAATTTAGCTTTTTTAGGACAACCAGGGGCAGGAAAAAGCCATCTAGCAATAGGGATAGGAGCAAACCTCATAAATAGTGGTATATGTACTAATGTTGTTTATATGCCATATGAGGAAGCTATGAGAGAGTTAAAGGCTAACACTATGAATGAAAGTTACATGGAATTAACAAAGCGATATACAGAGTGTGAGTTGCTTATAATAGATGATTTGTTTAAAGAAAAGATTAAGAATGGGAAATTGGTTGGAGAGTTAACAGAATCAGACATAAAACATATACAGCCTATAATTAACCAACGCTACCTTAATTGTAAGCCAACAATTTATAATAGCGAACTTACACCAGAACTATTAATAAATTTAGATCAAGCCTTAGCAGGAAGGATTTTAGAAAAGAGTAATATAGTTATCTTTAAATATGGATTGGAGAATAACTACAGAATGAGAAAATTTGTTTAGGAGGCAAATAAGTATGAATAATATGACAGATGGCAAGAAAGATGGTTTAGCATTAGTTTATGTAAAAGATAGTGTAGCTTATCCAGTTGCATTGAACAAAGAACAATTAGAAATGTTAGATATAACTATAGGAATGTGTTTAAGTGATGGCATGAAAGTTATTGGAGATAAGCCTATAGGAAAGGTTACTAATTTAGTTGAAAAATAAGGAGGAAGAATTGTGTTAAATAAAGAGCAAATAGAACAATGTAGAAGGATAGTTAAATGCAATGGAGTAACATTGCAGAAGTTTGTAGCTATAGAAGAATTAGCAGAGTTACAACAAGCTATTAGTAAATATCAAAGAGAGCCAACTATATTTGGAATAGATAATATAGAAGAAGAAATAGCAGATGTCCATATAGTTCTAGAAGAATTAAAAATAATATTTGGGATAGATAAAGAAGAAATAGAAAACAGAATAGATTATAAGTTAGATAGAGAACTAAAAAGAATTAAATGTAGAGAATTATCAAAACAATAAATTATAAAAAGTTCGTAATTTGAAATAAAAATGTGAAGTTAAAAATTGAAAGTGAGGAAGTTAATATGAATAATTTAGAAAATAGTATAAAGGATTGCATTACAAAGGAGATTGAAAAAGGGATTATAGAAAAAGTAATTGCAGAACAATTAGAAAAGTGCATTGAAAAATCAATAAGTGATATGTTTAGTTGGGGTGGAGATGTAAAAAAGGTTGTAGAAGAAAAAGTAAAATCAGTTATGATTCCATATTTAGAAAACTATGATTACTCACAATACATTGTTAAGCTAGATAATGTATTAACTGATGTATTAAAAAGTAGTACCTTAGAAAATAGAAAGTTACTTGAAAATTTTAAGAATTTAATGGCGAGTGAAGATGTTTCAAGAGAGTTAAAAATAAGCGATATTTTCTCAGAGTGGAATGAATATTGTAAGGCTGAAATTGATAATGATGAATTAGATTTTGATTGCGGTAGTGCATATATTACTACAAGTTTTGATGTTGAAGAAGTTAGTGAAACATGGAGCAGTTATAAAACATTTATGGTTAGATTTGAATGTGAAGAAGATGAAAAGTTAAAATTTGAATTTAGCATACATGCATGGAAACCAAAAGATGGTAGTAAATATACTAGCCAATATATGAAAACTACAGATTTAAGAAGTTTAAGATATTTAAATGATTTTGAAATACTTATGATGAGAATAAGTGAAGGTTATGAAAATATAATCTTAGATAGTGAAGGGGATAGTGAAGATATATTTATAGAATATGAAGAATAATACACAATTTGAAATTTATGCGACATAAAAGAGGTGATAAGTTGAATACAGCAGTAATGTTTAGTAGTGGAACAGATTTATGGGCTACACCACAAGACTTCTTTGATAAATTAAATAAAGAGTTTGATTTTGATCTAGATCCATGTGCTACCCATAAAAATGCTAAATGTTCTAAATATTTTACCAAAGAAATAGATGGACTAAAACAGGATTGGCAAGGATATAAAGTATTTTGCAATCCTCCATATGGTAGAAGCATAAAAGATTGGGTAGAAAAAGCATACAAAGAATCTAAAAAAGAAAATACAACAGTAGTAATGTTAATACCAGCTAGAACAGATACAAGGTATTTTCATGAGTATATTTATAATAAGGCTAAGGAAATAAGATTTGTAAAAGGAAGGTTAAAATTCGGAGATGCTAAAAACTCAGCCCCATTCCCAAGTATGGTTGTAGTATTTTAGTGTCACAATTCAAAGAGTAAATCCATGAATGAAACTTATATGAATTAACTATAGGAGGAATTAATTATGATATGGTGCAATGATTCAATTGCATTTAAATGTAATTTAGAAAAAGATTGTGAAAAACGTAAAAAAGAAGGTTGTGCTTCATGTGAAGACCATAATGATTGTTTGTTTTGTCAAAATAATGGTACTTGCAAAGAAGCAGTTTTAAACCCTTACGATTAATTTCGGTGTCGTAATTCAAAAATTTAGTTCCAGGATTTGAAATTAATGTGAAGGAGTGAGAAGGGTGCAAGTCGGAGATATAGTTTATTTTAAAAGTAAAGATGAAGAAAAAATCACACCAGGAACAATAATTAAAGCTAATGAATTAGAGATAACTGTTCAATATATAGATTTTAAAGAACCCCATATTATTGAAGAAATAGTAAATAAGCCTTTGAAATATAAAGAGAAAACATATGTAAATAGGCAGAAAGATATTAGCATATTGGATATAAAAAATAATTTAATAGAATTGTTTTTAGTACATTCTATTAGCCCAATAAATTAGGACGTAATTCAAAGAGAAAGGAAGTTAATAAATGAGTTTAAATGTTAAAGAATTAAAAGAATTTATAGAGGATTTACCAGATGAAATGGAAGTTGTAATACAAAGTATTGTATCTGGGGATGAAGAATATTGTTCTGAAACTTTAGATATAAGTTCAACTATAGATGATAATAGTGGAGATAAGTTATTAGTACTAGACCCTAAAGAAGTAAGTATAAATAATGTTGTTGAAGATGAAGAAGTGGAAGAAATTGCAGATTACCTTATAGAATTTGCTAGTGATGCTTTTGAACATAAAGATAGGGAAGAACTTATAAAGGCTTTAAAACACTATGGAAAATGGATTTAGTTCACATTTCAAATATTGGAGGTATAAAGATGATTTGTTGGGATTGTGGAAAAGAAATTGATGATACATCAGCAGTATACGACCAATTTAGTTGTGATATGTGTGATGTAACACTTTGTAGAAAGTGCTATGGTGAGCAAAATGGGTTTTGCGAAGAGTGTTTAAGTGATATAGAAGAATAATAGAAATGCTAATATTGTAGGGATAATTTGAAATTATTATGCACTAAAAATTGAGGAGGAATAAAGTATGCCAAAATGTCAAAAGTGTGAATATTGTATTTTAGAAAGATCTGGAGAGGAAGAAAGTTTTTATGGTCATTCTTATGTATCTGATTATTCAGAAGAACTGGATTGTAAAAGAGGGCATTATAAAAAATTTAAATTAGATGGAGAAACAGATTGTAAGGCATTTAAGCAAAGAGAAAATTAGTTGCACAGGAGGGGTAAAAAGATGAAAATTTATATCGCTGGAAAAATAAATGGATTAAAAGATTATAAAAAGAATTTTGATAAGGCAGAAACTAAATTAAAAGAAGATGGGTATGTTTGCATGAATCCTAGTATTTTACCAGAAGGGTTTCCATATGAAGCATATATGCCTATTTGTACATCTATGATAGACCAATGTGATTCAATATATATGTTAAATAATTGGGAAACTAGTAGAGGAGCTAGAGCAGAATTGGAATACGCAAAAGTAACCGGTAAGAAAATTTTATATCAAGATTAGATTCGTAATTCAAATATAAGATCCAGAAATGAAATTAAGGCGAATTTGTGAAAGGGTGGTAAAAATGAAATTTCATATGATTCATTTGAAATATGAAGAAAGTAAAAAAGCAGAATTTGACGGTATCAGAAGTTATGATGTTATTGGAGCAAATGGGGCTACTTATTGTAAAAATGTAGGAAGTGCTGAAGCTGAATTCATATGTAGATCAGTGAATAACGCGGAAGAAAGAATGGAGAAAGCTTTTGCTATAGCTAATAATGCTATTTATTTCAATGATAGAAGTGATTATTTACAAGCATTATATGAGACTTGTAAAGCACTTAATCCTAATTGGGAAGATGGATTAATAGGAAATGAATATATTGAAGAATAAATCAGAATACAAAAGTATATCCAGGAATGAAATAATTTTGAGGGAGTGATTCTGTGTTAGAACAAAAATATATACCTTATTTAATTGAATTAGTAAAACAAGATAAAAAAGAGATTATATCAGCTTATATAAACAATGATAAAATACCACAGAGTAAAATGGCGGAAAGAGTTAGAGAGAAAATAATAAATGATTTAAAAGAATTATATTTTAAATAATATTGGAAGTGATTAAATGATTGATTTAAAAGTTAAATTGACATTATCAAACTATTTTAATATGTCAGATAAATTTAATAAATTATCAAAAGAATTTTTAGAACGCCAAAAAATCATTGATGAAATTAAAGAATATATAATTAGAGAAGAATTTCAAGGAAATACTGAAATGGATCTAGCTAATAATATAGAGTTAATTGAGAGAGAAGTGAACGGAGAATGTTATTTAGAAAGTTTGAAGAAATGTGGAGAAAGAGAAATACTAAATTTTTTAAAAAATATGGGATAAAGTATCAACACAGCATGACTTTAAAACAAGTATTAAATGAAATAAAGAGGTTAGAAAAATGAAAATAGGAGAATTAGGAATGCATTGTGGAGAATGTATTTTAATAGAACATTGTGGAGAGCCATGGTCAGATATTGCAATATGTTGTGAAGAAAGGTTTAAGGATGTAGATGAAACTAAATTTTTAAAGCTAATAGAAACATCTCAAAGAAAGAGTAAAAAAGCAAGAATTAACGATGTTCATAAAAGATTGCTTCAAGGAGAATAGACACAATACAAAAATATTAAGTACCTATAGGTATATATCTAGGCACTTTTATACCTATAGTGTACTAGAGTATTAAAACGGTAGTACAAAAAGGAGAGATAGATATAAAACAGTGTGTAATATGTGGGCGATCCAACTCGGAAGCTCACCATATAATTTATAGGTCGGAATGTAGGGCGCTAATAAAATGTAAAAGAAATTTAGTTTATCTATGTGAAGCACACCACAGAGGAACTTACGGAGTTCACGGAAAATGCGGAAAAGAATTAAATAGAAAATTGAAGTTAGAATTTCAAGAATGGTTAGAGGAAACTTTAAATAAAGATTTTTATGGCATGGAAGAAATAAAGGACAGGCTAGGAATATCTACAAATGCGGTTAAAAGCTTATCTAAACTAATAAAACAAAAGAATAGTGTATTTGCTAGAGAAGATATAATAATCGCTTGCATGGGCGGTAAAAGAGTTTTATAAAGGGGGTATTAAGTTGAGCAATAAAGAAAGAGCAGAGAAAACTTATATATTACTTCAGCAAAGGAAAAGAGATAGGGAGAGAGTTAAGAAAAACGATATATTTGCTTTGCATGGAAATAACATGGCTAGGATGCTAAGAAAAAATAGCAGAGGTAAAAGGGGGATAGGGCAGTTTTGAAAATAGTTATAGATGGTAAACCAATGGGAAAACAAAGACCAAGGTTTAATAGTAAGACAGGGAACACATACACACCAGATAAAACAGTTAATTATGAGAACTGGGTAAAACTATGTTACCAACAACAATGTAAGGGAGAAAAGCTTACAGGCGAGGTTGTAGCTTTTATAAATGCTTATTATGTAATACCTAAAAGTACAAGTAAGAAAAATAAAAAAGATATGTTAGCAGGCATTATAAGACCAACTATAAAACCAGATGTAGACAATATAGCAAAAGTAATTTTAGATTCTTTGAATGGGTTAGCGTATAAAGATGATAAACAAATTGTATTTTGTGCAATAAGTAAATGGTATGGAGAGAATCCAAGAGTAGAAGTTATTTTGGAGGAAGCGTAATGAGAGAAATTAAATTTAGAGGTAAAAGTTTAGATAACAATGAATGGGTTTATGGAGGATATTATAATATGCCAGATTGCAGAAAAGATAATCCAAGGCATATTATAGTTTATCAAAATAATGGTCCTGGTCAACTAACTATTCATGAGCCTATAGATATTAATACATTGGGGCAATATACAGGTTTAAAAGATATAAATGGAAAAGAAATTTATGAGGGAGATATATTACAGATAAATATAAAAGATAAAACAATAAAAAATAAAATTATATCAGCTGGTAATGAAGTTGTAGAATATAAAAATTGTAAGTTTGGTGTTGTGTGGGGATGGCATAGAGATTTTATAGGATTAGATGGATTTTATAATGCAAATTTTGAAGTTGTGGGGAATATTTACGAGAACCCAGTATTGCTGGAGGGTTAAATATGGAGTTACAGAAACTAACAAAAGCTATATGGGATACGAGTAGGCGAATAGAAGATGGGGTTAATACTTTAGCTAAGAAAGCTAAGGAGTATGCCGAGGCGGAAAAGGAATATAGATTAGCTTTAGGAAAAGAGATTTTAATACTAAGAGATCAAAAAGTACAAACAACGTTAATACCAGATGTAGCGAGAAGTAATGTTGCAGAATTAAAGTTTAAAAGAGATATAGCAGAGGTAACTTATAAAACGTGTAAAGAAATGCTACAAGGACTACAGGCAGAGTTAAGCGGATACCAAAGTATATTAAGAATCCAGCAAGATATATAAGGGGGTAAATATGGAAATAGGGATTTTAAGAGCAAAAATAATACCATATAAAACCTTTAAAGAAAGGATTAGATTGGTTCGAGAAAATGAAATAAAATACAAAGTAGAAAATATGGATGGGTTTTTATATATGGTTAGGAGGAATTAATATGGGGAGAAAAAGGAAGCCAGTAGATTGGGAATTATGTAAAAAGCTTAAAGAAAAAGGACTAACAGATTTACAGATAGCAATAAGGATGAAAATGTCACAAAGTCAGCTCAAAATACAGAAGAAAATTAGGAGAGAAGGCGGTGATCCTTATGATTAACGCAATAGCTTATAGTACTATAATTATAGGGATTACAATAGGATTAGCGGTTAGGAAAGTTAGAAGCGAAAATAAATAATAAGCTATGAATAAAATACGATTTAAGAAAGGGAGTTTTAAAATGGGATATTGTATAGATAAAGAAGAAGGAATTATTAAAATCAAAAAAGAAAATATGGAATTGGCATTAAAAAAATTATCAAATTTCTTTCAAAATGGAGGAAGTTTAAGATGGGTAAATGGCTTTAATATAGAAGATATGACAGCGGTTGAAGATGATGAAGAAACACCTTTAGAACTAGAAGAAATATGGAATGACCTTAGATATGGATATAAAGAAACCAAAACTCACTATGAAATTGTTGATTTTTTAGGTGAAAAACTAGGTGATGATTTAAAGTTATTTGAGCTGATAGCAGAGTATTGTGAAGATGGATATTTACAGTTTGCTGGGGAAGATGGGGAACATTTTAGGATTGTAATTAAAGAAGGTAAAGCAACTGAAACATGGGCTCAATTAACTTGGAATTAAAGCATAATTTGAAATTAAGACAACAAAATAGGTGTAGAAACAAAACTTCTACACCTAAACTGTACTAGAGTATTAATATTGTAATACTAAGGAGAGATTATTAGTGTTTAAAAAGATTTTAGATGATATATACTGGTGGTTTTGTGAATCGCCTACTATAGATAGATTTGAAAGTTGGCTAGTAAACAATAGATTTGAAACATTAAGTAAATTAGGAATTAAATTATGGGATTATAGAATGGGAGGAGATTTTTTATAATGAAAAACTTTGATTTTGGAAATTTAAAATATAATTATGTTGCAGTGCATTGTAATAGTCAAAGCGAATTAGATAACTTTATAAAACAATGTGAAGAGAATGACATAATAGTAGGTCCAGATAGGCAGTTTGATAAAAATTATGGATATATAATTGTAGATTCTGAAAGGCTGTATTGCGACTATGCAGCTGCCTTAAAAAATGAAGATTATGAAATTATAGAATGGGAAATAGAAAATCTTAAAAAGGATAAGGAATATAGTATACAAGATATTTTAAATATGCAGGAAGAATTAGAGTTTATAGGCAGTAATGGCTTACCGTACAAAATTAAAAATGGGTATTTATGTGTATATTTCGTAAAAGAAAATAAATGGGAAGAAAGCGGTAACTCTATACAAGAAATTTTAAACATGACTTTTACTTTACGTTATAAAGATAAGAAAGTAAGTTTTGAAGAAGCTATACAAGCTTATTTAAAGAGTAAAGATATTAAATGTATATGGAATGATGAAACAATAATATATAGTGATGGTTTTTTAGATTCTGATAATGATAAGTTAACTATGGGACAAATATTAAAAGGTGAATGGTATATAAAGGAGGGACTAAATGGATAAAGAAACATTTAGAAAGACAGAAAGAATGTTATATAACTATTTTAAAAAAGAAGAAATAATAAAATATAAAAGAGATGTAATAGAAATCTTAAAGGATAGAATAGAACAATTAGAGAAAAGAATAAAGGATACCAATGTAAATATAGATTATGATCTACAAGCTGTGCCATGTGGAGAGAGAGTACAAACATCTAATACAGGAGCAAGTTATGCAGAAAGAGCCATAGTGCAAGCTATAGATAGATTGATAAGAGAACAGGCGGATAAGAAGAAAGAAATACTTAATTTAGAAGAAGATATAAGTAATATAGAAAAAGAAAGTAAAGCAATAGAATTTAATATAAGAATGTTGAATGAAGAAGATAAAGAATTTATATGGCTAAAATATAAAAAGAAATTAGGAATAGAACAGATATCAGACCAATTAAATATGAGTAGAGCAACAGGATATAAAAAAAGAGAAAAGATAATAAAAGATATAGTGCATTGGATTGAAGTTATAAAATAGTAGACAAAAAGTAGACAAAGTGTAGACAAATAAAGATTTTGAATGTGTTATAATAGTAGTATAGAAAAAGGATTTTATCGTACAAGGGCAACTGCAAAGCATCCATTAATTTGGGTGCTTCCTATTTTATAGAGGAGAACAATATGTTAAAATTAATGTTGGTAATAAGTACTATGAATGTTGTATTAAACATAATAGCGTATTGGATAGCAAAAAATAAGGTAGAAAAAGTAAGAAGTATAACTACAATCATATGTTGGTTCATTACAGGAACATTAGCTTTTATATTTATATAAATAATATTATTATGTCGAGTGTAGCGTAGTGGTAACGCACCTAGAAGCATGCGGTAACAAGACTAGGAGATAGAGGGTTCAATTCCCTCCACCGACACCATGGTTTAAAGCCAAATATAAATTTAAAGTAAGTATTGTGTATGTACTAAAAAGCACTTAGCATAGTAAATATGTTAGGCGCTTTTTATATAGAAGAAATAATTGTTATAAAAAGAAGGAAAACCTCCTAAAATGTAGAAATATTTATATTAGAAATGGAGGTAATGATACATGGCACAAGAAAAAGATAAGCATATTAATGCATATGATTATGGGGATGATTTTATGTGCCCAGATTGTGGTGGAACTTCAAAAGATGGAAAATATGATGCTGGAAATGGGTTCTGTCAAGATTGTGCACCGAATCATTAATAATTAAAGGGCTTTTAAAAGGGCTCTTTTTTAATACATAAAAGAAGATGAGTTCATGGCAAAGTCTAAATATGAAACTAACATAGAAGATAAACTTATACTAGTCTAATAGTGGACAAGAAATGGGTTTATTTATGAATAAATAGAAAAGGATACTTGTGATTAACTATGAAAGAGATTGGATATATAATTCAAAATATTGGGTATAACATAATGCCGATATCTTTTATTGCATATTTTATACTAAAAATACTTGAGTTTAAATGGAATAAAAAAGGTTATTCAAGTTTAGCAAAATCAATTTGGTATATTGCTGTTGGTATTAGTACTTTAGATGGAGATATAAGGGTAGAAAAATTGGTAATAATGATGATATTTTTTGATGCTTTTGATTCATTCATAGAATACAAAGAAGAAAATAGAAAAAGTAAAAACAGTTAACAATATAAAGTTATTGGAATACATAAAAGGAGGTGGCATTGTGAAGCTAACACCAAAACAAAAGGCATTTGCTGATTATTATATACAAACAGGCAATGCCACAGAAGCAGCCATTAAAGCTGGATATAGTAAAAAGACAGCAAGATTTATAGGAAATGAAAACTTAACAAAACTTTACATCAAAAACTATATTGATGAAAGAATGAAACAATTAGAGGATGAAAGAATAGCTAAAGCGAATGAAGTTCTTCAATATCTCACAAGAGTTATAAGAGGGCAAGAAACCGAGGAAGTAGTAGTAACTGAAAATATAGGAGATTTTATGAGTGAAGCTAAAACAATAAAAAAAGAAATAGGAGCTAAAGATAGAATAAAAGCTGCTGAATTATTAGGTAAAAGGTATAGACTATTCACTGATAAAGTTGAAATAGAGGGTTCTGTTCCAGTGCAAATAGTAGATGATATAGATGAATAAAATTAAGTTAAAATCAATAATAGCTTCTAGTTTTTATGAAGCACATAAAGATATTAAGAAGGGACTTCACACTCACTACTGGTTCAAAGGTGGTAGAGGTAGTACGAAGTCCTCTTTTATTTCTATAGAAATAGTATTGGGAATAATGAGAGATGCACAAGAAGGTAAATTAACTAATGCCCTAATATTAAGAAGAGTAAAAGATACTTTATCGGAATCAGTTAGAGATCAAATTAAATGGGCTATAGATATATTAGGAGTAAGTGATGAATGGCATATACCAGAAGCTAAACTAACCATAACATATAAACCTACAGGCCAAGTGATTAGATTTAAAGGTGCTGATAACCCTAAGAAAGTTAAGTCTACAAAGGTACCAAAGGGATATATTAAATATATTTGGTATGAAGAAGTAGATGAGTTTGAGGGTAAAAATAAAATAGATACAATAAATCAATCATTAATGAGAGGTGGACCTAAGTTCTTTGTATTCTATTCTTTCAACCCTCCAGAATCACAAAGGAATTGGTGCAACCAGGAAGTGGTTGAAACTAGAAAGGATAAGTATGTTCATCATAGTGATTATAGGTTAGTACCTATAGAATGGTTAGGTGAGCAATTTATAATTGAAGCAGAGCATATGAAGAAAGTTAATCCTGCAAAATATGAACATGATTACTTAGGAGCAGTTACTGGTACAGGTGGAGAAGTATTTAGAAATCTAACTATTAGAGAATTAACAGATGAAGAAATCAAAGTATTTGATAGATTAAAAAATGGATTAGACTTTGGTTATGCTGCTGATCCATTAGCTTATGTTCTTATGCATTATGATAAAACTAGGAAAAGATTATATATCTTTGATGAAATCTATAAGGTTCAATTAAGTAACAGCAAGGCGGTAAAAGAGATTAAAAAATTAAATCCACTAAATAAGAGAGTCATAGCAGATAGTGCAGAACCTAGAACTATAAATGAATTTAAGACATTAGGACTTAATATTAAAGGAGCTAAGAAAGGGCCAGATAGTGTTGAGCATGGAATTAAGTTCTTAAGTGAAGAAATAGAAGAAATAATAATAGATCCTATTAGATGCCCTAATGCTAAAAGAGAATTTATAGGGTATGAAATAGAAAAAGACAAAGATGGGAACCTGAAAGGAGAATATCCCGATAAAGATAATCACACTATAGATGCTGCTAGATATGGTATGGAAGATGAAATAAGAGGAAGTAGTATTTCGTTTGACTAAGGAGGTGTTATAGATGATATTTATAGATAAAATACTTAATAGTGGATCTAATTCAGTAATGACTACAGAAGAAATTATCCAGGAAGAAATTAAAGAATGGAATAGTTCACAAACAAGACAATTAATGTTAGATGGAGAAAGATATTATAAAGGCGATACTGATATACTAAAACGTAAAAGAATGGCTATAGGTGAAGATGGAGAATTAGAAGAAGTTAAGAACTTAGCGAATAATAAACTAGTACATCAGTTTATTAGAAAGCTTTCCGACCAGAAAGTAGGATATTTATTAAGTAAGCCTTTAAGTGTACAAACTGATAATGAAGCATATAAAAATGTATTAGATGATATATTCAATAAATCTTTCATGAGATTGCTTAAAAACCTGGGCAAAGACGCAATTAATAAAGGTATAGCATGGGCACAAATTTATTATAATGAAGATGGGGAGCTAAGATTTAAAAGACTTCCCAGTGAAGAGATAATTCCACTATGGAAGGACAAAGAGCATACTAAATTAGATGCACTTATTAGGGTATATGAAGTTATAGTTTATGAAGGTAAGACTAAAAAGACAGTACAAAAAGTTGAATACTGGGACACGAAACAAGTGTTACGATATATTAACGATAATGGTAAGTTGATAACTGATGTTGAAGCTCCAGAAGATGAAGGGCATTTTAGTATGGTAGATGATAAAGGAAATAAACAGTCATTTACCTGGTCTAAAGTGCCTTTTGTATATTTCAAATACAATGATGAAGAACAGCCATTAATTAAGTTTGTTAAGTCCTTAGTAGATGATTATGACAGAAATAAAAGCGACAATAGTAATAACCTTGAGGACTTGCCCAATAGTATCTATGTTCTTAAGGATTATGATGGTGAAAACTTAGGAGAGTTTAGAAGAAATATGAGCCTTTACAGAGCTGTTAAGGTTGCTGGTGATGGTGGAGTAGAAACAAGGAATTTAGAAATTAATGTTGAAGCTTATAAAACTCATATAGAGCAAACTAGAAAAGATATTTATGAGTTTGGTAGAGGTGTAGATACTCAATCAGATAAGTTTGGAAACTCTCCAAGTGGTATTGCTCTTAAGTTTTTATATAATGATTTAGATATGGATTGTAACATAATAGAAACAGAATTTCAGGCATCACTTGAATATCTATTATGGTTTGTTAACCAACATTTAATTAATACTGGTCAAGATGACTTTACTAATGAAAATGTAGAATTTGTGTTTAATAGAGATACTCTTATAAATGAAACAGATAGTATTAATAATTGTCAAAACAGTGTTGGTATTATTAGTGATGAAACAATAGTTGCTAACCATCCTTGGGCCACTAAGGATGAACTAGAAAAGATAAAAAAACAGAAAGAAGAACGTGAATCAATGTATCCTAATTTCCCTTTAGAAGAAATACCAGAGGATGAAGAGAATGAAGAGTAAAGATTATTGGAAGAAACGTTCTGAAGTTGTAGCTGGTAAACAGTTTAAGAAAACAGATAATTATATTCTAAGTTTACATTTAGAGTATATGGAAGCTTTAAGCAGCATACAAAAAGATATAGAAGTATTCTATTCTAGGTTTTCTCAGAACAATGAGATATCTTTACAAGAAGCTAGAAGATTATTAAACTCTAATGAACTTCAAGAGTTTAAAATGGACTTAAAAGAGTTTACTCGAAAGGCTAAAGATAATAAGAATCTACAATGGGAAAAAGAATTAAATAATGTATCTTATAAGGTGAGAGTTACTAGGCTACAAGCTCTACAAACTCAAATAAGGAATAGTATAGAAGATTTATATAGTAAACAACAAGATAATACTACAAGCCTTTTAAGTGGAATATATGAGGATACTTATTATAGGAACATCTTTGAAGTACACAAAGGATTAGGAATAGGTATTAATTTTGCTAAGTTAGATACTAATACAATTAACAAAGTAATTACAGAGCCATGGCATGGTGATAATTATAGTAGTAAGATATGGAACAACAAAGATAAGTTAATTATGGAGCTACAAACTAATTTAACACAAGCCTTTATTCGTGGTGATAGCATAGATAAAACTTCTAAAATAATAGCTGAAAGAATGGAAGTAGGTAGAAACAGAGCTAGAACACTTGTTAATACTGAAAGTGCTAACATTGTTTCTAAATCAACTTTTAACAGCTATATTGGAAGTGGAGTTGTTAAAGAATATGAAATACTTGCAACTTTAGATTTGCATACTAGTAAAATATGTAGATCACTGGATGGCAAAATATTTAAGGTTAGTGAAAAAGAAATAGGTGTTAATGCCCCACCGTTTCATCCCAACTGCAGAACTACAATAGTTCCTTGTTTTGCAGATACATTTGATATAGAAAGAATAGCTAGAGATAGTGAAGGTGAGGTTTATTATATATATGGGAACATAAGCTATAAACAATGGTATGAGAAATATGTTGCTTAAACATTTAAGGCGGTGAAAGTTAATGAATATACCAAATAAAGTTAAGATAGGTGGAGTTAATTATAAAGTTATTGAGTGTAATAATCCATCAGAAGAAGAGCATCAAGTAGATGGTATGATCGTATATCATAAACAAGAAATAAGACTTAAAAATGATATGGAAAAAGAATACAAAGAGAATATATTTTTACACGAAGTTATTCATGGGTTATTTGAATATATTGGTTTTGAACAAGATGAATCAACTGTTATTAGATTAAGCAATGCATTACATGGATTAATAAAAGATAATCCAGAGGTATTTAAATTGGAGTAGGGGTGGTATTGTGTTAAAGACATATTTAATAACAATAGTATTGTTTTACTTGTCTTTTGCTTTAATGTTTACAAGATATTTTGTTAATAAGGATAAGATAGTATCACATCAGAATAAAGACAAATGGTTTACTTATATAAGGCTCTTAATTTTAAGCTTAATGCCAGTTATAAATATATTAGCTACTATATTTTTTATTAAATTTGCAGTTTTTGATAGCAATGAGAATTTTATAAAAATGTTAAATGAATAGTCTTAGAAATAAGGCCTTTTATTTTTTGCTCTTTTTAGTATTTATGAGTATAAACTGAAAGATCACAAGCAGGAGACGACCTGTAGAAAAAGGCTAGTAGGAAAGGAGAAATTAATATGGATTTAAAAGAACTTTTAGGAGAAGAACTTTATAACCAAGTTATTCAAAAGGTAGGTAATAATAAGATAGATGTAGTTAATAATGGTAACTGGATACCTAAAGATAAATTTAATACTTTAAATGAGCAACTTAAAACTGCAAATACGACTATTGGAGATCTAAAGAAAAGTAATAAGGATAATGAAACCTTACAAACCAAAGTAGGAGAATATGAAACCAAAGTTAAAGAGTATGAAAAACAAATACAAGATATGCAATTTAATTATGCATTAGAAGGAGCTTTAAAAGGTGCCAATGTAAGAAATACAAAGGCTGTTAAAGCTCTTTTAAATTTAGAAAATGTTAAGTTAGATGGAGAAACTCTTATAGGTATTAGCGAGCAAATAGAAGAATTAAGAAAGAGTGATTCATATTTATTTTCAGAAGAACAAAAACCTAAGTTTTCAGGAGTAGAGCCCACTGATGGAAGTAAAACACCACAAGGTTATAATCCTTGGAAAAAAGAAAGTTTTAATCTAACAGATCAAGGTAAAATATTTAAAGAAAATCCAGAACAGGCCAAACAATTAATGGCTCAAGTTGGAATAAATCAATAATAAAGGAGATGTGTGAAATATGGGAACAAAATTAAGTGATGTAATTGTACCAGAATTATTTAATCCTTATGTGGTTAATAGAACAATGGAGAAGAGTGCTTTAGTACAAAGTGGGATTATAACAAATAACAGTGAATTTGATGGTCTAGCAAGTCAAGCTTCACCTTTAATTAATATGCCATTCTTCGAGGATTTAACAGGAGAATCAGAGCAAATAATTGAAGATACAGACTTAGAAGCAGCTAAGATTACAAGTAATAAAGATGTAGCGGCTATTTTAAGAAGGGCTAAAATGTGGAGTGCTACAGATTTATCAGCAGCGTTAGCAGGTAAGGACCCAATGGCAGCTATAGGAGAATTAGTAAGTGGATTTTGGACTAGAGATATGCAAAAAGAGTTAATCGCAATACTTAAAGGTATATTTTTAAGTACATCAATGAAAAATAATTTACTTGATATATCAGCTATGACAGAAGGAGCAGCTAAGTGGTCAGCAAGTGCTTTTATAGATGCTCAACAAATGCTAGGAGATGCGCAAGAACTTTTAACAGGTGTTATGATGCATAGTGCTGTTAAATCAGAACTTAAAAAACAAAACTTAATTCAAACTATAAGGCCATCAGATAGCGCAGAGTTTGATGTATATCAAGATAAGAGAGTAATAGTTGATGATGGCTGTCCAGTTGATGTAGGTGGTGTTTATACTACTTATTTATTTGGACAAGGAGCTTTAGCATTAGGTAATGGTAATCCAGTAGGATTTATACCAACTGAAACTGATAGAGATAAAAAGAAAGGTTCAGGTGTTGATTATTTAATTAATAGAAAAACAATGATATTACATCCAAGAGGAGTTAAATTTACTAATGCTAAAGTAGCAAAAGTAGAAGGTCCAAGTAGAGCTGAATTACAAGAAAAAACTAACTGGGAAAGAGTATATGAACCAAAACAAATAAGAATAGTTGCATTTAAACATAAAATATAAGAAGGTGAGTTTAATGACTCAACTAGAAAAATTGAAGAAGCTTTTAGGAATATCCTTAGATGATGATTCTAAGGATTTTTTATTGAAATTTGTACTAGAAGATTTAGAGCAAATAGTAAAAGATTATTGTCATATGAGAGAGATACCAGAAGCTTTAAATAATACAGTCTTAAAAATGGCTATAGACATGTATAGAAATGAGAACCTAGGTGAAGAAGAAAATTCCCTAGGTTCTGTTTCTTCTATTACAGAAGGAGATACTTCTATAAGCTACAGAAGTTCTGCTACTGAATTTAAGGATACCTTAATAAAAGATTATAAAGCTCAACTTAATAAATATAGGAAGTTGGTTTGGTAATATGTTTAAAAGTATAGAGAAAGCCAGGAAACAAGCGAGAAAGGCTATTGAAAGTTTATATGATTGTACTTGTAATATAACTGGAGGAAAAGAAAAGGTTAAAGATCCTGTTACTAAAGAAACTAAATTAATACCAAAAATAAAATATGAAAAACAATCTTGTAAAATATCTAAGCAAAGTTTATCGAAAAATAACCAAACCGATACAGTAAACAAAGTTCTATATGAGATTAAACTTTTTATAGCTCCTGAAGTTGAAATTAAACAAGGTGATGAAATAGAAATTACTAACCAATTTGGGATTATAACTAAATATAAAGCTGGAGAAGGATTTCCTTATTATACACACCAGGAAGTTATTTTAAATAAAGAGGATAAAGCTTAATGGCTAGATTAGCGAGTTTTGATTACTCTGATTTTAAGAAGATGGCCAAGAGTTTTCAAAAGGCACTTGATGAAAGGGTAATTGAAAGATGGATAAGAGAATTTTTATTGGGGATGGCATTTAGAGCTGAAAGAAAGATTAAAAAGAGAACTCCAGTAGGTGTTTATAGTAATCAAGTGTCCTTTACAACTAAGGATGGTAAAGAGGTAAGTTTTACAACTAGTAGCTCTAAAACAGGAGGGCATTTAAGACGTAACTGGCAAGTAGGAAATGTAATAAAGCAAGGTGATGCATATATAGTTGAAATATTTAATAATACTGAGTATGCAAGTTATGTGGAATATGGACACAGGACTAAAAATCATAAAGGCTGGGTTGAAGGTAGATTTATGGCCACAATATCAATGCAAGAAATTGAAAGACAGTTACCTAAGTTTCTAGAAAGAAAACAAGTAGAATTATTAAATCAAATACTTAATGGTAGAGCTTAAAGGAAGTGATAACATAGCAAATATAAATGAGTTAAGGATAGGAATTAATCAAACATTGGATAACAAGTTTCCTAACATAACCATATATAATGAAGAGATAGGGCAGGGCTTTGAAGAGCCTTGTTTTTTTATTAAGGTTTTAAGTTCAGGCCAAGGCAAAGAATTCAATATTAGATATAAGAAAAATATATCTTTTGATATTCATTATTTTAATGATAAGGAAGATATTAATTCAGATTGTAATGATATGGCTGATAGGCTTTATGAGGTGCTTGAATATGTGAAAGTAAATAATAGTTTGTATAGGTCTAATGAAATGACACATGAGGTTATAGATGGAGTTTTACACTTCATGTTGCAATTTAATTATCATGTTTTAAAAGAGATTGAAGAAGCTCCTAAAATGAATAAATTGAAACAGGAGGTATATTTAAATGGCAGATAAAGAACAGGAAGTTAAATTTACTAAAGAACAAATAGTAAACTCAAAACAGTTTACGGTAATAGAAATAGATGTACTTAAAGCTTTATTAAAAGATGAACAGTATAGCTTAAAAGAAGTAAATAAAGTCTTAGAAGATTTTAATAAGAAAGAGGTGAAATAGTATGGCTGGTGGAACTTGGGAAAGACAAAATAAAATTAGACCAGGGGCTTATATAAATTTTAAGTCTAAAAAGCAAGGGCAAACGCCAATAGGAGAAAGAGGAATTGCAACTCTACCATTAGAGCTACCATGGGGACCTGAAAAAGAAATTATTACTATACATGCTGATGATGATTTATCTAAAGTACTAGGTATAAATATAGCTGATGAAAGTGCATTACTTATTAGAGAAGTATTAAAAAAAGCTAAGACACTTTTATTATATAGACTTAATGAAGGGACTAAGGCAACTGCTACATTAGAAGGATTAACTATAAATGCTAAATATACTGGAACAAAAGGAAATAATATTACTATAGTAATTCAAAACAGTATAGATTTTGTAGGAAGCTTTGAAGTTATAACTATGTTTGAGGGTAATAAAGTAGATAAACAATTAGTTAAAGTTATAGAAGATTTGAAGCCTAATGATTATGTTGATTTCAAAGGTGCTGGAGAATTAAAAACCTCCGCTGGATTACCACTTAAGGATGGGTCTGATGGTACTGTTACCAATCAAGGATATACTGATTATTTATCAGTTATAGAACCTTATGAATTTCATGCTATAGGTATTCCAACTAAAGATCCTACTATAAAAGCAGTAGCGACTACATTTATAAAGAGACTTAAAGAAGATGGTAGACAGGTACAGTTGATACTAGAAAATTATCCCGAAGCTGATAGTGAAAATGTTATTACTGTTAGAAACGGTGTTATTTTAGCTGATAATACAGTAATAAAATCCAATCAAGCAGTTGCATTTGTAACTGGAGCTACTGCTGGAGCAAATGTAAATCAATCAAATACTTACTTAGAATATCCAGGAGCTATTGATGTAGATACTAAATACACCAACAGGGAAATAGAAGAAGCTTTATTAAACGGAGAAATAGTCTTTACTATTAGCAATAGAAAAGTAGTAATAGAACAGGATATTAATACATTTAAATCTTTTACAGAAGACAAAGGAAAAGATTATAGAAAAAATAGAGTAGTTCGCACACTTTTTGAAGTAAATAATGGAAGTAGATTATTATGGGAAACTAATTATATTGGTAAAGGTAATAATAGCGAAGATGGAAGAAATTTATATAAAAAGGATGTAATTAAGTTCTTAGAAAAATTACAGGGAATCGGAGCACTTGAGAATGTTGTTCCAGAAGATGTTGAAATTAAAAGAGGACAAGATAAAGATTCTGTAGTAGCTAGAATGGGAGTACAACCAATAGATGCTATGGAAAAGCTATATATGGATGTGGAGGTGGAATAGTAAATGGGATTTCTTAAAGCGGGAGATACAATAAGTGGACAAGAAGCTAGAGGATTTATAACTATAGATGGTAGAAATGAAGAACTATTCTATGCTAAAAAATTAGAATCAAAAGTAGAAAAGAAAAAAACAGAGGTAAGAACTTTGAGTAAAAGAGGAGAACAACATAAAGCTGCTGGTTGGAGTGGCTCTGGTACATTAACAGTATATTATGTGACTTCTTTGTTCAGAGAATTAATGATTAAGTATATTAAAACTGGAGTAGACACTTATTTTGATATAACTGTTACAAATGAAGATCCAACAAGTAGCATAGGGAAACAAACTACAGTTTTAAAAGATTGTAATTTAGATGAAGTTTCTATGGCAATGTTTGATGTAGAATCCGAGGTGCTTGAAGAAGATATGGGATTTACGTTTGATGATGTGGACTTATTAGATAAATTTGGAAAGCCAGTATTAGGTTAATAGGAGGAGTATATTAATGAATAATTTTGAAGATTTTTTAATGGATAGCTTTGAGGAAGTAGAAGAAATAGAAAGAGAAATAACTATAGGTGGTAAAAAGAAAAAACTAAAATTCAAACCGATAAGTGCTGATAAAGGTGACGAACTTAGAAAGAAGTGTAAAAAGATAACAATAGTTAAAGGTCAAAAAATGAGTGAAACTGACCAAGATAAATTTATAGCTAATCAAATAATAGAAACTACTGTTTACCCAGACTTAAAAAATGCAGAGTTGCAAAAGGCTTGGGGTGTTATGGGAGCTGAACAATTACTTAAGGCTATGAAGTCTAAAATGAGTGATGGTGAATACATGGGATGGGGTAGCGTTGTAAGTGAAATAAATGGATACGATAAAGGTATACAGGAGTTAGTAGAAGAAGCAAAAAACTAATCAAGGGAGGGGATGGTGAAGCTAATTATGCTCACTATGCCCTCCACCGATTAAAAATTCTTCCTAGTACTTTTGTTAGAATGTCAAGGGGAGAAAGAGCTTTCGTATACGCTAGTATTGATTTGCATATAGAGAATGAAAAGAAACAAGTGGATAAAGCTAAAAGAAAAAGATAATATTGAAACAAACCCCAATATTTGTTATTATTAAAGTGATTTTTAATAAAGGGGTTGTAATCATATGAAAAAAATATTAAGCACTATTTTTATTGGAGTATTTTTATTAACAATGAGCGGATGTAGGCAAGAAGTTTCTACAGAAACAGCTTCTAAAAATAACACAGAGAAAAAAGCTCAGACAAGTAAAAAGGATGATAAGAAAGACATCATCGATAAAGGGAAAGTAAATGAAATAAAAGATTATTGTGAATTTACAGTTATTGATACTAAATTTGGTAAAAGAATAAATCCGCCTAATCCTAAAGATATGTATACTTATTATGAAGCAAAAGAACCAGGAACAGTTTATTTCGATACGGTAATAGATGTAAAAAGCCTTTTGGCAGAAGGGAAAAGGTCAGATGAATTTTTATCAGTTAAAGTTATTTATGATAATAAATATAAGTACAAAACATTTTCAACAATAGAGAAAGATAAGGGTACAAATTTTACTTATACAAATATAACACCAATAGAACCATTGAAAAAGGGAATGATTCACTTTATAGCTGAAGTTCCAGAAGAAATAGAGAAAGATAATAAATCATTAGTTATTTTAATAAACGCAAATAATAAAGAATTTAAATACGTTGTTAGATAAAATAAAATTATTTCTATATAAATAAGAACTTAAAGCACTTACTTTAATGTAGGTGCTTTTATTATTGTTTGAAAGCGGGGTGAATAGATGGCAACAGTATCTACTGCACTCAAAATGTTTGATCAAATGACGAGACCTCTCCAACAAGTTACTCAAGCTTTAAATTTAACAATAAGTGCTATGGACCAAATGAACAATGCGGCAAATAAAGATATAAGAATAACTAATTCTTTAAATACTGCGAGAGGGGCAATTCAAAGAGCTTCTGCCGGATTACAAGAATTAGTTAATGAGCAAGATAGAGCTCAAAACAATCAAAATAGATTAAATGAATCTTTTAATAGAGGATCCAGTGAAGCAAATGGGCTAACAAGTAAAGTAAAAAATCTGGTAGGTGCTTATTTAGGGTTTCAAGCTGCTAAGAAAGGATTAGACTTAACCATAGGTGGAGGAGCAAGGTTAGAACAACAATTAATAACTATAAGTGGTATGTTAGGTAATAAAGATATAGGTAAAGCTTTCTTTGGAGGCTTGAATAAATATGCTAATGAGAGTGTATATGGGTTAAAAGAATTTAATACTATAACTAGGAGTTTTATTCAATTTACGAAAAATACAGATAAACTTATGGACTTAAATAAGACAGCTGAAAAATTGGCGTTCTTAGATCCAACGCAAGGATTAGAAGGTGCAGGATTTGCATTAAAAGAAGCTTTAGGAGGAGACTTTATGTCTTTAAAATCTAGATTTGGATTTGGTAAAGCTGATGCAGAAATATTAAAGGCATCTAAAAGTATGGATGAGTTTATAAGTAAGTTTGATGAATTATTAGCTAAAAAAGGTGCTAGTGATAAAGCTTTGGAAGAGTTTAATCAATCTGCTGTAGCACAATTAAATAACCTTAAATCAAACATAGAAACTGCGTTTGCACAGGCAAGTGAAACTGCATTAGAAATTATGAAACCTTTACTTAGTAGAATAAATGAAGGATTTAAAAATGGAAGTTTTGAAGGTTTTTTTAATGGCATAAGCGTAGGATTAGATATAATTGTGAATTTAACGATGGAAGCTATGGATATTATTACATCATTAAGTCAAACATTTATTGATAATTGGAGCATAATTAGTCCTATCATTTGGGGAATTGTATTTGCAATGATAGCTTATAATGCGACAATGGGAATTGCATGGTTAACAACTATACAAACTACTATTGCTAAGATTGCCCACACTATTGCGTCTTGGGCAGAAACAGCTGCTATACTTGCCTTAATAATAGCTCAAGATGGATTAAATGCAGCATTATTAGCCTGCCCTTTAACATGGATTATTATTGCAATAATTATATTAATAGCTTTATTTTACGCTGCAGTAGCAGGGGTAAATCATTTAGCAGGTACAAGTGTTTCAGCCACTGGTATTATTGCAGGATCATTTATGGTAGCACTTGCTTTTATAGGAAATTTATTTGTGGCATTTTATAATTTAGTCGTTGATATTATAGCCTTGTTTTATAATCATTTCAGTGCATTTGCAGAGTTCTTCGCTAATGTATTTAATGATCCTATAGGTTCTATAATTAGGCTATTTGCAGCAATGGCAGATGAAGTTTTAGGGATACTTAAAAGTATAGCATCTGCTATAGATACGATATTCGGCTCGAACCTTGCCAATGCAGTAGGTAATTGGCAAAGTGGACTTCAAGGTGCTGTTGATAAATTAGTTGGTAAACCTAAAATTCAATTTCAAAAGATGGATTCTTCTGCAATGCATTTGGATAGATTTGAATATGGTAAAGCATATGATTCAGGTTATACGGTTGGTAAAAACATAGGCGATAAATTTGATTTAGGAAATATATTTAATAAGGGTAATATTCCAGACATGGGTAAAATGCCAGATATGGCAGCATGGAACAAAGCACAAGGACCAGGAACATTGGGAACAGCAGGAGATAGTGGTAAAAATAAAGGTGGTAAACTCCCAAATGCAGGAAATAAAGGATTAAAAGATGCTAATAATCACCTTAAAAATATAGATGATAAAATAGATATTTCTAATGAACATTTAGAAATGATGAGGGATTTAGCAGAAATGGAAAGTATACAAAACTTTGTAACATTGACTCCAACAGTACAAGTCACTACTGGAGATATAAAAGAAGAAGCAGACATAAACAAAATAATATCTAAAATAGAGAATTATATGGAAAATGAATTAGCTAATAGTGCTGAGGGGGTATATGCTTAATGTATAAAATGTATTTAGGAATTAATGATGGTGAAGAAGGATTTATACTCCCAGTGTTACCAGAGAAAATTGAATTTGATGAAGATGGAAATAATAAGACATACGATATAATTAATTTAGGTGAAATTAACACAATAAATAAACCTAAGTTGATGGAAATAAGCTTTGAAAGTTTCTTTCCCAAACATAAAGGTCCTTATGTAAGCTCGGAGCAATTATTTGAACCGAGCTTTTATATTGCAAAGATTAGAGAATGGAGAGATAAAAAGCAAAAGATAAGATTTATATTTACAGGCAGTCCTTTAGAAATTAATGATTTATTTACTATAGAGAATTTTAAACCAAGTGAAGAAGGCGGAGAAGTTGGAGACGTACATTATTCTATAGAACTTAAAAGATATAAAAACTATTCTGCTAAAAAGGTAGTTATAGTAACACCCAAAACTGCAGCAGCTAATCAATCTGTGAAAAAAGTAATAGCGAATTCCAAGGCTACAAGACCAAGCAATACTAATAAACCTAAAACACATACAGTTAGTGGTAATGATACGTTGTGGCATATAGCTAAAAGATACTTAGGTGATGGTAATAAGTGGCCACAAATTTATAATTTGAATAAAGATAAGATTAAGAATCCTAATTTAATATATACAGGACAAGTTTTAAAACTTCCATAGGTGGTGGGATAATGAATATACAATTATTATTAGATAATAAAAATGGAAATGTTTTTGATATATCTGAATTAACAAACGAAGTTACTTGGAAAACCAAGAGAAAAGATAAGCCCTCTAGTTTGGATTTTGAAATATTAAAAGATAAGCAAATTACTATAAATAATGGCGATGTAATAAGTTTTAAAGTAGATGGTAATCCAGTATTTTATGGATATGCATTTGAAAATGGAGGAAGTAAAAATCCAATTACAAAAGTAACTGCTTATGATCAATTACGATATCTTTTATTTAATGATACTTATGTATTTAAAAATAAAAAAGCAAGCCAGATCTTAATACAAATTGCTAAAGATATAGGATTGAGAGTAGGAACTATAGAAGATACGGGATATTTTATACCACAGTTATTAGAAGATGATAAAAAATTACTAGATATAATATATAGTTCTTTAGAAAAAACCCTAATGAATAATAAAAGAACTTATACATTATATGATGATTTTGGATATTTAAACTTAAAAAATATAAATAACATGAAGCAACCTGTAGTTATTAGTGATGATAGTAACTTAGGAGATTATGATTGGAAAAATAGTATAGATAGTGATACTTATAATAGAGTTAAAATAGTAAGAGATAATAAAGATACTAAGGGTAGAGATGTTTATATAGCACAAGATAGCAGAAATATTGCTAGGTGGGGAAGATTACAGTATTTCAAAAAAGTAGATGAAAAAATGAACAAGGCGCAGATTCAAGAGATGGTTAATGCAGCATTAAAGCTTAAAAATAGAGAAACTAAAACTTTAAAATTAAAAGATGTTATTAGCACAGATATAGCAGCGGATTTAAAATTAAGAGCTGGTAGTGGTGTGTATGTAGATATAAAAGAAAAGGGAATAAAACAGTATTATCTTATAGAAGAAGCTACACATAAGTTCCAAAAAGGTAATTTAATAATGGATTTTGATTTAAAGGTGGTGTAGTTATTAATAATGGGAATGATAGATACAATTAAAAAGGCAAGTATGGGAGCAGTTGGAGCTAGTAATCCAGTCAATATTTCATTTGGAGAAGTAGTAAGCACAAATGAGCTGAAAATAAAGGTGGACCAGAAGCTTATATTAGATAAAGATTTTTTTATTATTCCTGAAAGCTTAACTAGATATGAAGTAGATTTAAAACATACTCATACTTATATAAATAATTCTATTGAAAGTAACCTAAATACATCTTTAGATAAGTTATTAATTAGAGAAGGTTTAAAACAAGGAGATAAGGTATTACTTTTAAGGGTTCAAGGTGGACAACAGTATGTAATCTTAGATAAGGTGGTGCAGGTGTGAGTGAGGTTAGTATATTACCACGAGGTGCAATACTTGATGAAGATGTAGAAGTGGAAGAAATAATCGAACCAACAAAAACTTATAAAATTAAAGATAATAGAATAGTAGGATTTGCAGATGGTAAAGAAGCTTTGAAACAAGCAATACAATTGATATTAGGAACTGAAAGATATGAGTATCTTATCTATAGTTGGAACTATGGAAGTGAACTTAATGGACTTATAGGTAAACAAAAAGATATAGCAGAAAGTGAGTTTAAAAGAAGAATAAGAGAAGCTTTGAGCCAAGATGATAGGATTAATAATGTTGATAATTTTATATTTAATTATGATAAAGACGGTGCAGAAGTAAGTTTTACCGTCTTTTCTATTTATGGAGAATTTACTGAAAGTGTGGTGAGATAGTTGTTTGAAGATCAAACCGAAGAAGTGATTTTAGATAGAATGATGAATAAAATATCTAATGATTTAGACAAAAGAGAAGGTTCTATAATTCATAATGCTTTAGCACCAGCAGCCCAAGAGGTGGCTAAAATGTATTCAGATATGGACTACTTTTTAAAATGTACTTTTGCAAGTCCTGATATGCCAGATGAATTTTTAGATTTAAGGGTAGCAGAAGAGGGACTTAAAAGAGAAAAAGCAACTTATGCAATTAAAAAAGGATACTTTTATAACGAAGAAAATGAATTAATAGATATTCCTTTGAATAGTAGATTTTCTATAGAAGATTTTAATTTTATTGCTGTAGAAAAAATTTCTACTGGTTTATATAAAATGCAATGTGAAACAACAGGTATAGAGGGGAACTCTATAACAGGACCATTAATACCAATTGAATATATTGAAGAACTTTCTATTGCTACATTAGGAGAACTTATTATGCCAGGAGAAGATGTTGAAAGTAACGAGAGTCTATATGATAGATATATAGAGCATTTAAATGAGAAACCTTATGGAGGTAATATAGCAGATTATAAAATTAATACTAGGGCTATTGAAGGTGTTGGAACCGTAAAGGTGTTTCCTATATGGAATGGTGGTGGAACTGTAAAAATAGTATTTTTGGATAGTGATTATAGTGTTCCTACAACAGAATTAATAGATAAGGTACAAACTATTTTAGATCCAGTACAAAATAAAGGCAAAGGTTTCGGCGTTGCTCCAGTAGGTCATGTTGTTACTGTATTAGGTGCTAAAGATATAGAGATAACTATAGAAACAAACATACTTTTAAAGAGAGGACTTACTATTGGCCAAGTTCAAGAAGATATTAAAAAAATTATAAATGAATATCTGAAACAACTTAGAAAACAATGGCATGAAGATGATAATACAATAGTTAGAATAAGTCAGATTGAAGCTAGAATTTTGAATGTAGAAGGTGTGGCCGATTTATTTAATACTAAAATAAATGATAAAGAGGAAAATTTAAATTTAGGAACTGAGGAAGTTCCAATGTTTAAAGAGGTGGTATTAAGTGAAAAAGAAATTAATTAATTTTTTACCACCCCAAATATCTGATATAGAAGAATTTAAAAATATAATGGCTACTGAAAATGTAGAGTTAGAATTAATCGAAAAAGGCCAGGAAAGAATTTTAAAAGAAAATTTTATAGACACCGCAACAGATTATGGAATCAAACACAAAGAACAATTATTTAAAATCAGAGCCGATTTAGTAAATGATACATTGGAGTTTAGAAAACTAAGAATTAAAAATAGAAAAATGGATAAAATGCCTATAACTCAAAGGTCTTTGGAACATAAATTAAAAACTTTATTTGGTGAAGGAAATTATAAAGTTGAAGTACTCAATGATGAATATGTATTAAAAGTAGAAATAAATACTTTTGACTGGAGTATGTTTAATGAAATAATAGATAACTTTAGATATATTATTCCATGTAATATGATGTTAAATTCTACTTTAGTGCAAAAAATAAGTACTAGTATTTATTATGCTAGTGCTATAACAAGTGGTGAAGAAATAACTGTTTATCCATGGATGCCTAAAGATATAACATCTAAAGGTAAAGTTAATATAGCTATGGGTAGTAATACAGGAGTAGAAAATATAACAATATATCCTAGGAAGGAGGCTTAATTAATGGTAGAACAATTTTATACAATACTAACTAAAATAGGTAAAGCGAAAATAGCTAATTCAACAGCACTAGGAACTAAGGTTAATTTTTGTAAGCTACAAGTTGGAGATAGTAACGGAAGTTATTATAACCCAACAGAAGACCAGACAGAGCTTAAACATAAGGTATGGGAGGGAAATATAAACTCTATTTCGATAGATGAAAATAACCCCAATTGGATAATTATAGAGGTACTATTACCTAGTAATGTTGGTGGGTTTATGATAAGAGAAGCCGCAATACTGGATGATGAAGATAATGTTGTAGCTATTGCAAAATATCCAGAAACATATAAACCACTAACACAAGATGGAAGTAGTAAAGATATACTTATAAGAACAATTTTAGAAGTGAGTAATGCATCTAGTGTAACTTTAAAAGTAGATCCAACAGTTATATTGGCCACAAAAAAAGATATACAGATAATAACTAGTAGTATGAATGAATTGGATAAAAGAATAACAAAAAATGAGGAAAGTATAACTAATATTAAGTCGGATTTGGCTGATATTACGACAGATAATAAAAGATTAACTAAAGACAAAACAATCACAGGAGCTATAAATGAGCTTTTTACCTCTGCCAGTAATGGGAAAACTAAAGTAGCTACTGCTATTACTGGCAAAGGAGTACCAGCAAGTGGTAGCGATTCGTATGATACTTTATCAAGTAAAATTAAAAATATAAAAACAGGGTATACACAAAATGATTTGATAAATGCTGAGAATGTAGAATTCTCAATAAAAAATATTTTTTCTAAAAATATGGATTCTGGTATGCTATTTTTTATAAAAGATTATATATATGTAATTAATTGGAAGGATTCTATAAAGAAATATAGTTTAGATGGGAATTTAATATTATCGAAGAAAATAGATCATAACGGTTTTAGCTCAGGTTATTATACTTATTTTGATGATATTTATAAAATCTTTTTCCATAATAATTCTTTTTATATTTTTAATAAAGGATTAAAACATAGCGGAGAATATTATTATAGAGTATATGCAGAAACTTGTGATATTGAACGAATATCGGCTTATGACTTTGGAGGCCAGGGAGCTTATAGTTATTATGGTTATGGTGGAGTTGCAATAAATAATGATGGAATTTGTTGTGGATATAATGAATATAGTGGAGAAGTTTTTTTATTTAGTTTAAGTTATGCAGATGTTATATGGAGTAAATGTTTATTTGGATGGAACACTAAATATGACTTTTCAAATATATTTTCAGATGGAACTGATTTTTATATCAGTTCTAATTCTTCAAGTGGTAGTTATTATAAAATTAATGTAAATGGTGATATAACTAAATTAGAAAAAAAATCATTACCTTATGAATCAAATAGTGTAATGTTAGGTGAATATGTATATTGGTATGATTCTAATAAAAAAATATGGAGATATAATATTAAAACAAATAAAACAGAACAGATCGGTTTAGAATGTAAATATATTGAATTAGATTTTTTAAGAAAATATTTATATATTTATACAGGTAGTATACTTCATAAAATAGATAAAAGTGGTAATATTATCTGTTCTTATAATTGTACAGATGATCATTTTTTAGGATCAGACAAAGATGGTTGTATATATTTTTATAATAACAATGTTATTAATAAAATCAAGCTAGCTTATAAAGTTTTAGTATAATAGTATATCAATTAATATAGGAGGTAGAAATTATGATATTTTTAGGTGAACTAAAAAAGATTGAAGAAAATAAAATTAAGGCAAAATTTATACATTATATGCCTTTTAACAATGTTTATGGTCTACACAAAACAAAAGAAGAATTAGAACAAGAAGGAATTCTTATAGAAAATATACCAGAACCAAAGTATATGGAAAATAAACAAGCCATAATGTACTGGAATCCTGCAGATAAATCAATATTCTATGAATATGAAGATGTTCTGAAATCTGATAAAGAATTAGAACAACAGAAACAACAATCCTTAAATGCAAAATTGCTTAAAGATAATGCAGAGATACAAATAGAATTAAATAAACAGAAAGAATTAAACTCATCTTTACTATTAAGAATAGCAGAATTAGGAGGTAATGCAAATGCTTAGTTATATTAAAGAATATTACAATATGGGACTTTATACTAAAAGTGATTTAGATATATTTGTTAAAGCTAAATGGATAACTATAGAAGAAAAAGAAGATATAATTAAGACACAATAGATAAATTATATACATTTATACTTATTAGAGTTTATTTATAATTTGAAGTATGTATTGTATAATTTCTAATAACTAAAAGAGTTTATAGAAGAAGAACAATAAAGCTATATGGAAAGATAATCAATGTATAAAATTTACATTTTTGTTTTCAGATTGACAAATTTTCGTATATCATATATACTATACAAATGATGCAAATATTAAAAAGAAGGGTTTAAGAGGTTAGAACAGATATTAATTTTGAAGAATATGAAAATTTAATTGGAAAACTAAGTAATCCAAAAGTAAGAGAATGGTATATTTATCATGATAAAAACATTGTTAATAAAATAGATAAATCATTAGCAATAAAAGAGCAAGCTATAAAGGCTCATTTATTAAGAAACAAATATAGAATGCAAGCTAGAAAATTAATGAAAGATAGAGAGTTAGCAGCATATTTGGATATTAATAATTCTAATTTACCATTTGAGTATTATGAAAATAAATATTTAAAACAAGGATACACTGGTAATTTACTTTATAGAAAAATATTAGAAGCTTCAAATAGGACAAATAAAGAAGTAAATAAACAATTAGGAATAATATAATAAGAACTGGAAGGCACTTAATAAGGTGTCTTTTTTAGTTCCCAATAGTGAGTATTTATAGATATAAATACTTGTAAATGGCTAAAAATAAAGGTTTATGAGTATAAATGGATATAATTAGTAATCGATAAATAAGGCGACATAACTAAATATTTTATAAAGGCAAAGTAAGCACCGAGTAGGTGTTTTTATTTTGCTTATTTTTAATTTGAAAGGTGAATTATTAATTACAATTTGGTATTATAAGGTGGTAAGTATAAATTATAGTTATATGGGGGATTTTTATATGAGTAAATTAAATAAATATATTGAATTAATATTTGTAGGAATAGTTACAGCCTTATTATATTATTTTACCTATATGTTTCAAATAGGATATTTGTCTTATTATAATATTCCAAGTTCATTTGCAGAAATCAGTTTACCTATTATGATAAGAATAATGATATTTTTATTTTTTATTACTACTTTCTTTTTATTATCTATACAGGGAATGTTTAGTTTTTTAATAGATAGATTTCCAAAACGGGTTTCTAATGATGTTAGAATACTATCCATTTTATTATTATGTGTACTTTATTTAAGTTCTTTGAGTGTAAAATATCATAAAATTTCTGTTCTATTAGTATTTTTAGTACTTTTAACTATATTAAAAAGATATCAAATTTATAAAAAATGTAAACAGAAATATGTGAAGGAAGAAAAAAGTGATAAAAATACACCATTATTCTTTGAAAATATAATGAAAAATTATCCATCCGTTTATAATATATTATTATATATGATTATAATCATGTTTATAGGTAATTTTGTGCAAATCATAGGAGGGCTAATTGCTGAATTTAACCCAAATGAAGTTGAGATTAATATAAATAACAGAAAAGCCGTTGTAGTTTCAGAATATAAATCTAAGTTAATTATAAAATATAAAAAAGCTAATTCAAGTAAACTTGAAGATGGATTTAATATTGTAGATATAAAAGATAACTTTAAAATGATTTTAAAGGAAGAAAAAGGAGTATTTAATATAGCTCCTTTTTAGAGGTGATTTTTGGAGGTGTAATGTGGATTCTAATATACAGCAGGAAATACTAGAAAGAATAGTAAGGATAGAGACAAAGATAGATGGATATAACAGTACAAGAGAAAAGGCAGATGTAGCATACAATAAGGCTTGCCAAAATGAAAAGTATATAGCAGAAATGAAGGATAATCAAAAATGGCTCTGGCGTACAATCGCTGGAGCTATTATTTTGGGTATTTTAAGTGCAGTAATAAAATTTAAATAGAAAGGGCGTTTACATGGAATTTCTAAAACAGTTTTTACAGATAAAAAAGATTATAGCATTATTAACTACTATAGTGTTTTGCATTTTAAGTACAAAAGGAAACTTATCAAGTACGGAGTTCCTTTCTGTATTTACATTAATAATAGGATTTTACTTTGGACAAAGTTCAGCAAGACAAGCGGTGAAAGAAAGTAAAGAGCAGGAATAAACCTGTTCTTTTTTTATATTAAATTTTAGGAGGTAATATTATGAAAATAGGAATTGATTGTGGACATACAATGTCAGGTGCTGATTATGGAGCAGTAGGAATAAAAGCAGAATCTAATTTGACTAGAGAGGTAGGGACAAAAGTAATAAGTAAATTACAAGTTTTAGGTCATACGGTTATTAAGTGTTATAAAGATACTTGTAGTAGTTTAAATGATAGTTTAAGTTATAGAACTAATACAGCCAATAATAACAATGTAGATTTATATGTATCTATTCATTTTAATTGCTATAATGGTAGTGCTTATGGTGCAGAGGTTTTTACTTATGGCGGAAAATCTTTTACAGAAGCGTCAAGAGTATTAAATAATATATGTGCTTTAGGTTATACAAATAGAGGGATAAAAGATGGTAGTAATTTATATGTACTAAAACACACAAAGGCTAAAGCCATGCTTATAGAATGTTGTTTCTGTGATAATGCAGGAGATATGAACAGATATAATGCTGAAAATATGGCTAATGCTATAGTTAAAGGATTAGTAGGACAGACTACAAGTAGTACACCAAGCAAACCAACAGATAACAACAATAATAGCTGGATTAATTTAGATGGTAAAACAGGTACTATATGTACCCCAAGCGGTGTAAATATTAGAGAAAAGAAATCTACATCTAGCAGAATATTAGGTGCTTTACCTAATGGTGCAAAAGTACAATTATACCGTAAAGAAGGAGATTGGATACATATTTATTATCCTCCGCATGGTGGTTATGTTTATGAGAAATATATAAGATATTAAATTTTTAAAGGTACTTCTGTAATGGAAGTACCTTCTTTTTTTATTTTGCTGAATAATAATGTAAAATGTCTGAATTTTTGGTAAAAATTATAAAGGAAAAATTGTATAAATGTAGAAATTATATAATAAGAGTCTGTTAAGTTAAAATGATTTAACAGATAAAATAATATAGAGGGGGATGACTAAATGAAAAAAATTGCAATTGGTCTTTTAACAGCATTGATAATTGGGGTAAATGTGTCTACTGCCCATGCAGCATTTATTTGTAATGTATGTGATGCCAGGGTAATGCCAGGACAAAGCCATTCATGTTGTGATTATTTAGGACATGTGGAGGATGTACATTCACGTGACGATGGAACAGGTTGGGTCGATTGTCTTCGTTGTCGTAAGATACTAAGAGCCTAGATAAAAGAAAAAAGATTATTTAAATAAGAGAACCCCAATAAAAAGGGGTTCTTTTGTATGGATTTATATATTGGTGCTATGTATTGGTCTATTTTTATTATATCCAGATGTAGAAAAATTAATCAATTAGAAATATATAAACTATCAATTTTGAGGGTACTTCGATAATGGAAGTACCCTCTTTTCTATTGGAAAAATTATTATAAAATATATAAATATTTCATAATAAGGTATTGATTTATTATACTATGCATAGTATAATATAAGTATAGTAATTGATAAGGAGGTGAGTAAGTGATAGAAAGTGTAGGAAAGTTAATAGCCTTAGCAATTTCAATACTAACAATCCGTCAACTGAGTTTGCAGAACAGCAAGACGGAGTTAGAAATAAAAAAACTAAGGCTAGAAATCAAAAGGTTAAAAGAGGGGGATTAAACCCCTCAACCTTTCCTATATTATATCACAAGTATATGAAAATATTAAATTATTTATTAATAATATCAATCACAATAATATTATTGTTGCTAATAAAACTGACTTATAACAAAAGGAAAAAAGCTAAATTAGAAATTGAAAAGCATGAAATTGAAAATAAAAAGGGTGATTATAATGGCAAAGAGTAACCAAACGGAAGCCAATAAAAAATGGTATGACAAAAATAAAGAACACGCCAAATATTTAAATAAGAGATCACACACACGAAGTTTTATAAAAAATTTTGCAACTTTAGAAGATTTGGAAGAATTACAAAAATTAATAGAAGAAAGAAAAGAATTATTAAGACAAGAATAGGGGATTAACAATGAAAAAGGAAATAAGATTCTTAATAGTAGGTTTGTTAATAGGAGCTTGCACAAGATTCATCGGCATTGCAAAAGCCATTGAACCTTCGGAGGATAATTGCCCAGAGAATGGAGAGTATATGTATTGTTTAGATAAGACTACACCGCTATGGATATCTATATATGACGTACATCAAGAAGAAAAATTTATCTATTTGCGACAACCGAACAGTAATAAAATAATTAAATTAGTAGAATTAAAGTAAAATCTAGTGGATAGGTCATAGTAAAATTAAATTAAATATATAAATAAAAACCGTACTAAAAACGTACGGTTTTTATTTGATTTCTTAAAAAATAGAATAAGAAGTACGGTAACAGAGGCGACAAAAGCACAGTTTTTCAAGGTTTGTAATAGGGTTTAAAATTCAAATTGTCCTAGGGGTATAATAAATTCTTCTATAGAAATAAATCCCTTTAGGGACTTATGGGGAATACCTAATGAAGAGGTTTTATCAGAAAAAGGATGTACTTTTTATGGTAGATGTGTTCAAAGAAGTGTTTTGTGCAAAGAAAATAAACCTAAGCTTTCTAAAATATCAGATAGAAGAAAGGTATGCTGTAACAAAGGTGGAATAATAAATTTGCTTACGGCTAATTCATTAAGAAAGGTTTATAAAACGAAATATAAAAAAGTTTCCGCGGTAAATTATTGTAATTTAAGCATAAGGAGTGGTGAAATAGTATCTTTAATAGGCGAATCTGGTTCTGGTAAAAGTACCTTAGCGAATATACTATCTGGAATATTAAAGCCAGACGAAGGGCAAGTATACTTTAATGATGAAAAGTTAGAAGGTAATAAATTTACTTCAAAAAAATTTGGAATACAAATTATATTCCAGGATCCTATATCTGCTATCAATAGTTCCTTTACTATAATGGAGGCTATAAGAGAACCCTTGGATATAATAAAAGATGGATCAATTGAAGATAGAAATAATAAAGTCTTACAAGTTTTAAATAAGGTACAATTACCTACAGAAAAATATTTTGCAAATAAAAAATGTAATGAATTAAGTGGAGGGCAAAAGCAAAGAGTATCAATAGCAAGGGCACTTATAATGGAGCCCACTCTTTTAATAGCAGATGAGATAAGTTCTATGCTAGATCCATCAACTAAGGCTAATATATTAAGACTATTAAAGCAGTTGCAAAACTTAAATGGATTTTCTATGCTTTATATAACCCATGATATAAATTTAGCTAAGAAAATTTCAGATAAAATATTAGTTATGAATAGCGGCAAAATTGTAGAATCAGGTTCTGTTTTAGAGGTTTTAAATAATCCTAAAAATGTTTGTACTAAAAGATTAATATGCTAATTTTATGTAATTATTAAACAGTAGATAAAAGTTTTGTGATTTTATGATGATATCTTATTTAGCTAAAAAATCAATCTGAGCAAGTATGATAGCTAAGATAAGGTTAAATAAAAAATAAAGGCGTACCATAGCTTAGGTATGCCTTTAATTATAGCAAATATCTTTGAATTTTTTTGAATATTATAATTCTGATAGAGTCAATTCATTTAAGGGTTACTTATAAAGTTCAAGTTAAATTAACTAAGAATATCCTAATCTCTTAGCTCTATAATAGCAGGATACAAGAGCGGCTACATCATATCTAGCATCATGAAATCCAACATCATCACAGTTAAAAAGTTTTTTAGCTCCCTTTAGAACTATTTTTTTATCTATATTTAAAAAATCAACTGCTTCTTCTAGTCTAGGTTTTTTTAATTTACCTGTTCTGGTGGTAGCTTTTACAATGGGTTTAAAATATTCCATGGTGCAGAAGAATTCTTTAGGAATCCAATTCATATCATTTAATCTATTAAATTCAGCGGTAACAAATTTTCTATCAAAATTTACATTATGAGCTATAAAGATCCCATCTTTTAAATCGGAACTTATTTCTGAAGCCAAATCTTTAAATTTTTTGCCTTTAGATAAAATCTTTAATTTTTCTACGCTAAAACCATGAATAGCTTCTGCAGATTCTTCAATATAATCTACATCAAAAAAGAAGTTTTTGGCAAAGGAAACTTTCTCTTCACCTCTAAAATTTATATCACAAACACAATAAGTAAGTTGTATAATTTCACCAGGTTCTAAACCTGTAGTTTCTGTATCTATAAAAATTTTTTTCATAAAGCAAATCTCCTTTATACATTAGGTCTGTAACTTAAATAGTTATAAATATTATATAATTAAACTTTATATAATTATATAATATATGAATTTTTCAATAAAGTCTAAAATTAATCTTAGTTTATAATAAAAAGTTAATAAATTTATAAGCAATTTGTAACTATATTTATACTTTTTACACTTGGATATGTAGTATAATATATGATGATAATATAAATCTATCCTATTTATGAAATTAGCAGTATTTATAGGTTTATATATCACTACACATAAAGTATAAAGGAGACTGAAAATATGAAATGCAAAACAGTGATTAGTAAATTATTAGTTTTAGTGTTTACTTTTTCTTTAATAATATCTGCTTCTTCAGCCAATAAAGTTTATGCAGATGCTTTTAAAGTGGTTACGTTAGGGGCAGATTTAACTAATGAACAAAAGGAAGAAATGCTTAAATATTTTGGAGTAACAAGAAAAGAAGCTAATGTAATGGAAGTTAACAAAGAAGAAGAAGATAAGTATTTAGCTGGAGTGGCTACAAGAAAACAAATAGGAACAAAATCTATATCCTGTGCCTATGTAGAACCTACAGATAAGGGTGGGCTAAACATATCTACTCATAATATATATTGGGTTACGGAAAATATGATTAGAAATGCTTTAATAACTGCAGGAGTAGAAAATGCTAATGTCAAAGTAGGAGCACCTTTTAATGTATCTGGTACAGCAGCTCTTACAGGTATATTAAAAGGTTTTGAAAGTAGCAAAGGCGGGAAAAAAATAGATGAAGAGAAGAAGAAAGTTGCTAATGAAGAGATGGTTGTTACTGGTAATTTAGGAGAAAAAATAGGACAAGATGAAGCAGCTAACTTAATAAATGAAGTTAAAAAAGAGGTTGTTAAGGAAAAACCAAAAACAGAAAAAGAAATAAAAAACATAGTAAAAGATGCAACTAATAATTATGGTTATAAATTAAGTGATGAAGATATGCAAAAGATAACAGCTCTAATGGATAAGATAAATGGATTGGATTTAGACTTTAAGCAAATAAAAGACCAGTTAAATCAGGTTAGTAATAAATTAAAAGATGTTGTAACTAGCGAAGAGGCAAAAGGCTTCTTTAGTAAGCTATGGGAAGGTATTAAAGATTTCTTTGATAATATTTTTAGTAGCAATAAAGAAGAAAAAACTACATCTTACAATGTAACGAAAGTTCAAAATATAACTTATAATAAGTTGAGAATATAATTTATTTGTAACTTAAAAATATATAAAAAAATGTAGCAGTTAAATTTTTAGATTACTTTTATTTTGTAAAATTATAAAACAGCCTCTATGAGTGAATAGAGGCTGTTAATATTTAAAGTAAATTTAAAAAATTTATTTTAAATTATATACAAAGATATCCTATTATAAAATTATGTGGTATTAGGAAACGGTTTATATAGTTACAATTCTGAATAGAATTATATTACAGGAATCCAAAAAATACAATTTTTTTTATAGAAAGGGGTACAATATGAAAAATTTAATGAATAAAGTTTATGGACAATTTAGAAGGCCTAAAGGAATGATAGGTAAATTTATTGCAAAAAGTATGAATAAAGAACACTTTAAAGTAACTACTTGGGGACTTCATAAACTTAAAGTAAAAGATAGTAATATCATATTAGACATAGGCTGTGGAGGAGGAAGGACTGTAAACAGACTTGCTCATGGAGTTCCAAAAGGAAAGGTTTTTGGCATGGATTATTCTTTAGATTGTGTGAATTTTTCTAAAAAATATAACAAAGATTTAATAGAAAATGGCAAAGTAGAGATTATTCATGGTAGTGTAGATAAAATGCCCTTTGAAGATGATAAATTTGATATTATATCTGCAGTAGAAACTACATATTTTTGGCCAAATTTATTAGACAGTTTTAAGGAAGTAAAAAGAGTACTAAAACCTTCAGGAAAGTTTATTATAGTAAATGCTAGTTATACTAATGAAAAATTTAAAGAAAGAAATGAAGAATATCTAAGAAAAGTACCAGGTATGAAAATATATAGTGTGGATTATATAAAAAACTTATTAGAAGAAGTGGGATATAAGAATATATCCATAGAGACCTTAGAAGAGGAAAATTGGCTATGTGCCATAGGAGAAAAATAGAAACATCTTCTTTAGGCTCTACTGTTTCATTTAAATGATAAACACTATTGATAAAATTAGTATTATTAGGAAGATAGTGTATCAAAAATAAATCTATTTTGATACACTATCTTCTTTTTTTAAATTAATAAAAAAATACTTATATTTTTATTGAATATCAATTTTTTTCCCCTTGAAGTTTTCATTATCTAATTTAGGTAAAGTGATTTTTAAAACACCATCTTCAAAGGAAGCATCTATATTATTTTCATCCACATTATCTATATAGAAGCTTCTATTGAATTCTCCATAATGTCTTTCCTGTCTAACAAAATTTTCTTTTTTATTTTCTATAGAAGAATCTCTTTCTGCAGTAATTGTAAGATAATCATTTACAAATTCTACTGCTATATCTTCTTTTTTAACTCCAGGTAGATCTGCTTCTATTAAATAATTTTCATCTGTTTCCTTTAAAGCTACTTTGAAGTTACCCTGTAAGTTAGTCATTAGTGAAAAGAACTCATCATTAAAGAAAGTATCTAAAAATGGTGAAAAGAACTCATCTTTTTTGTTTATATTGTTTTTTCTAAAAGGTATCATATCAAACATTCTTTAACTCCTCCTTGTTAATTAATATTATTAAGTTTATATGTATATGATAAATCTAAAGTCAAAGAAAGTCAAAGTCTGAAAAATAAAGATTTATTTATCTATATTAAAAAATTTTAAGTGAAGATTACATAGATTTTTAAAATAAAAGTTTTTAAATATAAATTAATATTTTTAATCTAATTTCAATGTTAAGTAAATTTTATATAATTTAAATACAAGTAGGAATTTAGAAGTCTAAGGTAAAAAAATTATTCTTGACAATTATAGAATGGAAGTATTAAGCTTATGTTAGAAACTTAAAAAACTAATTTGGTTTCCTTAGTGAATTTTAATGTAAGAGGTGTATTATGAAAAAGAATGTGTTTTCAAAAAAAGAATTAATGTTTATATGTACACTAGGGTTTGCCTTAGGTATAAGGCAGATGGCGATGACTATGGTTATGCCCTTTATATCTGTTTATAGCAAAACTTTGGCTTATAGTACTCCAGTATTAGCTGGTGTAGCATTAGGTATATTTGGTCTTATGCAAGCTTTTTTTCAGATACCTTTTGGTGTTTTTAGTGATAAATTTGGGAATAAAAAAGTTATTTTAATAGGGCTTATGCAAGTAATTATAGGACTATTGTTGGCTTATTTTGCAAAAAATATTTATTTATTAATAGTTGCTAGAGCCCTGCAGGGAAGTGGTGCTATAATTGCAGTAGGATATTCTTGGATTTCTAGCAGTGTACATTGTGAGAAACGAACAAGAGCTATAAGTATAGTTGGGATTATATTGGGTTTTGCAGCTACAGCTTCCTTTGCTTTAGGACCTATAATACATAAGTATGTATCTGTAAATAATATGTTCTTATATTGTGCTTTGCTAATATTATTTAGTTGGATTATAATATTAGTATTTTTAAAAGAAGAAAAATCTCATCATAAAAGTGAAACTAATTCTAAAGAAGAATATTCTAAAAATAATATTAATATTAGGGAAGTTTTTCATATATTATTAGACAATGATATATTTGTAAAATTAAATATAGCAGCTTTTTTAAATAATTTTATAATGGCAGCAGTATTTTTTGCTTTACCACAGTATTTAGAAAATATTACAGGTATTGATGGTATGTGGAAAATATTTATGCCTTCAGTTCTTATAGCTATAGCTTTTATGACATGGGTTGTAAGAGTTTCAGAAAAGGGTTATGGAATAAAGCTATTAATTATATCCTTTGCTATTACTGCTATAGGTGTGATTTTTTATTTTAACAAAAGTTCATTTACATTTATATTAGTAGGAACTATATTATTTATGACAGGATATATATGTATATGTACATTAGTACCATCCCTCGCCAATGAAATAGCAGAGGAAAGCTATAGGGGTACAGCCAATGGTATAGTTAATAGTTTTCAATATATAGGGTCTTTTGTGGGCTCAGTTATTATGGCAGCTCTATGGGTAAATTATGAAAAAATAGCATTGATTTTACTCATAATAGTTTGTATTCTAGGGATAATTATGCTTAAACATTGTAATTAAAGAAATGCTATTGCTTTTAGATATTATAGCATAAAATGAAAAATTTTATTAATAGATGTATAATATAAAGAAAAAATACTTAATTAAAAACCTTTAGTATACAAAATAAATGGTATATTATATACCATTTACATAAAGGAGAATAAAATAATGAAACAAAAAATATTAGATATAACCTCTAAAAATATAGAATTATATGGGTTGAAAAAATTTACCATGGATGATATATCCTATGATCTTAAAATAAGTAAAAAAACCATATACAAGTATTTTAAAAGTAAGAATGATCTAATAAGCCAATATTTTAATGAAATAATAGACAGTGATAAAAAAAGCACTTTAGAATTATTAGAAAAGAAAATGCCTTTAGACGAAAAATTATATAATATAATCTATTCTTATCATAAATATAAATTATCAGTAAGGATTTTGGATGAAGCTTATAAATTCTATCCTGAGGAATTTAAAAAAATTCAAGAGTTTAAAGATTTTAAAATAGATTTAGTAAAAAAAATTTTAAGAGAAGGTAAAAATCAAGGGGTAATAGAAGAAAATATAAATATAAATATAGTAAGTTTAATTTTAGAAAAAGTTAGTGATACATTTTTAGACTATAAATTTTTAACTAATAATAATATTACTATGAAACAAGCCATGGTAGATTTGATGAATATACTATTAAATGGTATTTTAAATGAAAATTATAATGGGTAAAACTCCTGATATTAGAGAAAATTTAGTTAAGTAGGAGGCATTAAGACGATCAAAAGATGCTTATGTATTAGCTTATGATTCTAAATTCGATAAAATAAGCTCTGTAACCTTTGGTGATATTAGTAAAGCCCTATAATTACAACAAGAATTTTAGATATAAATACAATGATTTAACAATAATAGTGGAGGTGATAATATAATGATTTATACTATTACTTTTAATCCAGCTTTAGACTATGTAGTTAAGGTAGAGGATTTTAAAACAGGTAATTTAAATAGAACAAGCTATGAAAAGATTCATGCAGGAGGGAAGGGAATAAATGTTTCTATAGTATTAAATAATTTAGATGTAGAAAATATAGCTTTAGGTTATATAGCTGGTTTTACAGGGGATGAAATAGAAAGAAGAGTTAGATCCTTTGGATGTAAAACGGATTTTATTAGATTAAAAAATGGAATGTCTAGAATAAATGTAAAGCTAAAATCAAAGGAAGAATCAGAGATTAATGGAACAGGACCTTCTATAAGTGCTGAGAACTTAGATGAATTGTTTAATAAACTAGATAATCTAAAAGAAGGAGATTTTTTGATACTTGCGGGAAGTATTCCTAAAACTCTTCCAGAGAATATATATGAAACTATAATGGAAAGACTTAAAGATAAAAATATAAAATTTGTAGTGGATGCCACTGGAGAACTTTTACTAAAGGTATTAAAATATAAACCATTTTTAATTAAGCCTAATCACCATGAGTTGTCAGAATTGTTTCATGTAGAAATTAAAAATGAAGAAGAAATAATAGGTTATAGTAGAAAATTACAGACGATGGGAGCAGAAAATGTTCTTATTTCTATGGCAGGAGATGGAGCAATATTTATTTCATCTAAAGGAGAAATAATAAAAAGTAGTGTACCTAAAGGAGTTTTAAAAAATTCTGTAGGAGCAGGAGATTCTATGGTAGCAGGTTTTATATCAGGATATTTAAAGAATAATAATCTGGAAAATGCATTTAAAATGGGATTAGCTACCGGTAGTGCTAGTGCCTTTTCGGAAAGATTAGCTACCAAAGAAAAAGTAGAAGAGACATTAAAACAAATATTATAAAGTAAAACTGATTTATTTAAATATAAAATTAGTTAGGCATATTATAATGGATGAAGAATTTAAAAACGGTTTAATAAATTAATTAAAATCCCACAATAAAATGTGGGACTTTTATATTAATCAAATTGCTCAGCCATATTAGTTAATTTTCTATTAAGTGCAAATATTATTATAGCATTTGCAATAAGAGCTACAGGAATGGCTATAAATACTTGTAATGGTCCTAATTTGTCTATGAACGCCTGTCCGTATCCGGCTAATTTATTAGCTGCAAAAGTACTTAAGAACCAAACTCCCATTAATACAGAAGCATATTTAGGTGGTGCAAGCCTATTAACCATTGAATTTCCAATTGGTGAGAAACACATTTCTCCAGTAGTTTGTAATACATAAAATAATAATACCCAAATTACACTAGCCTTTATTGCAGGGTCAGCAGAACCGCCTCTTTGCAATACTGCAAATATCATAAATACAAAACCAACAGCTAATAGTACAAAGCCAAGAGCCATTTTTTGTGTTATGTTTAAATCACCTCTTTTAGACTTTTCAAGCTTAATCCAAAGAGCAGACATTATAGGTCCTAATATAACACACATAAATCCATTAAATGAATCTAGCCAAGGTACTGGCATAGTAAAGCTTCCTATACTCATATCTATGAAATCTCTAGTATATAGAGCTATAGATGTAGAGGCCTGATTATAAGCTGTCCAGAAGAATATAGAAAAGAATGTTAATACAAATATAACTATAGTTCTATTTTTCTCAGCCTTTGTTAAAGGCGCAGTTGATTGCTTTTTATTATCGGCATCTGTTGTAGCAGGAGCGAGTTTAGCAGCTGCTATTTTACCAGAATCCCCCATCGTCTTTTTAACACCAAGGGCAAAGGAAAGACCTGATAGAAGGCAGGCTATAGTTCCACCTAAGAAGACAGCTTTGTATCCATAATGAGCTATTTCTCCATTAATTTTTGTAGAAAATATTTGATCTGCAAAAAGTCCAAATAAAAGAGGTCCAAACATAGCACCTATATTTGTAAACGAATACATAATTGAGAATGCACCATCTTTTCTAGAATCATTTTGATCGTACAAAAGACCAACCATTGTATTTAGATTTCCTTTAAAGAAACCAGTACCAATAGTTACTAATATAATCATTGCATAGACTCCAAACTTACCTTGATTTAGAAAAAGGACAAAGTTACCAGCAGCCATTAATAAAGTACCTAATACTACACAGTATCTTGCTCCTAGATAACGATCACAAATCCAACCACCTATTACTGGTGCTAAATAAGTTAGCGCTGCGTAAGTAGATACTAAAGATGCCGCATCCGCTTTGCTTAAGCCAAAACCACCTCTAATAATTTGAGTTGCTAAAAAAAGAATAAGTACAGATTTTACACCATAAAATGAAAATCTTTCCCAAGCAACTGTCATCCCACAGATATAAAGACCTGAAGGATGTTTTGAATTTTCAGCTTTTGCCATTTAATAAAACCCCCCTTATTTAAAAGTTAATGTTAAAACATATATGATTAAGTTAAAAACTTAATATATAACAAAATATAATAAAAGCAATAAATATTAATTTAAATTAAATAAAAATTTATTGTTTATCCAATTTACAGACTAGGTATATATCTTTAGTAACTTAATTCTAATAATATTATTAATTATTAGAAAAATCAATAGATTTACAGTAAAGATAAATAATAACTGTATTTCCTTTTTTGACAAAATATTTTGAATTTAAAATTATACTATAATGAATAAATGGAATTTTAAAAAAATCCTATATTACAATTGTACTTTAATAAAGTTTTAAAAATTACAGTAAATATAAATATTATTCTAACTTTTTTAATTTACATTATATGATTTATAAAAAGATTTATAAGCTATGTAATATAAATTAAAAAAAGTTTTGATACAATGAAAAAATATAAATAAATTAATAAAATATACAGAACTTTGAAAAATATATTCAAAAATTATCTTATATTATTGGAAGCATATATATATAACTTATAGTGAATAAAAGTTTGTAAAAAATAAAAAACTATCCAAAAGGAGTGAGTCTATTTGAAAACTAAAAAAAATAAAATAAGAGGTAATAAAGAGCAGTTGAATAGTTTGGATTTAAAGAACAATCCGGAAATAAATTCAAATTATTATGGTGATGATGATAATATATCTACTCAAATAGTTACAAATTATTATTATACTCCAGATAAGTAATAAATAGAAATTTATTTAATTTAGTAAAATTTGCAAATAATAGGTATGCATTAAGGTAAACCATATTTTTTTGGACATCATATATGTAAACTAAATTATAGTACATTAATATTATATATAGTATAAATAATTTAAAGGATGAGGATAGCCTATGATATCCATGCCTATTTATTTAAACAAGATGCTAATTCAGGATTTACATTCTATTTTAATAAATGGATATTTACAAAGTACAAGTATAAAGTATATTACAGATAAAACAGATTCTGTTAAATTGCAAAAGGGAATGGAGAAACGCTGCAGAAATGAAGATACTTATTCTAAAAAGAAAAATAAATTTCATAACAGAGAAAAAAGCATATGTAATAAGGATAAAGAAAGCTTATCTATCGAATGTAATTCTTTAAGTGATGAATCTAATATTATGGGAAGTTTAGATGGAAAAAATACTAATATAAGAGAATTTGGAATTACTAAAATATATACTACTTTTCATTTGTTTCATAATTTAAAAAATATGATGATGAACCAAAATATGATAAAACAAATCACAGAAAAAGATATTATAAATAATAATATAGAGTGTGGAGATTATGTAGAGTTTGAAGCTAATATGGATCCTATATGTGTAGTTTCTCAACTAAATTGTATAGTAGACACTATGGAATGCTATGATGTTAATAAATTAGATAATTTACTTCAAGAAAAAAGTAAATTAGATGAAAGTCACTTTATGAATAATTATAAAGTAGTATTAAAAGAATTAAAAAATTTAAACGAAAATTTAAAGAGTTATAATACTAGAGATATTGTAGTAAGGCTAAAAAATTGTAGTGGAGTATTAACCATAAATACAAATAATTTTTCTGAGGAAAATCCATATATGTATGATATGGCCTATTGTAATTGTAAAATTTTGTGTAAGGTTGTTAAAATAGCGAAAAATCAAGATAAGATTGATTTGCTTAGAAAAACTAGAATGAGTGGTTATTACAATAAGTTTTTAAAATCTATAGCTCCTCATCTAAAACTACTGAATGATAATGATATTATAACTTTAAATAATATTATTACAAGTATAGAGGGCCCAGCTATCCAGGCTTTACCTATAGCTATATATGTATAAATAATTAATATTGATTTATATTTTTACAAAAATAATTTTAGATCGACTTATATACATGAGTTAATTCTATATGTATTACTTCAAAACTCTTTAAAGTAATACATATAGAATTATAAGCTTATTTTTAAAAAATGTATTTTATAATATTTCCAAGAATATTTAATAGGAATATTTAGTGCATTAAAAGTATGATGTGATATTAGAGGGTCTTTGTTTTGAAAGGCGGTTATTATTGCAGAATGAAATATATGATTATTATTATCTTCAAAAAATACTAAATCTCCAATATCTAATTCATTCTTATTATAAACTTCTAACCCCTTTGCACCAAAAGAACCTTTTTCTTGGTTTACTTTTAAATAATAGTATAAAGAATGAGCTACAGCCCAAGATATAGACCAGGTATCATCTAACACATTTATAGTATTGTTATGATTATACCACCAAGGATATTCAGCACTAAATTTCATGGGAGCTCCACCAGCTAATAGGCATTGGGATATAAAATTTGCACAATCACCACCATTATCATCTATTAAAGGAAAATACCTATATTGAGGATTAGGGGTTAAAGCATAAGTTATAGCATAATCTACAGCCTTTTTTCTTAAGTATATATTTTGTCTTTGCATTGTCCAATTCATTACAATTAAAAACCTCACTAAATGATTATAATTAATATTATATGATAAGTAACCTGTTACAGTGAAACTTATAAGTATTTATGAATGAAAATAGGAAAATAGCATATGATATTAATATTTTCAGGTGTATTGTGTGAATAAACTTAGTTAAAAATTTATATTTGTTAAAATTCTAGGGTGTTCACTATCATAAGAAAATAGTATAATATTCAAGGGAAAGCCTATGTTATTATTAAAAATATAGAAATTAAAGGAGAATAATATGAAGGAAAGTACTATAGAAAAAATGAAAAAAATAATAGAAGAAAATAAGAGGAAGTCTTCACAAAATAATTCTAAGTTAAGAGCAAAAAAGAATATTGGAGGAAGTAGAAAAGCTATTAGAAATAAAAAAACTGGTGGATTATTTGATAAATAGATAATATTTAGATTTATATTGTGGAGGTTACTAAGGATGAATTATTATTGTAATAATGAACCATATGTTTTAGTTTTCGGAGCATCAGTAGTAGATATTTTTGGTTTTAGTTGTTGCGATTATAGAGCTTACAATTCTAATCCGGGTAAAATAAAAATATCCTTTGGTGGAGTATGTAGAAATATAGCGGAAAATTTATCAAGAGTTGGGATTAATACTAAATTTATATCTATATTAGGTGAGGATGAAAATGCTAAATGTATGTTAGAGCATTCAAGAAAAATGGGATATGATATGGGAGACTCTCTTATTTTAAAAGGAGGTACAACCCCTACTTATATGGCCATATTAGATGAAAATGGAGAAATGGTTTCAGCAGTGGCTGATATGAAAAGTATAGGCGAAATGAATTCCGAGTTTATAGATTCAAAGGCGGATATAATAAAAAAGGCAGAGTATACAGTTTTGGATTCAGATAATCCTGAAATATTAGAATATATATTAAAAAAGTTCAAAGGAAAAACAAAGTTTATATTGGATCCTGTTTCTGCTGAAAAAGCTAAAAATATAAAGCCTTTAATAAAATATTTTCATACTATTAAACCTAATATACATGAAGCAGAAGTTTTATCAGGTTTCAAAATAGAAACTATAGAAGATTTAAAGAAAGCAGGAGAGTATTTTGAATCTTTAGGTGTAGAAAATGTTTTTATAAGTTTAGACGCAGAAGGAATCTATTATAAAAATAAATTTGAAGAGGGAAGAATAAAGGCTAAGGATGTTACAGTCAAAAATGTTACAGGAGCAGGAGATGCCTTTGTAGCAGGTATAGCATATGGTTATATGAATAAATTATCTTTAGAGGAAACTGTAAAGTTTGCTATAACTATGGCTAATTTAACTATAGCTCACGAAAACACTATAAATCCAGATTTAAGTTATAATATTGTAGAGAATAATATAAAAAATATTCAATGGATTGAAGAATACTTATAATTAAATCAGATAATATAGGTAATTATAAGTATAAGAAATATAATACATAAAATGATTACGTAACAAAGTACTAAAAATAAATTTCATTTTAACAATAAAAATCTGTGAGTAAAGTATGTTTATTCACAGATTTTTATTTAATGCTTAAGGTTTAATAAACAGTTGAGTCCAATAATATACACCAGAAAAACTTTTATATAAGCCTACACCAATTTCAGTATAAGCATTACTTAATATGTTTTGTCTATCATCGATAGAATCCATTAAATTGGTCATAACTTGCTGAGGAATCCTTTGGCCATAAGCTATATTTTCTCCAGTGGTAATAGATCTTATATTAAAATTTTGTAACATGGTAGGAGGAGAACCATAAGTTGATGAAATATGAGAAAAATAGCCTTTAGTAGCCATATCTTGAGATTTATATCTGGCTACTTTAGAAAGTTGCCAATTAGCTCTTAAATGGGGTAATCCGGCATTCTCCCTCTCAAGATTTACGAGGCTTATAATTTCATTTTCTAAAGCTTTTATAGTATCTATATTTGGTATATTTATTTTTTCTTCAGGATATATTAAATCAGTATTTTTAATTTGAGGGTTAGCTTCTATTATTTCCGTTAGTTCAATTTGATATTTTACAGAAATCTTCCATAAACTATCTCCGGGAACTACAATATAAGAAGTATAATCAGCAGCAGAAACTCTAATCCCCTTGAAGAGGCATAAAAAACTAGTTAACAACACTGAAAATAAAATTTTTTTTAATAAAGATTTCTTCAA
Protein sequences of DBSCAN-SWA_3 >NC_009495|1822763:1878926|1846861_1847206_+|WP_012047643.1|head,tail|DBSCAN-SWA MTQLEKLKKLLGISLDDDSKDFLLKFVLEDLEQIVKDYCHMREIPEALNNTVLKMAIDMYRNENLGEEENSLGSVSSITEGDTSISYRSSATEFKDTLIKDYKAQLNKYRKLVW >NC_009495|1822763:1878926|1847207_1847591_+|WP_012047644.1|DBSCAN-SWA MFKSIEKARKQARKAIESLYDCTCNITGGKEKVKDPVTKETKLIPKIKYEKQSCKISKQSLSKNNQTDTVNKVLYEIKLFIAPEVEIKQGDEIEITNQFGIITKYKAGEGFPYYTHQEVILNKEDKA >NC_009495|1822763:1878926|1829877_1830645_+|WP_012047607.1|DBSCAN-SWA MEGLNRILKEVRSKNITSPNTKVDYKCNKCQDTTFIKTENGFTRCECYKKDLTKRRWAHFGIDPSKVKKISQYADYSDITKRAKQVAIDYIRDYTTIKTKEENNLAFLGQPGAGKSHLAIGIGANLINSGICTNVVYMPYEEAMRELKANTMNESYMELTKRYTECELLIIDDLFKEKIKNGKLVGELTESDIKHIQPIINQRYLNCKPTIYNSELTPELLINLDQALAGRILEKSNIVIFKYGLENNYRMRKFV >NC_009495|1822763:1878926|1826612_1826861_+|WP_164928178.1|DBSCAN-SWA MDKNWCALLIAILREKPCTREQAAELYDKGTLFRNKRPKEDIEEMIRLRKQGLKFKEIAEIFCLDPSTVCTLVNKKKLPARS >NC_009495|1822763:1878926|1839801_1839942_+|WP_012047633.1|DBSCAN-SWA MAQEKDKHINAYDYGDDFMCPDCGGTSKDGKYDAGNGFCQDCAPNH >NC_009495|1822763:1878926|1823799_1824021_-|WP_164928177.1|DBSCAN-SWA MRKLRTKLGYTQETLGERIGVEQPYISRLENGEIEFMTIGKLKKLSHALQVHPVKLLEILLKEERKGKKNGCL >NC_009495|1822763:1878926|1862225_1862420_+|WP_003494435.1|DBSCAN-SWA MEFLKQFLQIKKIIALLTTIVFCILSTKGNLSSTEFLSVFTLIIGFYFGQSSARQAVKESKEQE >NC_009495|1822763:1878926|1854654_1855629_+|WP_012047653.1|DBSCAN-SWA MNIQLLLDNKNGNVFDISELTNEVTWKTKRKDKPSSLDFEILKDKQITINNGDVISFKVDGNPVFYGYAFENGGSKNPITKVTAYDQLRYLLFNDTYVFKNKKASQILIQIAKDIGLRVGTIEDTGYFIPQLLEDDKKLLDIIYSSLEKTLMNNKRTYTLYDDFGYLNLKNINNMKQPVVISDDSNLGDYDWKNSIDSDTYNRVKIVRDNKDTKGRDVYIAQDSRNIARWGRLQYFKKVDEKMNKAQIQEMVNAALKLKNRETKTLKLKDVISTDIAADLKLRAGSGVYVDIKEKGIKQYYLIEEATHKFQKGNLIMDFDLKVV >NC_009495|1822763:1878926|1832483_1832645_+|WP_012047612.1|DBSCAN-SWA MIWCNDSIAFKCNLEKDCEKRKKEGCASCEDHNDCLFCQNNGTCKEAVLNPYD >NC_009495|1822763:1878926|1848516_1848687_+|WP_012720654.1|DBSCAN-SWA MADKEQEVKFTKEQIVNSKQFTVIEIDVLKALLKDEQYSLKEVNKVLEDFNKKEVK >NC_009495|1822763:1878926|1835309_1835678_+|WP_162485245.1|DBSCAN-SWA MKQCVICGRSNSEAHHIIYRSECRALIKCKRNLVYLCEAHHRGTYGVHGKCGKELNRKLKLEFQEWLEETLNKDFYGMEEIKDRLGISTNAVKSLSKLIKQKNSVFAREDIIIACMGGKRVL >NC_009495|1822763:1878926|1876198_1876732_-|WP_011986320.1|DBSCAN-SWA MNWTMQRQNIYLRKKAVDYAITYALTPNPQYRYFPLIDDNGGDCANFISQCLLAGGAPMKFSAEYPWWYNHNNTINVLDDTWSISWAVAHSLYYYLKVNQEKGSFGAKGLEVYNKNELDIGDLVFFEDNNNHIFHSAIITAFQNKDPLISHHTFNALNIPIKYSWKYYKIHFLKISL >NC_009495|1822763:1878926|1875113_1876088_+|WP_011986319.1|DBSCAN-SWA MISMPIYLNKMLIQDLHSILINGYLQSTSIKYITDKTDSVKLQKGMEKRCRNEDTYSKKKNKFHNREKSICNKDKESLSIECNSLSDESNIMGSLDGKNTNIREFGITKIYTTFHLFHNLKNMMMNQNMIKQITEKDIINNNIECGDYVEFEANMDPICVVSQLNCIVDTMECYDVNKLDNLLQEKSKLDESHFMNNYKVVLKELKNLNENLKSYNTRDIVVRLKNCSGVLTINTNNFSEENPYMYDMAYCNCKILCKVVKIAKNQDKIDLLRKTRMSGYYNKFLKSIAPHLKLLNDNDIITLNNIITSIEGPAIQALPIAIYV >NC_009495|1822763:1878926|1836253_1836679_+|WP_012047624.1|DBSCAN-SWA MREIKFRGKSLDNNEWVYGGYYNMPDCRKDNPRHIIVYQNNGPGQLTIHEPIDINTLGQYTGLKDINGKEIYEGDILQINIKDKTIKNKIISAGNEVVEYKNCKFGVVWGWHRDFIGLDGFYNANFEVVGNIYENPVLLEG >NC_009495|1822763:1878926|1858098_1859793_+|WP_012047658.1|tail|DBSCAN-SWA MVEQFYTILTKIGKAKIANSTALGTKVNFCKLQVGDSNGSYYNPTEDQTELKHKVWEGNINSISIDENNPNWIIIEVLLPSNVGGFMIREAAILDDEDNVVAIAKYPETYKPLTQDGSSKDILIRTILEVSNASSVTLKVDPTVILATKKDIQIITSSMNELDKRITKNEESITNIKSDLADITTDNKRLTKDKTITGAINELFTSASNGKTKVATAITGKGVPASGSDSYDTLSSKIKNIKTGYTQNDLINAENVEFSIKNIFSKNMDSGMLFFIKDYIYVINWKDSIKKYSLDGNLILSKKIDHNGFSSGYYTYFDDIYKIFFHNNSFYIFNKGLKHSGEYYYRVYAETCDIERISAYDFGGQGAYSYYGYGGVAINNDGICCGYNEYSGEVFLFSLSYADVIWSKCLFGWNTKYDFSNIFSDGTDFYISSNSSSGSYYKINVNGDITKLEKKSLPYESNSVMLGEYVYWYDSNKKIWRYNIKTNKTEQIGLECKYIELDFLRKYLYIYTGSILHKIDKSGNIICSYNCTDDHFLGSDKDGCIYFYNNNVINKIKLAYKVLV >NC_009495|1822763:1878926|1828209_1828758_+|WP_012047604.1|DBSCAN-SWA MNVYEKLMNVQATLKAPKSQYNSFGKYSYRSCEDILESLKPLLKENKAIVNITDEVVEINNRFYIKATATFMDIEKGDKVQASALAREDETKKGMDLAQVTGSVSSYARKYALNGLFAIDDNKDSDSTNTHGKGNKQDNTTQETNKAYKCNKCGVPVAEKVAKFSYGKFKKVLCFDCQKKEG >NC_009495|1822763:1878926|1843555_1844578_+|WP_164928179.1|capsid|DBSCAN-SWA MKSKDYWKKRSEVVAGKQFKKTDNYILSLHLEYMEALSSIQKDIEVFYSRFSQNNEISLQEARRLLNSNELQEFKMDLKEFTRKAKDNKNLQWEKELNNVSYKVRVTRLQALQTQIRNSIEDLYSKQQDNTTSLLSGIYEDTYYRNIFEVHKGLGIGINFAKLDTNTINKVITEPWHGDNYSSKIWNNKDKLIMELQTNLTQAFIRGDSIDKTSKIIAERMEVGRNRARTLVNTESANIVSKSTFNSYIGSGVVKEYEILATLDLHTSKICRSLDGKIFKVSEKEIGVNAPPFHPNCRTTIVPCFADTFDIERIARDSEGEVYYIYGNISYKQWYEKYVA >NC_009495|1822763:1878926|1834118_1834430_+|WP_012047618.1|DBSCAN-SWA MKFHMIHLKYEESKKAEFDGIRSYDVIGANGATYCKNVGSAEAEFICRSVNNAEERMEKAFAIANNAIYFNDRSDYLQALYETCKALNPNWEDGLIGNEYIEE >NC_009495|1822763:1878926|1877186_1878146_+|WP_011986321.1|DBSCAN-SWA MNYYCNNEPYVLVFGASVVDIFGFSCCDYRAYNSNPGKIKISFGGVCRNIAENLSRVGINTKFISILGEDENAKCMLEHSRKMGYDMGDSLILKGGTTPTYMAILDENGEMVSAVADMKSIGEMNSEFIDSKADIIKKAEYTVLDSDNPEILEYILKKFKGKTKFILDPVSAEKAKNIKPLIKYFHTIKPNIHEAEVLSGFKIETIEDLKKAGEYFESLGVENVFISLDAEGIYYKNKFEEGRIKAKDVTVKNVTGAGDAFVAGIAYGYMNKLSLEETVKFAITMANLTIAHENTINPDLSYNIVENNIKNIQWIEEYL >NC_009495|1822763:1878926|1871047_1871611_+|WP_011986315.1|DBSCAN-SWA MKQKILDITSKNIELYGLKKFTMDDISYDLKISKKTIYKYFKSKNDLISQYFNEIIDSDKKSTLELLEKKMPLDEKLYNIIYSYHKYKLSVRILDEAYKFYPEEFKKIQEFKDFKIDLVKKILREGKNQGVIEENININIVSLILEKVSDTFLDYKFLTNNNITMKQAMVDLMNILLNGILNENYNG >NC_009495|1822763:1878926|1862460_1863222_+|WP_012047662.1|DBSCAN-SWA MKIGIDCGHTMSGADYGAVGIKAESNLTREVGTKVISKLQVLGHTVIKCYKDTCSSLNDSLSYRTNTANNNNVDLYVSIHFNCYNGSAYGAEVFTYGGKSFTEASRVLNNICALGYTNRGIKDGSNLYVLKHTKAKAMLIECCFCDNAGDMNRYNAENMANAIVKGLVGQTTSSTPSKPTDNNNNSWINLDGKTGTICTPSGVNIREKKSTSSRILGALPNGAKVQLYRKEGDWIHIYYPPHGGYVYEKYIRY >NC_009495|1822763:1878926|1837157_1837316_+|WP_012047627.1|DBSCAN-SWA MGRKRKPVDWELCKKLKEKGLTDLQIAIRMKMSQSQLKIQKKIRREGGDPYD >NC_009495|1822763:1878926|1834483_1834648_+|WP_012047619.1|DBSCAN-SWA MLEQKYIPYLIELVKQDKKEIISAYINNDKIPQSKMAERVREKIINDLKELYFK >NC_009495|1822763:1878926|1840850_1842110_+|WP_012047636.1|terminase|DBSCAN-SWA MNKIKLKSIIASSFYEAHKDIKKGLHTHYWFKGGRGSTKSSFISIEIVLGIMRDAQEGKLTNALILRRVKDTLSESVRDQIKWAIDILGVSDEWHIPEAKLTITYKPTGQVIRFKGADNPKKVKSTKVPKGYIKYIWYEEVDEFEGKNKIDTINQSLMRGGPKFFVFYSFNPPESQRNWCNQEVVETRKDKYVHHSDYRLVPIEWLGEQFIIEAEHMKKVNPAKYEHDYLGAVTGTGGEVFRNLTIRELTDEEIKVFDRLKNGLDFGYAADPLAYVLMHYDKTRKRLYIFDEIYKVQLSNSKAVKEIKKLNPLNKRVIADSAEPRTINEFKTLGLNIKGAKKGPDSVEHGIKFLSEEIEEIIIDPIRCPNAKREFIGYEIEKDKDGNLKGEYPDKDNHTIDAARYGMEDEIRGSSISFD >NC_009495|1822763:1878926|1869712_1870897_+|WP_011986314.1|DBSCAN-SWA MKKNVFSKKELMFICTLGFALGIRQMAMTMVMPFISVYSKTLAYSTPVLAGVALGIFGLMQAFFQIPFGVFSDKFGNKKVILIGLMQVIIGLLLAYFAKNIYLLIVARALQGSGAIIAVGYSWISSSVHCEKRTRAISIVGIILGFAATASFALGPIIHKYVSVNNMFLYCALLILFSWIIILVFLKEEKSHHKSETNSKEEYSKNNINIREVFHILLDNDIFVKLNIAAFLNNFIMAAVFFALPQYLENITGIDGMWKIFMPSVLIAIAFMTWVVRVSEKGYGIKLLIISFAITAIGVIFYFNKSSFTFILVGTILFMTGYICICTLVPSLANEIAEESYRGTANGIVNSFQYIGSFVGSVIMAALWVNYEKIALILLIIVCILGIIMLKHCN >NC_009495|1822763:1878926|1840110_1840383_+|WP_012047634.1|DBSCAN-SWA MKEIGYIIQNIGYNIMPISFIAYFILKILEFKWNKKGYSSLAKSIWYIAVGISTLDGDIRVEKLVIMMIFFDAFDSFIEYKEENRKSKNS >NC_009495|1822763:1878926|1864239_1864422_+|WP_012047666.1|DBSCAN-SWA MAKSNQTEANKKWYDKNKEHAKYLNKRSHTRSFIKNFATLEDLEELQKLIEERKELLRQE >NC_009495|1822763:1878926|1838719_1839235_+|WP_012047631.1|DBSCAN-SWA MDKETFRKTERMLYNYFKKEEIIKYKRDVIEILKDRIEQLEKRIKDTNVNIDYDLQAVPCGERVQTSNTGASYAERAIVQAIDRLIREQADKKKEILNLEEDISNIEKESKAIEFNIRMLNEEDKEFIWLKYKKKLGIEQISDQLNMSRATGYKKREKIIKDIVHWIEVIK >NC_009495|1822763:1878926|1834664_1834937_+|WP_012047620.1|DBSCAN-SWA MIDLKVKLTLSNYFNMSDKFNKLSKEFLERQKIIDEIKEYIIREEFQGNTEMDLANNIELIEREVNGECYLESLKKCGEREILNFLKNMG >NC_009495|1822763:1878926|1871810_1872716_+|WP_011986316.1|DBSCAN-SWA MIYTITFNPALDYVVKVEDFKTGNLNRTSYEKIHAGGKGINVSIVLNNLDVENIALGYIAGFTGDEIERRVRSFGCKTDFIRLKNGMSRINVKLKSKEESEINGTGPSISAENLDELFNKLDNLKEGDFLILAGSIPKTLPENIYETIMERLKDKNIKFVVDATGELLLKVLKYKPFLIKPNHHELSELFHVEIKNEEEIIGYSRKLQTMGAENVLISMAGDGAIFISSKGEIIKSSVPKGVLKNSVGAGDSMVAGFISGYLKNNNLENAFKMGLATGSASAFSERLATKEKVEETLKQIL >NC_009495|1822763:1878926|1860728_1860923_+|WP_012047659.1|DBSCAN-SWA MQARKLMKDRELAAYLDINNSNLPFEYYENKYLKQGYTGNLLYRKILEASNRTNKEVNKQLGII >NC_009495|1822763:1878926|1868921_1869362_-|WP_011986313.1|DBSCAN-SWA MFDMIPFRKNNINKKDEFFSPFLDTFFNDEFFSLMTNLQGNFKVALKETDENYLIEADLPGVKKEDIAVEFVNDYLTITAERDSSIENKKENFVRQERHYGEFNRSFYIDNVDENNIDASFEDGVLKITLPKLDNENFKGKKIDIQ >NC_009495|1822763:1878926|1835691_1835856_+|WP_012721244.1|DBSCAN-SWA MSNKERAEKTYILLQQRKRDRERVKKNDIFALHGNNMARMLRKNSRGKRGIGQF >NC_009495|1822763:1878926|1840423_1840858_+|WP_012047635.1|terminase|DBSCAN-SWA MKLTPKQKAFADYYIQTGNATEAAIKAGYSKKTARFIGNENLTKLYIKNYIDERMKQLEDERIAKANEVLQYLTRVIRGQETEEVVVTENIGDFMSEAKTIKKEIGAKDRIKAAELLGKRYRLFTDKVEIEGSVPVQIVDDIDE >NC_009495|1822763:1878926|1839378_1839531_+|WP_012047632.1|DBSCAN-SWA MLKLMLVISTMNVVLNIIAYWIAKNKVEKVRSITTIICWFITGTLAFIFI >NC_009495|1822763:1878926|1830658_1830853_+|WP_012720701.1|DBSCAN-SWA MNNMTDGKKDGLALVYVKDSVAYPVALNKEQLEMLDITIGMCLSDGMKVIGDKPIGKVTNLVEK >NC_009495|1822763:1878926|1836681_1837008_+|WP_012047625.1|DBSCAN-SWA MELQKLTKAIWDTSRRIEDGVNTLAKKAKEYAEAEKEYRLALGKEILILRDQKVQTTLIPDVARSNVAELKFKRDIAEVTYKTCKEMLQGLQAELSGYQSILRIQQDI >NC_009495|1822763:1878926|1845882_1846848_+|WP_012047642.1|coat|DBSCAN-SWA MGTKLSDVIVPELFNPYVVNRTMEKSALVQSGIITNNSEFDGLASQASPLINMPFFEDLTGESEQIIEDTDLEAAKITSNKDVAAILRRAKMWSATDLSAALAGKDPMAAIGELVSGFWTRDMQKELIAILKGIFLSTSMKNNLLDISAMTEGAAKWSASAFIDAQQMLGDAQELLTGVMMHSAVKSELKKQNLIQTIRPSDSAEFDVYQDKRVIVDDGCPVDVGGVYTTYLFGQGALALGNGNPVGFIPTETDRDKKKGSGVDYLINRKTMILHPRGVKFTNAKVAKVEGPSRAELQEKTNWERVYEPKQIRIVAFKHKI >NC_009495|1822763:1878926|1835852_1836254_+|WP_012047623.1|DBSCAN-SWA MKIVIDGKPMGKQRPRFNSKTGNTYTPDKTVNYENWVKLCYQQQCKGEKLTGEVVAFINAYYVIPKSTSKKNKKDMLAGIIRPTIKPDVDNIAKVILDSLNGLAYKDDKQIVFCAISKWYGENPRVEVILEEA >NC_009495|1822763:1878926|1828759_1829044_+|WP_012047605.1|DBSCAN-SWA MLSSTLYADKETQLTMDQQDDRFCLKLSQLYNYDFSVVGQRKVFEKLLELIEKNLYDETTTNELYERLVEKELLLEQAESQIQSLEDRIEFLQR >NC_009495|1822763:1878926|1855985_1856393_+|WP_012047655.1|DBSCAN-SWA MSEVSILPRGAILDEDVEVEEIIEPTKTYKIKDNRIVGFADGKEALKQAIQLILGTERYEYLIYSWNYGSELNGLIGKQKDIAESEFKRRIREALSQDDRINNVDNFIFNYDKDGAEVSFTVFSIYGEFTESVVR >NC_009495|1822763:1878926|1831970_1832417_+|WP_193345349.1|DBSCAN-SWA MRHKRGDKLNTAVMFSSGTDLWATPQDFFDKLNKEFDFDLDPCATHKNAKCSKYFTKEIDGLKQDWQGYKVFCNPPYGRSIKDWVEKAYKESKKENTTVVMLIPARTDTRYFHEYIYNKAKEIRFVKGRLKFGDAKNSAPFPSMVVVF >NC_009495|1822763:1878926|1848688_1849999_+|WP_012047647.1|tail|DBSCAN-SWA MAGGTWERQNKIRPGAYINFKSKKQGQTPIGERGIATLPLELPWGPEKEIITIHADDDLSKVLGINIADESALLIREVLKKAKTLLLYRLNEGTKATATLEGLTINAKYTGTKGNNITIVIQNSIDFVGSFEVITMFEGNKVDKQLVKVIEDLKPNDYVDFKGAGELKTSAGLPLKDGSDGTVTNQGYTDYLSVIEPYEFHAIGIPTKDPTIKAVATTFIKRLKEDGRQVQLILENYPEADSENVITVRNGVILADNTVIKSNQAVAFVTGATAGANVNQSNTYLEYPGAIDVDTKYTNREIEEALLNGEIVFTISNRKVVIEQDINTFKSFTEDKGKDYRKNRVVRTLFEVNNGSRLLWETNYIGKGNNSEDGRNLYKKDVIKFLEKLQGIGALENVVPEDVEIKRGQDKDSVVARMGVQPIDAMEKLYMDVEVE >NC_009495|1822763:1878926|1860210_1860333_+|WP_003357857.1|DBSCAN-SWA MLSYIKEYYNMGLYTKSDLDIFVKAKWITIEEKEDIIKTQ >NC_009495|1822763:1878926|1874806_1874962_+|WP_011986318.1|DBSCAN-SWA MKTKKNKIRGNKEQLNSLDLKNNPEINSNYYGDDDNISTQIVTNYYYTPDK >NC_009495|1822763:1878926|1833004_1833322_+|WP_012047614.1|DBSCAN-SWA MSLNVKELKEFIEDLPDEMEVVIQSIVSGDEEYCSETLDISSTIDDNSGDKLLVLDPKEVSINNVVEDEEVEEIADYLIEFASDAFEHKDREELIKALKHYGKWI >NC_009495|1822763:1878926|1866916_1867867_+|WP_011986311.1|DBSCAN-SWA MKCKTVISKLLVLVFTFSLIISASSANKVYADAFKVVTLGADLTNEQKEEMLKYFGVTRKEANVMEVNKEEEDKYLAGVATRKQIGTKSISCAYVEPTDKGGLNISTHNIYWVTENMIRNALITAGVENANVKVGAPFNVSGTAALTGILKGFESSKGGKKIDEEKKKVANEEMVVTGNLGEKIGQDEAANLINEVKKEVVKEKPKTEKEIKNIVKDATNNYGYKLSDEDMQKITALMDKINGLDLDFKQIKDQLNQVSNKLKDVVTSEEAKGFFSKLWEGIKDFFDNIFSSNKEEKTTSYNVTKVQNITYNKLRI >NC_009495|1822763:1878926|1878290_1878926_-|WP_011986322.1|coat|DBSCAN-SWA MKKSLLKKILFSVLLTSFLCLFKGIRVSAADYTSYIVVPGDSLWKISVKYQIELTEIIEANPQIKNTDLIYPEEKINIPNIDTIKALENEIISLVNLERENAGLPHLRANWQLSKVARYKSQDMATKGYFSHISSTYGSPPTMLQNFNIRSITTGENIAYGQRIPQQVMTNLMDSIDDRQNILSNAYTEIGVGLYKSFSGVYYWTQLFIKP >NC_009495|1822763:1878926|1851137_1851716_+|WP_012047650.1|DBSCAN-SWA MKKILSTIFIGVFLLTMSGCRQEVSTETASKNNTEKKAQTSKKDDKKDIIDKGKVNEIKDYCEFTVIDTKFGKRINPPNPKDMYTYYEAKEPGTVYFDTVIDVKSLLAEGKRSDEFLSVKVIYDNKYKYKTFSTIEKDKGTNFTYTNITPIEPLKKGMIHFIAEVPEEIEKDNKSLVILINANNKEFKYVVR >NC_009495|1822763:1878926|1837018_1837156_+|WP_012047626.1|DBSCAN-SWA MEIGILRAKIIPYKTFKERIRLVRENEIKYKVENMDGFLYMVRRN >NC_009495|1822763:1878926|1872832_1874212_-|WP_011986317.1|DBSCAN-SWA MAKAENSKHPSGLYICGMTVAWERFSFYGVKSVLILFLATQIIRGGFGLSKADAASLVSTYAALTYLAPVIGGWICDRYLGARYCVVLGTLLMAAGNFVLFLNQGKFGVYAMIILVTIGTGFFKGNLNTMVGLLYDQNDSRKDGAFSIMYSFTNIGAMFGPLLFGLFADQIFSTKINGEIAHYGYKAVFLGGTIACLLSGLSFALGVKKTMGDSGKIAAAKLAPATTDADNKKQSTAPLTKAEKNRTIVIFVLTFFSIFFWTAYNQASTSIALYTRDFIDMSIGSFTMPVPWLDSFNGFMCVILGPIMSALWIKLEKSKRGDLNITQKMALGFVLLAVGFVFMIFAVLQRGGSADPAIKASVIWVLLFYVLQTTGEMCFSPIGNSMVNRLAPPKYASVLMGVWFLSTFAANKLAGYGQAFIDKLGPLQVFIAIPVALIANAIIIFALNRKLTNMAEQFD >NC_009495|1822763:1878926|1827712_1828210_+|WP_012047603.1|DBSCAN-SWA MKNQETFKIEDLKGASWALRKIKECKESILEKEELAKIEKERIEEWLNNETKSDLATLEYFNGLLMQYYKVIKQNDPKARITTPYGQVTSRKNKKWNYGNEETLLKYLNSNGYKNLIRTKQEINKTDLKESFLIKDGIVLDKNTGEVIPEISIVEEENINVKVEE >NC_009495|1822763:1878926|1826442_1826610_+|WP_012721227.1|DBSCAN-SWA MLRIGEVILAIYSLVILLAFIGVDIKQLKKIKDNGWLTVIFIPIIIFLLNIIWRC >NC_009495|1822763:1878926|1827050_1827362_+|WP_012047600.1|DBSCAN-SWA MSQKKIFELRILNTMDIRTMKECKGMKKGFHYKRQIHHLKFYRNDRNITAVITNESRTIKGIGIAKCNPKDKFDIRKGLQLSEIRARGDFYKNTAERFLREEF >NC_009495|1822763:1878926|1850483_1850897_+|WP_012047649.1|DBSCAN-SWA MNNFEDFLMDSFEEVEEIEREITIGGKKKKLKFKPISADKGDELRKKCKKITIVKGQKMSETDQDKFIANQIIETTVYPDLKNAELQKAWGVMGAEQLLKAMKSKMSDGEYMGWGSVVSEINGYDKGIQELVEEAKN >NC_009495|1822763:1878926|1844904_1845147_+|WP_012047640.1|DBSCAN-SWA MLKTYLITIVLFYLSFALMFTRYFVNKDKIVSHQNKDKWFTYIRLLILSLMPVINILATIFFIKFAVFDSNENFIKMLNE >NC_009495|1822763:1878926|1856393_1857488_+|WP_012047656.1|plate|DBSCAN-SWA MFEDQTEEVILDRMMNKISNDLDKREGSIIHNALAPAAQEVAKMYSDMDYFLKCTFASPDMPDEFLDLRVAEEGLKREKATYAIKKGYFYNEENELIDIPLNSRFSIEDFNFIAVEKISTGLYKMQCETTGIEGNSITGPLIPIEYIEELSIATLGELIMPGEDVESNESLYDRYIEHLNEKPYGGNIADYKINTRAIEGVGTVKVFPIWNGGGTVKIVFLDSDYSVPTTELIDKVQTILDPVQNKGKGFGVAPVGHVVTVLGAKDIEITIETNILLKRGLTIGQVQEDIKKIINEYLKQLRKQWHEDDNTIVRISQIEARILNVEGVADLFNTKINDKEENLNLGTEEVPMFKEVVLSEKEIN >NC_009495|1822763:1878926|1833571_1833754_+|WP_012047616.1|DBSCAN-SWA MPKCQKCEYCILERSGEEESFYGHSYVSDYSEELDCKRGHYKKFKLDGETDCKAFKQREN >NC_009495|1822763:1878926|1833775_1834054_+|WP_012047617.1|DBSCAN-SWA MKIYIAGKINGLKDYKKNFDKAETKLKEDGYVCMNPSILPEGFPYEAYMPICTSMIDQCDSIYMLNNWETSRGARAELEYAKVTGKKILYQD >NC_009495|1822763:1878926|1850002_1850467_+|WP_012047648.1|tail|DBSCAN-SWA MGFLKAGDTISGQEARGFITIDGRNEELFYAKKLESKVEKKKTEVRTLSKRGEQHKAAGWSGSGTLTVYYVTSLFRELMIKYIKTGVDTYFDITVTNEDPTSSIGKQTTVLKDCNLDEVSMAMFDVESEVLEEDMGFTFDDVDLLDKFGKPVLG >NC_009495|1822763:1878926|1833351_1833504_+|WP_012047615.1|DBSCAN-SWA MICWDCGKEIDDTSAVYDQFSCDMCDVTLCRKCYGEQNGFCEECLSDIEE >NC_009495|1822763:1878926|1863408_1863630_+|WP_012047663.1|DBSCAN-SWA MKKIAIGLLTALIIGVNVSTAHAAFICNVCDARVMPGQSHSCCDYLGHVEDVHSRDDGTGWVDCLRCRKILRA >NC_009495|1822763:1878926|1868138_1868774_+|WP_011986312.1|DBSCAN-SWA MKNLMNKVYGQFRRPKGMIGKFIAKSMNKEHFKVTTWGLHKLKVKDSNIILDIGCGGGRTVNRLAHGVPKGKVFGMDYSLDCVNFSKKYNKDLIENGKVEIIHGSVDKMPFEDDKFDIISAVETTYFWPNLLDSFKEVKRVLKPSGKFIIVNASYTNEKFKERNEEYLRKVPGMKIYSVDYIKNLLEEVGYKNISIETLEEENWLCAIGEK >NC_009495|1822763:1878926|1847590_1848082_+|WP_012047645.1|DBSCAN-SWA MARLASFDYSDFKKMAKSFQKALDERVIERWIREFLLGMAFRAERKIKKRTPVGVYSNQVSFTTKDGKEVSFTTSSSKTGGHLRRNWQVGNVIKQGDAYIVEIFNNTEYASYVEYGHRTKNHKGWVEGRFMATISMQEIERQLPKFLERKQVELLNQILNGRA >NC_009495|1822763:1878926|1838106_1838727_+|WP_012047630.1|DBSCAN-SWA MKNFDFGNLKYNYVAVHCNSQSELDNFIKQCEENDIIVGPDRQFDKNYGYIIVDSERLYCDYAAALKNEDYEIIEWEIENLKKDKEYSIQDILNMQEELEFIGSNGLPYKIKNGYLCVYFVKENKWEESGNSIQEILNMTFTLRYKDKKVSFEEAIQAYLKSKDIKCIWNDETIIYSDGFLDSDNDKLTMGQILKGEWYIKEGLNG >NC_009495|1822763:1878926|1876994_1877150_+|WP_003359020.1|DBSCAN-SWA MKESTIEKMKKIIEENKRKSSQNNSKLRAKKNIGGSRKAIRNKKTGGLFDK >NC_009495|1822763:1878926|1861987_1862212_+|WP_012047661.1|DBSCAN-SWA MDSNIQQEILERIVRIETKIDGYNSTREKADVAYNKACQNEKYIAEMKDNQKWLWRTIAGAIILGILSAVIKFK >NC_009495|1822763:1878926|1857468_1858095_+|WP_012047657.1|DBSCAN-SWA MKKKLINFLPPQISDIEEFKNIMATENVELELIEKGQERILKENFIDTATDYGIKHKEQLFKIRADLVNDTLEFRKLRIKNRKMDKMPITQRSLEHKLKTLFGEGNYKVEVLNDEYVLKVEINTFDWSMFNEIIDNFRYIIPCNMMLNSTLVQKISTSIYYASAITSGEEITVYPWMPKDITSKGKVNIAMGSNTGVENITIYPRKEA >NC_009495|1822763:1878926|1851803_1853966_+|WP_012047651.1|DBSCAN-SWA MATVSTALKMFDQMTRPLQQVTQALNLTISAMDQMNNAANKDIRITNSLNTARGAIQRASAGLQELVNEQDRAQNNQNRLNESFNRGSSEANGLTSKVKNLVGAYLGFQAAKKGLDLTIGGGARLEQQLITISGMLGNKDIGKAFFGGLNKYANESVYGLKEFNTITRSFIQFTKNTDKLMDLNKTAEKLAFLDPTQGLEGAGFALKEALGGDFMSLKSRFGFGKADAEILKASKSMDEFISKFDELLAKKGASDKALEEFNQSAVAQLNNLKSNIETAFAQASETALEIMKPLLSRINEGFKNGSFEGFFNGISVGLDIIVNLTMEAMDIITSLSQTFIDNWSIISPIIWGIVFAMIAYNATMGIAWLTTIQTTIAKIAHTIASWAETAAILALIIAQDGLNAALLACPLTWIIIAIIILIALFYAAVAGVNHLAGTSVSATGIIAGSFMVALAFIGNLFVAFYNLVVDIIALFYNHFSAFAEFFANVFNDPIGSIIRLFAAMADEVLGILKSIASAIDTIFGSNLANAVGNWQSGLQGAVDKLVGKPKIQFQKMDSSAMHLDRFEYGKAYDSGYTVGKNIGDKFDLGNIFNKGNIPDMGKMPDMAAWNKAQGPGTLGTAGDSGKNKGGKLPNAGNKGLKDANNHLKNIDDKIDISNEHLEMMRDLAEMESIQNFVTLTPTVQVTTGDIKEEADINKIISKIENYMENELANSAEGVYA >NC_009495|1822763:1878926|1825015_1825216_+|WP_003395988.1|DBSCAN-SWA MTVSKTLKYERLKRGMTQKEFAKLLETDRGSIAHYENGRIPLPATLKKFSDKLDVDLAKALMEGDM >NC_009495|1822763:1878926|1832709_1832973_+|WP_003359708.1|DBSCAN-SWA MQVGDIVYFKSKDEEKITPGTIIKANELEITVQYIDFKEPHIIEEIVNKPLKYKEKTYVNRQKDISILDIKNNLIELFLVHSISPIN >NC_009495|1822763:1878926|1866034_1866622_-|WP_011986310.1|DBSCAN-SWA MKKIFIDTETTGLEPGEIIQLTYCVCDINFRGEEKVSFAKNFFFDVDYIEESAEAIHGFSVEKLKILSKGKKFKDLASEISSDLKDGIFIAHNVNFDRKFVTAEFNRLNDMNWIPKEFFCTMEYFKPIVKATTRTGKLKKPRLEEAVDFLNIDKKIVLKGAKKLFNCDDVGFHDARYDVAALVSCYYRAKRLGYS >NC_009495|1822763:1878926|1827361_1827580_+|WP_012047601.1|DBSCAN-SWA MAKQFVEGNKYVFSAKKFKNHMGKKKYETNKCWVNESNGREVTIESSVTGGYKYYGIVPQWCKCIENNQGRL >NC_009495|1822763:1878926|1859825_1860218_+|WP_003357937.1|DBSCAN-SWA MIFLGELKKIEENKIKAKFIHYMPFNNVYGLHKTKEELEQEGILIENIPEPKYMENKQAIMYWNPADKSIFYEYEDVLKSDKELEQQKQQSLNAKLLKDNAEIQIELNKQKELNSSLLLRIAELGGNANA >NC_009495|1822763:1878926|1861209_1861965_+|WP_012721094.1|DBSCAN-SWA MSKLNKYIELIFVGIVTALLYYFTYMFQIGYLSYYNIPSSFAEISLPIMIRIMIFLFFITTFFLLSIQGMFSFLIDRFPKRVSNDVRILSILLLCVLYLSSLSVKYHKISVLLVFLVLLTILKRYQIYKKCKQKYVKEEKSDKNTPLFFENIMKNYPSVYNILLYMIIIMFIGNFVQIIGGLIAEFNPNEVEININNRKAVVVSEYKSKLIIKYKKANSSKLEDGFNIVDIKDNFKMILKEEKGVFNIAPF >NC_009495|1822763:1878926|1822763_1823813_-|WP_012047593.1|integrase|DBSCAN-SWA MAVYKNEERGTYFCTFYYTDWTGKRKRKKKEGFKKKKEAADFEREFLNKQKNNCDMNFKELSDLYLEHSKTRIRVTTFQVKEIIIKERILPYFKDMNVNNITPNNIRKWQNKLMSKDYKQTYLKAVNKQLNAIFNFAIKYYNLNSNPALKAGPMGKKDSEGMQFWTLEEYKEFIKCVDNPMCKLAFEILFWTGLRKGELEALTFSDIDTKNKIISITKTYTRINKKDIINPPKTPKSKRKVSISDFLCEDIENYKKKLYNFDKNERIFPVGRHILKNSMRDACEKSSVKEIRIHDLRHSHASLLIELGFSPLLIKERLGHENIQTTLDTYSHLYPNKGASIADKLDDLF >NC_009495|1822763:1878926|1845263_1845863_+|WP_012047641.1|DBSCAN-SWA MDLKELLGEELYNQVIQKVGNNKIDVVNNGNWIPKDKFNTLNEQLKTANTTIGDLKKSNKDNETLQTKVGEYETKVKEYEKQIQDMQFNYALEGALKGANVRNTKAVKALLNLENVKLDGETLIGISEQIEELRKSDSYLFSEEQKPKFSGVEPTDGSKTPQGYNPWKKESFNLTDQGKIFKENPEQAKQLMAQVGINQ >NC_009495|1822763:1878926|1825216_1825915_+|WP_012047597.1|DBSCAN-SWA MKELQVLNNKNLTLESTEVSEMTGKEHKNLMRDIRNYVGILEGSNLSSHDYFIESTYINSQNKEQPCYLLTKMGCEMVANKMTGKKGVLFTAKYVKRFNQIEQNELPKISTELRAILMLDNKTIEIEEKVTNLENNIPLFNVECKELQALVRKIGIKTLGGYKTPAYNDRSLRTKVYTDIQHQLKREFGVTRYEAIKRKQLDKAKEILVSYTVPVYLKEEIFNTNNQEEWEC >NC_009495|1822763:1878926|1826096_1826450_+|WP_012047598.1|DBSCAN-SWA MNKEQIVKEKIVSLFRKHNMEGSITQLFVCRYFDTKDIEDLRVLERAKLNPQLKMELTNLLRSYFNSTNKMTPYEQLIKQIEESFNYSNTDAEEYAKKLKNLSLVALEEIEREFKNA >NC_009495|1822763:1878926|1837437_1837848_+|WP_012721207.1|DBSCAN-SWA MGYCIDKEEGIIKIKKENMELALKKLSNFFQNGGSLRWVNGFNIEDMTAVEDDEETPLELEEIWNDLRYGYKETKTHYEIVDFLGEKLGDDLKLFELIAEYCEDGYLQFAGEDGEHFRIVIKEGKATETWAQLTWN >NC_009495|1822763:1878926|1844600_1844894_+|WP_012047639.1|DBSCAN-SWA MNIPNKVKIGGVNYKVIECNNPSEEEHQVDGMIVYHKQEIRLKNDMEKEYKENIFLHEVIHGLFEYIGFEQDESTVIRLSNALHGLIKDNPEVFKLE >NC_009495|1822763:1878926|1825916_1826084_+|WP_003395994.1|DBSCAN-SWA MSSFYKAKEVAKILDISVTQSYRIIKKLNEELDKKGYITIAGRVPKKYFEEKYYI >NC_009495|1822763:1878926|1837951_1838107_+|WP_012047629.1|DBSCAN-SWA MFKKILDDIYWWFCESPTIDRFESWLVNNRFETLSKLGIKLWDYRMGGDFL >NC_009495|1822763:1878926|1830865_1831168_+|WP_012047609.1|DBSCAN-SWA MLNKEQIEQCRRIVKCNGVTLQKFVAIEELAELQQAISKYQREPTIFGIDNIEEEIADVHIVLEELKIIFGIDKEEIENRIDYKLDRELKRIKCRELSKQ >NC_009495|1822763:1878926|1831233_1831953_+|WP_012047610.1|DBSCAN-SWA MNNLENSIKDCITKEIEKGIIEKVIAEQLEKCIEKSISDMFSWGGDVKKVVEEKVKSVMIPYLENYDYSQYIVKLDNVLTDVLKSSTLENRKLLENFKNLMASEDVSRELKISDIFSEWNEYCKAEIDNDELDFDCGSAYITTSFDVEEVSETWSSYKTFMVRFECEEDEKLKFEFSIHAWKPKDGSKYTSQYMKTTDLRSLRYLNDFEILMMRISEGYENIILDSEGDSEDIFIEYEE >NC_009495|1822763:1878926|1829054_1829948_+|WP_012047606.1|DBSCAN-SWA MGEVKWKVKWIKIVTDIFDDEKILLIENMPEADSIIVIWFKLLCLAGKMNNSGVFMLNEKIAYTDEMLATIFRRPLNTVRLAINTFQQFGMIEVIDNVITIPNWSKHQTLDQLEERKEYMREYMKGYREKQKLLATGECKVNSKTNGNVNSKANVNSLDIEEDKDIDIDIEEDIDSTTEVVSSNKLQPIVDKWNSLNLNKLIAINKGTIRYKLLNARIKEYGIDNILKAIENIETRPFLKGQNKKGWTITFDWFVKPNNFIKVLEGNYTDKEGVNGGIKQNTEGSKKQEYNFSKYEG >NC_009495|1822763:1878926|1848068_1848527_+|WP_012047646.1|DBSCAN-SWA MVELKGSDNIANINELRIGINQTLDNKFPNITIYNEEIGQGFEEPCFFIKVLSSGQGKEFNIRYKKNISFDIHYFNDKEDINSDCNDMADRLYEVLEYVKVNNSLYRSNEMTHEVIDGVLHFMLQFNYHVLKEIEEAPKMNKLKQEVYLNGR >NC_009495|1822763:1878926|1853965_1854643_+|WP_012047652.1|DBSCAN-SWA MYKMYLGINDGEEGFILPVLPEKIEFDEDGNNKTYDIINLGEINTINKPKLMEISFESFFPKHKGPYVSSEQLFEPSFYIAKIREWRDKKQKIRFIFTGSPLEINDLFTIENFKPSEEGGEVGDVHYSIELKRYKNYSAKKVVIVTPKTAAANQSVKKVIANSKATRPSNTNKPKTHTVSGNDTLWHIAKRYLGDGNKWPQIYNLNKDKIKNPNLIYTGQVLKLP >NC_009495|1822763:1878926|1834995_1835205_+|WP_012047621.1|DBSCAN-SWA MKIGELGMHCGECILIEHCGEPWSDIAICCEERFKDVDETKFLKLIETSQRKSKKARINDVHKRLLQGE >NC_009495|1822763:1878926|1842123_1843566_+|WP_012047637.1|portal|DBSCAN-SWA MIFIDKILNSGSNSVMTTEEIIQEEIKEWNSSQTRQLMLDGERYYKGDTDILKRKRMAIGEDGELEEVKNLANNKLVHQFIRKLSDQKVGYLLSKPLSVQTDNEAYKNVLDDIFNKSFMRLLKNLGKDAINKGIAWAQIYYNEDGELRFKRLPSEEIIPLWKDKEHTKLDALIRVYEVIVYEGKTKKTVQKVEYWDTKQVLRYINDNGKLITDVEAPEDEGHFSMVDDKGNKQSFTWSKVPFVYFKYNDEEQPLIKFVKSLVDDYDRNKSDNSNNLEDLPNSIYVLKDYDGENLGEFRRNMSLYRAVKVAGDGGVETRNLEINVEAYKTHIEQTRKDIYEFGRGVDTQSDKFGNSPSGIALKFLYNDLDMDCNIIETEFQASLEYLLWFVNQHLINTGQDDFTNENVEFVFNRDTLINETDSINNCQNSVGIISDETIVANHPWATKDELEKIKKQKEERESMYPNFPLEEIPEDEENEE >NC_009495|1822763:1878926|1863924_1864065_+|WP_012047664.1|DBSCAN-SWA MIESVGKLIALAISILTIRQLSLQNSKTELEIKKLRLEIKRLKEGD >NC_009495|1822763:1878926|1855638_1855989_+|WP_012047654.1|DBSCAN-SWA MGMIDTIKKASMGAVGASNPVNISFGEVVSTNELKIKVDQKLILDKDFFIIPESLTRYEVDLKHTHTYINNSIESNLNTSLDKLLIREGLKQGDKVLLLRVQGGQQYVILDKVVQV >NC_009495|1822763:1878926|1824207_1824567_-|WP_012047595.1|DBSCAN-SWA MSLKDILKNDRKQKEMTQEEYAKLIGITRGTLSHLERGREPSIDTSKKLSQYFGKPITELIGNKKIKKLSTLETTNMLIDSLINRGQIKEVPISDEVKQLIWTSLELEIKLKLQMLETE >NC_009495|1822763:1878926|1864432_1864678_+|WP_012047667.1|DBSCAN-SWA MKKEIRFLIVGLLIGACTRFIGIAKAIEPSEDNCPENGEYMYCLDKTTPLWISIYDVHQEEKFIYLRQPNSNKIIKLVELK |
94 | Clostridium_phage(81.25%) | terminase,capsid,plate,coat,tail,portal,head,integrase | attL 1807218:1807237|attR 1866679:1866698 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
2474630 : 2506923
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >NC_009495|2474630:2506923|DBSCAN-SWA CCTATTTATTACTAAGTATTTCTCTAACCCTTCTTATAGGCAAATTAAAAAACTCTACAATTTCTTTTTGTGTTACACCATATGAATTTAAATATTTAATTAACTCTTCTTCATCACTGACATTATGTTTTTTAAATAAATAAATTTCATAAATAACTTGAATAAATTCTAAACTATTTTTTTCTTTCATTATAGATTTCTTAATTGATGTATATATAATATTTTTTATATCAGCCGGGCTTAATTCTCTTATTGCTTCTATTACATAATCCATCTTTTTCTCATTTTCTATAAAATAGACCTGAAAACTTTGAGAATATTCAACAATTAATCTTTTTATTTGTTCTTTTGATGGTTTATCTAATTCAATAATCTTATAGAATCTTCTCCATATAGCTAGATCTAACAGCTCATGATGATTTGTAGCTGCTATCAAAATGCTTTCTTCACTGAATTCGTCTATATTTTGAAGTAAACTGTTAACTACTCTTTTCAACTCCCCCAATTCATTTTTATCATCTCTTACTTTTGCAATTACATCAAATTCATCCAAAAACAATATACATGGCCTTTTAGATGCATAATCAAATATTTTTCTTATATTTTTAGCTGTATTTCCTAAAAGTGATGATAATAATGAGTCAAATCTTGCTGTTACTAAAGGTAACTGAGTCTTATAGCTTATATATTTCGCTAACGAAGTCTTCCCACATCCAGGTGGACCATATAATAACAAAGTATTACTTACATCAATTCCCTTGCTTTTTAACATATCTCTATATTCAAAGGTTTTGATAAAATCATTAATTTCCTCTTCTATAAATTTATCAAATATAAGTTTTTCCTCCATAGATGTTGGCATCTTTATATCAACTATATCCATCCTACTTTCTTGATCCACAGGCTTGCTAGCAAATGAATCCAATGATACCATTCTTGTATTATTAGATTCTAAAATGTTCAATATTTTTCTTGAAAGATTTTCTTGACCTTCCTTTTTTAAATTATCAACAAGAACTTTTGAATAATTTAAAACTTTCTCTTTATCTCCCTTAATTCCACCCTCAATTATCTTAATTAATTCTGTATACATAACTCATCTCTCCTCATATCATATATATTACACTTTCACGCTATAAAAGTCAACATTATGTTATCTAAATTATTATTTTTGTTATCTTATTTATGTTTTTTGTTATTTTATTTACATTTTGGTTATCTTTAAAAATTTCGGATGTTTATTTAAATTATTTAATACTAATATTACTTTACCCTTTATTTATTATTCATCTTATATATAACTTTAAATTCTAGAATTCAATATTTAGGTATAAAAAGAAAAGGTAGCTCCAATTAAGAAACTACCTTCTTCTTCCTTTAAATCTTTTTGAACTACTTCTATTTCTCAGATAAGTTGCATGTTCTCTATTCTTTGATAAAATAATAAAAAAAGATAGATATAGAGCTACAACTACCCTATAAATACATTTTTCATGTACGATTATTCATTTATTATTTTATTTATTTTTTGAAACACATCTTTTAAGCAAGAATATATTAAAGTTAATAAAAATGGTATATTGTCACTTGGTTTAAAATTTGTAATTACACTTACATTTTCATCTTCGAGTAAAATCATGTTTTCTATTGCTGCTCTATTCATATGTGTATAATTACATAATTCTCTATATATTGCATTATTAGTTTTAAATTCTTCTAAAAAACTATTTTGTTTTAATTGTCTAGCTATGAAGTTATTGGCACTCTTTTTTGCGGCATATCTATTATATAGTTCATATACTACACGCCCTAATTCTTTAAACTCCATTTTTTCTATTACATCTTTAGTTAAAATTTTATTTTTAACTCTTTCTTCAAGAAAATAATTATTAAGCCTGCTTTTCACATATTTGATATTATTAGAATACGCATTATAGCCATTTATTTTAAGTTCTTTTATTGTTTTTATTTCTTGATTAAGGCCATTTATAATTAACTCTTTTTGAAACCTAATATTCTCATTCTCTTTATCATATAATTTAATACTTTCAATTATAATGGCATAACACTCTAAGAAATCTCTCGTTAATGAATGAATAGTTGTAAATTTATCTCCTTTTATTAAATAACTAATTTCACTAGCATAATTAAATAATACTATACTATATCCAGTAATAAGTTTTAGTTTTTTATCATCATCTATTATATTCGCACATTTTTTATTTTTATCATAATAACTATAAGCAACTTCATCTATGATTTCACATAGGCTATCTCGTCTAATTTTTTCATTAACTATATTAACCATATAATCTCCTCTTCATATTCCCAATATTAAGTATATTTCTACATATATTTATCTATTCCTTCAAAAAATAAAAAATAAGGTGCTCCCATTACAGAAGCACCTTTAAAATTAATATCTTATATATTTAGCATAAACATATCCACCGCATGGAGGATAATATATGTGCATCCAATCTCCCTCTTTTCTATATAAATTAACCTTTGCACCATTAGCTAATGTTCCTAATATTTTAGAACTTGTAGACTTACCTGCTCTAACATTTATACCGCTTGGTGTATTTATAGCACCTGTTTTACCATCTAAATTAATCCATCCATTATCGCTGTTACCTGTTGGCTTGTTTGATGTACTACTTGTAGTTTGTCCTACTAATCCTTTAACTATAGCATTAGCCATATTTTCAGCATTATATCTGTTCATATCTCCTGCATTATCACAGAAACAACATTCTATTAGCATTGCTTTAGATTTTGTATGTTTCAATACATAAAGACTAGAACCATCTTTTAACCCTCTGTTTGTATATCCTAAAGCACAAATATTATTTAATACTGCTCTAGCTTGTTGTAGCTCCTTACCTCCGTATGTAAATACTTCAGTACCATAAGCACTACCGTTATAACAATTAAAATGAATAGATACATATAAATCTACATTGTTATTATTAGCCGTATTAGTTCTATAACTTAAACTGTCATTTAAACTATTGCAAGTATCTTTATAGCACTTAATAACTTTATGTCCTAAAGCCTGCAATTTACTTATTACTCTAATACCTACTTCCCTGGTTAGATTAGATTCTGCTTTTATTCCTACTGCTCCATAATCAGCTCCACTTAATGTATGACCACAATCTATTCCTATTTTCATAAAGTTACCTCCTAAAAATTTAATAATAAAAGAACAGGTTTACTCCTGCTCTTTACTTTCTTTTACTGCCTGCCTAGCTGAACTTTGTCCAAAATAAAATCCTATTATTAATGTAAATACAGAAAGGAATTCTGTACTTGATAAATTCCCTTTTGTACTTAAAATACAAAATACTATAGTAGTTAATAGTGCTATTATCTTTTTTATCTGTAAAAACTGTTTTAGAAATTCCATGTAAACACCCTTTCTATTTAAAAATATTGTGTTGAATTGCATAAAAAAAGAAGCTTACCAAAGCTCCTACTGTTAATCCAATATACCATTTTAAAACTGATACTAATTGTTTTAGCTGGTCACAAAGATTTTCAATTTTGGCATCTGTCCTCGATTGATTTTGTTCTATTTTATCAATTCTCTTTGAATGATCGTTAAGCCTAATATCATGCACATTTATTTTTTCTTCTATCCTTTTATGCTTTTCTTCGCAAACTTTTAATTCCACATTACACCTCCATATAAATAGGGATTATGCTTTAAATAGTTCTTTCAATATAGTTTCTAGAACAGGTACAACAATGCTATTACCAGCCATTTTGTACATTTGTGTATCTGTTCTATCAACCCCTTTATAAAATTTATTAGTTAGTTTAGTTTTAACTAAATTGTAATCTTCTTCTGTAAATCCTGTAGCCTTCCAGCTCTCACATGGAGTAAGTCGCCTTAATTTGTATTCCATGATCTTAGGAACACTATGAGAGCCAGTTAAAATAGTAGGACATGCCCCTTGTGACGAAAATACCCTCTTATTCATATTAAGTGCTGTTGGATTTTCGATTTTTCCTATTCTCAATAAGCCATATTTATTAGGTTCCTTATTATCTACTACTTTTCTATCTACTTTATTAATAAATTCTCTTGTGTATTTATTAATACAATAATATTTTTTATCTACATATTCATCTAATATAGTATTTATTGGAACAATACTATCCATAGGTTTAGGGAATTTAAATAAGCAGGCATCTATATCTTTTCTGATTGATATACAAAACATTCTTTCTCTAGATTGTGGTGATCCATAATCTTTAGAATTTAATATATTCCAGTAAGAGTTATAGCCTAATTTATTCAATGTATCTATATATTTAGAAAAATTATGTTTATGCCTTTTACATGTTACTGCCTTTACATTTTCCCAAATTATATATTTAGGTAATTTCTTTTTAATAATATCAACTGTATACCACATTAATGATGATTTTGTTCCACTTCCTTCGTCTCCTCCTTCACCCTTACCTGCTAGGCTAAAACTTTGGCAAGGACTTCCATGAGTTAATAAATCAAAATCTTTTAATGTATCTGGATTAATCTTAGACACATCACCTAAATTTAAGCTTTCATTTGCATTATGAAGTACACTGTAAGCATAACTAGCATACTTATCTATCTCGCAATAGTTTATTATTTCATGATCTTGATTTATATTAGATAGAGCCTTTTCAAAGGCTCCTATTCCACTAAATAGACTTAATAGTTTTATTGTTTTCATTTGTATACCCTTCTTTCTTCTTTTGATGTAAAAATAGGCAAAATAAAAAGACCTGCATGGCCTATTACTTTGCCTTTATAAATTATTTATTTGTATCGTAATTTTTATCTATTGCGTCTTAATTATATCTTCTTTTTCTTCTACACTCATCCATTTAGCTGTTACAAATATGTCTAAATCTTCCTCATTGTATAATCCCATTAAAAAATATTCTTTAATATAACTAAGCATTTGCATTACCTCCTAATTGTGCTATTTTTAATAGTAAAGATGAGTTTAATTCTTTCTGTTTATTTAATTCTATTTGTATCTCTGCATTATCTTTAAGTAATTTTGCATTTAACGCTTGTTGCTTTTCTTCTTGTGTTTTTTCTCTTATACATATTTCGTAACTTTGTTTCTTAGTTTGTGGGTTTATATAATGTACTGCATATTCACTTTCCTTTAATTGTGGTTTGGGTAAAATATCATCTACTACTATTCCACCTGTTTTGTCTTCAACTATTTCTGGGAAGTTGTGTATTGAATAAACCCTAGCTTTATTTTGTGTTATTTTTTCTATCCATAGTAATTTCATTTTAAACCACTCCTATTTTTTCACATATATTTCATCTGTTAGTTTTCTTACAATTTTATCATGTCCAATATATATATAGCTATATCTTTTTATTATTGACCTAAGATTATAATCACAATAATATTTCCATATTTGAAGACCGTCTAAACTTATCTTTCTTATAATTTTATCGGAACTTGCAACGTAAACATAATCATCTACAAATATTGAATTTGCACTTATATTAAGACCAAGATCAACATGCCAAATTTGTTCTCCATTATCTGGATTTATTTTAACAATACCGTAATTAATAAATCCAATATAAATATAACCATTGCTATCTATTGCTATTGAAGCTATACTTCTACCGAAATCACGTATCCATTCTTCACCGCCATTTGAACAAAGTTTTACTAATCTATTACCACCACCACTATAAATATAACCATTTTTATCTATTGATATTGCATCTACCCTGCTTTTATGTTTATCATACGTCCAAATAACTTCACCTGTAGAATCTATTTTTATTACCTTTCCATTGTCAGTCCCAGCATAAATAATATTATTATCATCTATTACTATAGATTCTGTACCGTATTTACTAGAATAACGATTATTCCATATTATCTCACCAGATGATGAATTAATTTTAATTATACGATTACCTTCCCAATCTGCAATATAAACATAACCATTTTTTACTGTTACGGATGTTATAATTCTATCATGTGTATATTGCCAATATATATATCCATCTTCATCTATTTTTGATAATATTTTAGTAGATTTACAATATATCTTACCATAAACATCTAATGCTATTTTTTCTATTGTATCATAATCAGGAATTGTTATTGGAGAGGAACGTTTGACCTCAATTAATAAATTAGCTGGAGAGTATGCTGGAATTTGTTTAATTTTATTTGATAAAGTATCAAATGAATCATTACCACTTGATTGTATACCTTTGCCAGTAATAGCAGTAGCTATTTTATTTTTTCCATTACTGGCAGATGTAAAAAGTTCCTCTAAAGCACCTTTAACATTTTTAGATTTTATATTAGAACTATTTAATGTAACTTTATCTGCACTTAAATCTATATTATCTATTTGTTTCGTAATATCAGCCAATTGTGACTCAACTGTCTTTCCATCTTCTGTTTTTATATCGCTGGCCGTTAATACTACATCTCCTATTTTTTCATTAACTTTTGTCACTGGAACTTTAATATTTTTTATTTTATTTTCAAGTACTTCAATTTCAGATTTTTTAGCAAAAATTATAGTTGGATCTATTTTAAGAGTTATATTTTCTGTATTAGAAACTGTTAATACCATTTTCATTATCAGTTCTTTTGTACTGCCATCTTCAGCAAGTGGTTTATAGCTTTCTGCACATTTGGCTATAGCTAACATATTATTATCTTCATCAAATACCCCATATTCCCTAATCATAAAACCGCCAACATTTGCAGGAATCATCATTTCTACGTTTATCCAATTAGGATTTTTCTCATCTATAGCCACATGAGTTATATTACCTTCCCATACTGTATTGATTAAATCTTCTTGATCTTCTCTTGGATTGTAATAAGATCCTCCTCCATCTCCAACTTTCATTTTTACAAAGTTAACTTTACTTCCAAATCCAGCACTATTAGCTATTTTAGCTTTGCCTATTTCTGTAAGTAAAGTATAGAATTTTTCTGCCAAGTTTATCCCTCCTTTGGATATGTTGTTATAGTTTCTAATCCTGCATTCTGCGCTAATGCTATTTCTATATTTCCAGTGGTTTCAATATTGTTTGGTGTCCATGGATATACAGTTATAGTTTCTCCACTAAAGGAAGTTGCCCCCACATATAAATTACTTTCTGTTAATGCTATTAGCTTATATCTTACTGATAAATGGGAAGGTTTGATTCTTTTAACCTCTTTATATAAGTCTTCTAAACTTTTGGGAAATCCTTCTCTACCTGTTAGCTTAACTTCAAATGTATAAGGAGCTATATTTTCTGTTATCAAAATATCTGCTCCAGTATAATTCTTAAGAATTAAAGCCATTCTTTTAGGGTTAATTGCATATCTACTCTGTAACTTAGCTATTACTTTTCTTCTTCTACGTTCTATCTCATCAGTTAGATTAGTTACTATACTTACTGCTTCTTCCCAATAAATTAATCCCCATGTCGCACTTTGAGGGAAAAATTGTTTTAATATATCGTCTGCAAGTGACTCAGCAACATCCCATTCGTAACCTATAGACTCAAAAATAGCTTGTATCACTTTACTTTGTTCATAAATAGGTGAGACATATGTTATCATTTCTTTTCCCTTTTTGGACTTTATCATTGTATGTTAGTCACCTCACCTATTACAGCTACTTGATCTATAAGTTTAATGTTCTCAGTAGCATCATTTACAGTTAAGTTTTCAAAATCTTCTATTCCTTCTCCTGTAAGAATCATAGACCCAACTATAGTATGAATTGCATTGTAAAGTATAGTTCCTCCTATAGGTATTCCAGATAAATACTTGCTTAAACTTTCCTTTAAACTGTTTAGAACTATCTCAGAATTAAAATCTTCTTTAAATTTAAAATTGGCTTTTATATCAATAACTAAAGTGATTGGAGTATCTATTGTTGCAATAGCACCTATAGGTGCTTTTCCACCTCTATTTTCTTCTTTGGGTACTATTTCATATATATAATTTTGAACTTTATCTATAAGTTCTTTGGTGGCAGGTTTATTATTTTTATCTAATATTAATACTTTAACTGTCCCAGGACCATTCCATTCTTCTATTACATATGCATAACCAACACCATCTACTTCCTTAGCCCATTTTTTATAATGTTCATTATTACCACTTGTAGCTTCATTTTTATATTCTTCTAAAACTCGTTCCCTATAATGTTCTTCATCTTCTAAATCGGTTCCACCTGTAAACTCCTCTTCATTTGTAATACTCTCTATATCATTAATACGATCCATAAGTACGGTTATAGTGTTTCTCAGTACATTTCCTATAGTACCTGACTTAACACATTCAGCTTTAACATAAGCTACTCCTGTTTCATCAATAGCTTTATTCTCTATAAATTTAAAAACAATAGATTCAGAATCATCTGTTGCTACAGTTCCTATTAATTGGTCTTTGTATATATTAGTGTTTTTTCTTCCTATAATTTTTATAACTCCTATAGCTTTGGTAGGAAGATTTTTAAATACACCTTTACATTCTCCTAAATATTCAAGCCACACACCATAACTAGTTTGTGGAAATGCTAACCTTAACATGTTTTGTAATTGAACTTGCATTAAACTTGCTTTTTCCTCTGCGGCAGGTCTTGTATTGTCCCAATAAAAGTCCCCTTCAATAATAGACACATTAGGTGGTGCTTTTTCTAACATTCTTTCATGTACTGTATCCGCATCTTCTTTAAGGAAATCCGGAATAAGTAACTCTCTTTTCAATCATATCACCACACTTTCAATTCGTTATGCAACATAAACTTTTCTTCATCTATAGTTAAAATTTCATAAGTGTATAAGACCTTTTCTTTATTATCAGACCATTCAAAAATAAAATTATAAACATCTTTAGTTCTTGGATGTACCATAAGAGTTTCTTCTGTCATTCTCTTAACCTCAAGTTCTATGGCATCTTTAGAAATATCTTGGCCAATAATATTTTTAAATTCTTGTCCATATAAATCACTATAGGCTAGCTTGTACCTTGGCGTAGCCATGGCTTTATAACACCACTGTACATAGGATTCTAAATCATTAGCCCTCGCTATACTTCCATCAGGATTAGTAACAAATTCTCCTGTTTTAAAATCAAATAAATAAGAACCCTTAAATTCCAAAGGTTCTTCTAATTCTTCTATATTATTTTCTTCTAAATTAGTATCTTCTGGGAATAAATTAGGCATTTACAACCCTCCCAACTACAACAAATTCATTTTTTAATAATGTAACTAATACTCTATCTCCTGGACCTAATGGTTTCAATTCTTTAGGTGTTTTAAAATTATGGCTATGAGAATGTTCTCCTGCAGTTTCAGTATTATATCCATTTTTCATTTTTAAATAATCCAACATCATGTAATCTTGTATTTCATATTTAAAATTATCTAACTTTAATCCTGTTGATGTTACAGTTCCTAAATCTAATCCTATATAAGAAATTGCATTATAAACTGCTTTATTTGTACTGCTTTTTATCTCTCTTGCTATTTCATTAAATATTGTCTCCACTATAGAATTTCCTCCTTATATAATCTAAATTAGATAAATTTAAGTCCATTCTTCCAGTACTGCCTAAATTATGTGTAACATCTATAGCATATAATATATTTCCATTAAGACTTACTCTATCTCCTGCCCTAATACTGTTTATATCTATCCCATATACATGTGTTGTTTCTTCTCCTGTATTGAATAAAGTATTTGCTCTTTTTTTAGCCTCTGCACCACTTTTTATTTTTTCATCTTGTACAAGTTTTTGTATTGTTCCATACTTACTTGTATCTTTTTTATATACACCAGTAACAGGAGTTTTTTTATTTTCCTCCTGTTTGCCTAATATTTTTACTTGTGTAATCATACCATCTAAAGAACTTTTCTCATTTATATCCTCTGCTATAGACTCCAATTTCCATACTGTTTTATTACTACCTAACTGCACTATATTTAACTTGTCTAACATCCTAAGTTTATAAAGATTTCCGCCCTTTTGAGCTGTTTCTTTTAGATCCTTCAACATCATACCAAGAATAGATTCACTTCTATATACTGCTTTAGCAAGTTTAGTCCTAGTATTAACTAAGCTTGCGGTAGGAATTCCCCAGTCTCTGCAATATTTTATAATTCTTTGTGTAGCAGTACTTTCTCCAAATAAATACTCGTCTTCGGACTCTTCTATATATATTGTTCTTTCTTTACAGGTAAGTGTTATTTTTTTGGATTTTCTAGATTTATCCATATCCCATATAACACCTTTAAACACTTGCTTATTTTTCTTAGTTTCAAAATCAATATCATATATTTCTATAGAATGTCCTTTTTCTATCCCTAGTTTCTTAAGTTCCTCTGTCTCTACTAGATTAATATTAGCAGTATATGCTATACCATCTATAGCTTCACTCAGCTGTATTCCTTCAGATAAAGAATCTATCTTATATTTATTTCTAAGTATTATAGTAGCCATATTACATCACCAACTTTTGTCCTGGTCTTATTACATTAGGATTGGGTCCTATTGTAGCTCTATTTTTATTATATATTTCCTGCCATTTGGAACTATTCCCATACCACCACTTAGCTATCTTCCAAAGAGAATCTCCTTGCTTAACTACATATATTCTAGAATTAGATTTTGTAGTTGGTCTATTATCCTTTAAAGCTACCTTTTTTACCGTGGATATTGTTTTAGGTGAAGCTAATGTTTGTATTTTAAGGTCCCTATGTGTTCTAAAACTAATATTTATATATTTATCTCCTGTTTCTCCTCCTCTTTCCTCTTCACTCACAGAACTAATATTTACTAGATCGTTAAACCCAAAGTCTGTAATTATTAATCTAAGAGGCTCTTGTTGCTCCATCCACTTCTCTAATTTAGCTATAACTTCTAAAGGGATTGGAATATTTCTATATCTGCAATAAGTATCATATTCAGCAGGTAATAATGTATTAAAACTTATTTCTTTTATTTTTTTACCTTTATCGCTTAGGTCTACTTCTCCATAGTCTACTATATCAGCAGTATCATATTTTTTAGTCCTATTCACCATTACGTTATCTATTGGATTAACAGGAAATTGGAATGTTGTTTTTTCTTTTTCATTTCTTAAGTATACATCCAATGCACATCACCTCAAATAAAAAAGAGATACTTAACAATTTAAGCATCTCTTTAGCTATACTATTTTTTTATTTTAATGCATCTGCAGCCTTCTTATACTTTTCATCTACAATACTAGTATTTTCTAATATATATTTTCCATCTTCTTTTTTATATGTTACAACAACGCTTTTCATTTCATTATCTACATACATAACATAAGCAATTCTTACAAATTTTTTCTCAATAAAATAATTTTCTAAATTAGTTTGTATATTGGCAGCTTTCTTAGTATAAGAATCTAATTCTTCCATTGCTGTTCCTTTAGTAACATTTATACCTATATTTAAATTTATAAATCCTACTTCTGTGTCCTCTATAGTAGATATTCCTTTAACCTTTTCTATAGAATTTATTTTATCATATAATTCCCCTTTAGTTATTTCTGCTGTTTTTTTATTATTTTCTTCTTTTTTATTCTCAACTTTTATTTCTTTAGTAGTCTCTTTACTATCTTTAGCTGTTTCATTTCCACAACCCATTAAATTTAATGAAAGTATAAATATAAATATTAATAAAATTGAAATTTTACTTAATCTTCTATTCAAAACAACCCCTCCTTTTCTGTCATATTATAACATATTTAGGAGGGTATTTATATTACTTCTTTATATTTTTAAAAGCTTCTTTTATTTTTCTTCCTACTTCTTTTGTTGTTTCTTCTATTATTTCATCTACATTTGCATCAGAATCAAAATTATTTTCAACTCCTACATCTCCAACATATACATTTATCCCACCAGCTCCAGCAAATTGAGGCTGTGCTATTGTAAATTGTGGCTTTGGCTTCTCTTCTGCTATTTGATTATTTTCTTTATTTAATCCAGATTGTAAAAATTTTTTGGACTCTCTATTATTTAGTACTCTTTCTCCCCCTTTAAATAATCTCGTTTGCCTACCAACTAATATTTCAAAACCTCGCTCCGCTACCTCATGTACACCACTAGTAGCATTATTTGTTCCTGTTGCAAGAGCTTTCCCAGCTCCTGCTATGGAACCTGGTCCATTATAAGTATCCATACCATTTTTATCGTCGCCTTTAAAGAAATCATTTATCCAAGTTGTTATCTTTATTACTTTTTCTTTTATGGTTAAGGCATTAAATTCATGTATTTTAGCAATCATTGCATCAAAATTATCCCGTACTCTCCCAGTTTCCCAATCTACTTCAGTAACATGTTCTCCTGCCTGTTGTTGGGCATGTGATACTACTTCTGTATGCATTTCTTGTGCTTTTGTAACAGCGTCTTCTTTTTGTCTACTAGCTGCATCTAACATTTGATTAGCTTGATCAGAAGTTATTATTCCTAAATCATCTCTTTGATGTATAATTTCCGCTACAATTCTATTATACTGTTCTTCTGCAGCTTGTATTGAACCATCTCTAGCTTTGGCACTATTTTCTACAACTTTTGCCGCTTGTTGTGCTGTTAAATTTCCACTATCAAAATTTAGCTTTTCCAAAATGACCCTTTGTTCTTGCGCTGACTTTGATATATTTTGCACTGCTGTTTGAGTCATATTGTTCCTAATTGTGTTAATTTCATTTAAGTCTTGTGTTGTAAGCTTTTTATGATTTTGAAATGCCTGATTCACTATTTCGTCTATTCTTTGCTGGCCTTGTTGAACTATATTTTTTTCTGCTTCTTGTTTTTCCCTTATTTTTTGTAATATTTGTTGATTTTCCTCTGCTTTAAGCCCACTTTTTTTACTCATAAAAGTTTGCATAGTTTGATAGCTTTCATTATATCTCTTATCAATAGCACCTTTTAGTTGGTCTGACATTTGATTAAAATCACTTATAACACTTTGAGAGATTTCTTTAGTTATTTTTTTATTATTTATTTTAATATCCATAAGACTTTGTCCCACATGTTTATCTAATTTCATATATGAATTCATTGCTTCAGCAGTGGATTTGGATACTTCTTCTCCGAACTCTTTAACTGCAGGAATTGAATCCTTTTTAAAATGTCTATATAATTTAATTCCTGCATATGTTGCTCCACCTATTGCCCAAGTCCAAGGATTTAAGAGTAATGCTCCTCCTTTAGCTGCTAATCCTAAGGCTCCAACTCCTTTAGACGCTAATCCTGCTCCCGTAGCTAATGTTTTTGTAGCCTCTGCTGTAGCTGTAGCTTTTTTAGTAATACCAAAGAAAGTAGATAACTTAGGACTTAATCCAATTAAAAAAGTTAATGCTTTTGTAGTTCCTTTTATATATTTAGTTAAAGGATTAAATGCTACAGCTCCTATTGCTACTGCTGCAAACATTTTTTTAGTACCTGTACCAAGGCTATTAAACTTTTTAGCTAAATTTGATATAGTGTCTACAACTTTAACTATCCCTTGTGTTATATCTGGGATTTTAGCTGTAAACCAACTTACAAACTCTTTTGCATAAGGTGCTAACTTCTCTCCTAGTTCTATGTTCATACCCTCAACTGCACTTTTAAGTATGGTAAATTGACCTTGTAGACTATCTAAGCGAGTTTCTGCCATCTTGCGTGCAGCACCGTCTGAACCTTCTAATTCCTTAGTCAAAGACTGTAACTTTTCGGGTCCCTGCTCAACTAATGCCATCATACCTGACATAGCCTCAGTTCCAAAAATTGTAGAGATAGCTTGAGCTTTCTGTTGTTTAGTTAATCCACTCATAGATGTTTTTAGATTTCCTATTACTTGACTTAAAGGCAGCATTTTGCCATTACTATCGAATGCTTTAAATCCTAATTTTTCTATAGCTTCTGCCGCCTTTTCGGATGGATTTGATAGCCTAGCAAATGAAGCTCTTAGAACAGTACCAGCTTGGCTTCCTTTTATATTTGCATCTGCGAGCATACCTATTGCAGCACTTGTTTCTTCAAAGCTAATCCCTAATGCCTTACTAACTGGAGCTACATATTTCATTGACTCCCCAATTCCCGATATGTCGGAGTTGGTCCTGGATGCAGTAAGTGCTAATACGTCTGCAACATGTGCACTTTGCTTAGCTTCCATTCCAAATGCTCTTATTGTCCCTGCTGCTATATCTGTTGCTTCTGCTAATTGTATATCTCCAGCAGAAGCCATGTCTAACAATCCTGGCAATGCTGCTATAGTTTCCTGGATCTTAAATCCAGCTTGACTTAGTAGCATTTCGGCATCTGTTACATCTTTAGCTGACCAGGCAGTTTCTGCTCCTAATCGCCTGGCTTCTTTCCCCAGTACTTGCATTTCTTGTGCAGTAGCTCCACTTATGGCTTTAACATTAGCAAGTCCCTGTTCAAAGTTAGAGAAATCCCTTACAGCGGCAGTTATTCCTAGTCCACCTACCATTAAAGCTCCGGCGGCAGTTATAGCTGCCAACTTAGAACATGCTTTTTTAGAAAAATTAGATAACTTTCCTTCTATCTTTTCAAGGGGTTTACTTAACTTATCTTTTAACTTTACAGAAGGACTGGCTTTTATTTTATCTAAAGCTTTAGTTCTCTTCTCTGTTTGTTTTGCGAATCTCTCGGTTGCTGCTAGCTTCTTTTTGGCTTCACTATCTCCTTCAACCCCAATTTTTATATCCAGTCTATAAATTTCTTTTTTAGCCAATTATCTAGCCCCCTTTCGGGCTTGCTCAGCTATTTTCTTTTCCTCTTCTATCTCATAATCAGTAAAGGCGAGAATTAATCTTCTCGCCATATCATTAATTTGAACATTATAAAAGTCGTGAGGGCAAACATTATGCTTTGAATACATATTGTATAAAGCTGTTATTTTTCCACCACGACTTATTAGTTTTTTATATCTTCAATTTCTTCTAATTCATTATCAAATCCACTTAATTCTAAAACCTTATCTCCCATTGCAGAAGTTTCTCCTGCTAAGAATTTCTTTCTTATAACTTGTTTGCCATCTGATGCTTTTAGAGCATCTAATAATCTTTCATCATTCCAATTAGGTGTTACTGTAGCTGCTTCTATAAGTGCTGCATTAAATTCCTCATCGTCTAATTCTTTTATTCTTTTTCCTCTTTCTTTTCTAGTATAAGTGCATTGTCTTTTTATTTTATTTATTTCTTTTTCACTTAGACCTTTTAAAGTTACTGGAATTCTCAATCGCTCTATAAAATAAGTTGCTTCTGGAACTTCATCAGGCTCCATAAGCCTATTTATTATATCCTCCTCTGTCATATTTAATATTTCTTCATCTTTTATTTTTTCATTACTCATTAATAATTCCTCCTAAAATTTATTTATTCTATAACTATTGGGTCTAAAAGTTCATATCCCTCGTAAGTAAAAGGAGTTTCCTCCTCTACGAGTTCATTTGCTTTCAAATTTATAAGGTTTAACTTATCAGCCATGCAATTCATAAGTCTTATTCTTTCAAACCCATATGCTTCAGGATCTTCTAGAGATGAAATAGTTTCAAATCTTTTAAATCCCTGCTGTATCATTTTTGAAGATACTTTATATCCACTTATTGAACCTGTACCTTTTTTAGAACCTTGTTTATATCTAGTCCAGTCATCCCCCAAAAGATTAAGCTCCTTTTTATCAAGCTCAACCTCTGCAGTACATTCTGTGAGGTTTGTCTGCCATTCTCCATCAACTAAAATTTTACCTTTAGAACCGTGTATGGTTCTACTTGCATCTAATGCCATATACTATCACTCCTATCTTAAATATCCTGTTCCATAGATACGTTTCATTACATTTACATACTTGGCATCCCATTTCCAGAATACTTCATCATTTTTCGCCTTAGCTTGTAATTCCTCATCTATCTCGACTGTAAAGTCTTCTATTACGCCTTCTTTTTCTAAAACCTCAAAGTATTGTTTAAGAGCACAGATCAGTGCTAATCGACCTGTTCCCTCATTAGGTACTTTACCTATAAACTCTTTCCTTTTTAGTGCAGTATCTCCATCAACTGCATTCATGAACTTTATACCCCTGATATATCCCCAAGTTTCATTTTGTTCTTCACTATATTTTTTTAGGGTATTAACATCATCTACAACTATAACTTCATCATCTTCTTTTACCATGACTAAAGTTCCAGCTTCTAAACAGTTCTCTACTTCTTCCTTACTTAAACGAGGCTCTACATCTTCAAATATAGTCTTTTCATTGCAGATACTCTCTTTTAGCCTTTTACCTGTTGCTAGCCCAGCTATATAGCATGCAGTTTCAGGGGGTGTATACTTTACACCTTCATAGTAACCACTAATACCTACATTAACTATTCCCTCAAAGTTAAATTCTTTACTCTTTGTGTTAGCTTGTTGAATAGTATCTGTATCCTTAATTCCTAAGTAAGCAATTATATTGTTGCCTTTTGAGCTGTTTCTTTTAACCCATGCTTTTACAGTGCTTTGTAATGATTCATCAGTTACACCATCTAAACAAAACCCATCAGCTTTATAACCTTCAAGTATTTCCATAGCTTTAATATAATGCTCATTAGTTATAGATGTTGTACCATCATTGCCTCCAGTAAAAGTTTGATTAGCGACACTTGCTAGTTTCCCATTACCTTCATCTACTTTAATAGCCTTAAGCCATATATTTTCTACATTTTCATTTATATATTTAGCTATTTCTTCTACAGTTCCACCAAGTTCGCTAAATATATATAACTGCTTAGCTCCTTCATATAGTATTAAATCTTTTTTATCGCTTTCAACTATATTAGTTCTAACTGTTACATTAAAATCTCTAGTCGTAGGATATTGGGTTTCTATTTTTAAAAGATCTGTATCTTCTGTATCCTTAAGCATTACACTTGCTATCTTTTCTGTACCATCTGTAAGTCTATATAGTAATAATTCCTTAGGTTGTCCTAATAGGGCTAATCTACCTAATCTATAAGCTGTATTGTCCTTGCCAAACTTATTTATTAAGTCTTTTTCATCTTTTACACTTATTACTTTATTTACTGGCCCCCAATTAGCTTTAACTGGCATGGCCAAAATGCCATGTATTCCAGTTCCTATTCTTTTTTCTGCTAATGATTTAAAACGGTTGTAAAACCCCGGTATAGTAGGTCTATTATTTTCATTCCATACTCCTGTTGCCAACTAATTCACCTTCCTTTCTAAGAAATTTTTAATTCTTCCTTCAAATTCTTTTTTAGTCATCTCTTCTTTACCACAATTAAAAGTAGCACCAACCGCTACCTCTTTTCTATAGCCTGTTAGTGCTTCACAATTTTCTATTAAGTCCTTGATAGGATATGTTTCTTCTATTTCATTTTGAATTACATTAGTCTCTTCATCCATATATTAAACCTCCTATTCTAAATTTCCTCTACCATAAATCTTATCTATAGTAGGAATATTATCTTCTATCATTTTTCTCCTGGTTAATTCTATCGTTAATTGTCCTACTCCTAACATATCTGCAGCTCTATCTTCCTGTATGCTTTCTATAGTCAAATATCTTCTATCTTCCAAATCCAAAGGTATTTTTAAGTCTTTTATAAGCTTATCTTCTATTTTATCTAAGAGTTCATTTATTTCATTTTTATTATTACTAACAATATGACATACAAGAGTTTTATTTATTTTAATTAAAGCTGTATTAATTCTTTCTCTAGCTGAGTTTGTTGTTCTCCATAATATAGAAGGCACTTCAAAATCTTTTTTCCAATTATTCAAGTAAATTGGATAATTAATTATTTGTTTAGTGTATTCTTCTAAAGCATCTAGCCATTCATCTTTATTAACTTCATCTTCTTCATGCAGAGAAATAACTTCAAATCTTAGTCCTCTAGCTATGGCATTCCATTCCTCGTCAATGATGTCTTGGCCTATTGCTCCATTAAAAATGCAAGTAAAAGTTTCATTAGCGTTAGCATCTTCTATAGTTTGTAGATCTAAAGCTTTTATTACCTTTTCAGATAAAGAATCTAGCTTTTGGAATGTAGTTCTTTTTTCATAAAACCATATCTCAATGGTTCTTTTAAAACTTGTAGGATTATTCTGTTCATCATCACTACCCTGTACTATAACTGCATAGGGTTTTGGTGTGTCTTTTGATGGGACAGTAGGCTCATAACAATTTTTAAGTTCTGGAATACTATCTATTAATTTTTGTCTTATACCAGCTCTCATACTTAATCCTCTATTTTATTTATATCTGTATTTGTATTTGCCTTGCCTTTAAATTTTACATTATCAGTATAGATATCTAATTGTAATATAGGTATATTTCTAGCATCTATTTTTACTTTAGCTGATTTAGTTACCATAGAAAAGTCTTTCCCATCTATTACAACCTTGCTAATACTTTTATCTATATCATAATGTATCTCTACATCAGCTAATTTTAAATTATCCATAATCTAATCACTCCAATAGTTTATTACTGCACTTTTAACCATCTCTCTGTTACCTTCTAATGTATTTTCTATAGTTTTAAATCCTTTTGTACCAGGATGATTTACTTTTTTGACTGGATGTGCTGCACCTTTCCAATATAAGGCCTTTCCATTCTTAGGAGTTATAACATGAGGTTTACTTCCTTCTTCTAATATCTCTCCGTATTCAACACCATGAGCCAAATATATAGAATAGTTATTTCCTCCACCTTCACATCCACTTTTTAAACCTTGTCTGGCATGAGAGGTTCTATCTGTCCATTTAGCATTATTCTTTGCTTGGCTTTCTAATTTTTTAGCCATTGTATTACATAATATATTCATTCCTGCTTTTTTCTTTGCAATATATGCAATAGCTTCAAAGCTCATATTAATCTATCCTTTCAAGATCACATATGTACCCACATATAGTATTTTCTATTTGTATAGGATAAGTTGCTGTAACTTTCATATGTCCTTCTATACACTCAAATTCAATAGCTTCTTTAGGATTAATTTCTATATTTGCATCTTTATCAGCTATCATTTTGTATTTATTGCTGCTATATGAAGTACCAATAGTCTTACTATCTACAATTACTTTATTTGAATTATCTTCAAGATATATAAGAACTTTAAGATTCTTTTCACTTTCTGCTTCTTCAATTGCTCCACCAACAACAACCTTTTTAACTTGTTTAATAGTTATTGTTGATGGATTCAATTCTATTCCTTTGTTAATTGTATTTATAATCTTTTTAGCTTTTAAAGTAGACATTTAACATCCATCTGCCCTTCTCATAGATGTTTTGTATCCTGTAGCTTTACTTGGATTTACATTAGCCTGTTCTTGTAAATAATCAGCCTGATACATAGCGGCTAAGTTGTTCCAATAATCTGGATCAGCATTTTCTACTTCTATAGGTCCTACTTTTATTTTCTTATCAGTATTAGCTTTCATTAAACAGCCTCTCCAACTAGCTTTAAGGACATCATTGTCATTAACTGCTAATAAATTATTAAGCTCTTCATCACTAAATACTGGATACCGATTTTCATTAAGATTTATTTTTAATATTTCTAAAGATGTAAGTGTCATAACTATTCGTCCTCTTCTATCTCGGCATATTTTCTTAACTCCTCTAAGTCACATTCTTTAACTTCAAAATCTTCATCAACTTTAATATGTTTTCCTCCATATTTTATATATTGCTTTGCTTTTGCTTTAAAAACTTTCTTTTCTTCTACATTTTCATCTTGACCATTTTCTGTTGCTTCTAAATCTGTAATTTCTGTGGTCTCTTTTTTAGGTTCTTCCTTAGACTTTGCCATAATAAAAATCTCCTTTCTTTATATAAAACTAAAGAGTAGCCATGTTGACTACTCTACTTAATATACTGTTGCAAAGAATACTTCATCTGCTCTGTCAAAACTTACTATGGGCATTACACTTACCTTAGTATCTACTGTGACTGGGTCTTCTTTGACCATAGTTGTTACTGCAATTCCTTTGTCAACCATATAAGTATCCAGTTTAGATGAACCTGATTGTTTATCAAATTCTTCTGGAGTTGTACCATAAACTGTGTTACCTAATATATTTCCACTCATGAGTGTTACTTTACCATCTGCATAGTATGGAACTGGATCAGCACCCTCATATGGAATATAAGTAACATCTTCTAAAAATACAACTGTTAACTGAAGCACCTCTTTTACAAATTGAATATAATTTGCTTGGGATAAAATTAATGAAGTATTTAAATTACTATTCTTAATATGATTAGTAATAGCTTTATTAACTAAAAATGTACTATCAAAAGTATTTTCAGTTAATAACAATGTTTTAGGTTTTGCATATTGGTCATTTGTAATAGACTTTTGCCATGCTTTTGTATCTCCTATAATATCAGCATCAGGATTTGTCCACTTATCTGTACCTGTTAGTATCTCTCTATGATTAGATGGTACTCCATAATCTACTACAATATCACCATCTTTTGAAGTAAAGTTTAATAACCCATTTTGAATCACTGATGATCTCATTTTCTTTGAAATTATATTTGCTCCATCTATCAAATTGGAATAATTCTCAAATACTTGTCCTAATAGTGCACTTACAAAATTTTCATTATTTGCTCCTATTGCGTTTTGTAAATCTCTTCTGGTTGTTTCATCAATCCCCATGCCTTCCTTAAAGAAAGGTATTTCTGTTGATTTAACAGTTAAATCGGCACTTAATGCTCTCATTTTTGTTGCTGCATCAAATGTACTCATTCTTAATGCTATTGGTTTCTTTTTAGCACCCTTAGCCATTTCTAATTTTGTTCCACTAACTTTTTTATCCGGAAATAAAGCTTTATCTATAGTTTGTTCTGCTGGTAACTCTTTAATATAAAGAGCTATGTTTTTTGAATTAATATAATCTCTTAAATTAGGCATACATGTTTCCTCCCTATTCTCCAAAAATTATTTGTTTTAATGCTGCCATTTCAGCTTTTTTAATAGCTTCATCTTCATTAAATTTAACTGCTGATTCATATAAAGCACCATGGACAAATATGGGCACTACTTCTGTAGCATCTCCGCTATAATTTGTTGATGACATTGAATCTTTAAATGATACATCTTGATATACAACACCAAATACATCTGTTTTATCTGCTGTTGATGTTACTGCCTTTCCTTCTTTGGTAATTAAAGTACCAGCCAATAATACTTCATTTTCATCCAAAAGTAATTGAACATCACCTTTTCTAACCTTAATTGGCAATGTAATAAAATGATCCCCTGCAATTAATCTTAGTTTGTTTTGTTTAGCACCTATTGTGTAACTTGATTGTCTCAAAATACATTCCTCCTTTATTTAGCGAAATCTGCTAACCCTTTTATTTTCATATTTTCTGCCCTTTGCTTACCTAATTTTGTAGCAAAGTTAGGTTTAGTTGGTTCTTGACCGCCTTCACCTCCAGTACCAAATGAACCTGTACCTTTAACTTCTTTTTCAAATAGGAAATCATGGGATTTTTGAAGTGGTTCAATCTGCTCTTTAAGACCTATAACATTATCTCCATCTACCTTAAGCTTATCTTTATCTATAAGTGCCATAATTAACTTTTTATCCTTAACATTAAAAGCTCCTAAAGACTTTTCTAAAGCATTGCTAAATGAAATATCATTTAATTGTTTTTCATAACTTTCTTTTTGTGTTTTATTATCCAACTCTAACTTCTCTACTTTTTCTTTTAAGCCATCAACATCTTTATATTGTTCTTTTAGGTCCTTAAGTTGAGTATCTCTTTCTCCTACTTGCTTTTTATATTCCTTAGACTGTTCATTTACTTGGTCGAATCTACTCTTAGGAATGAAAGCACCTCCTGATACATCCTCAAAGTCTTTATCTTTATATTCCTTTTGTTTATCTTCTGAAAGTTGTTTAAATAACTCTTCTCCTATAATGTCTTTAATATGTGCCATATTTTTATCCTCCTTAATCTCTAATTACAGTTTTTAACGTGCTACTGAACCACGTTAGAGTTCACTTATTTATTTTTTTACGCCTGTAATAAAGCTAAAAAGGCAAAGAAATAAAGTCTATTAACATTAGACTTACACAAGATATTAGATATAAAAATAGCACGTACTCATTTTCCTAAGTAAGTGCTTTATAATCTCAGAATTATATCTGTTCCAAATTCATGTTTTAGTAATTTTAACATTTCTATGTAAATCAAATCTATTTTATTCATAAATTATATTTTCCCTCCAACCTTTTTAATAGCTTCTTCTATAATGTTCTTTATTTCTTTTGGTATGTTTTCTCCACTTAAATATGCATTAAATGCCTCTGCAAAGCACTCTGCTGGACTTGCAGTCGCATACATACTTATTTCAGATGCCAATACTTTGCCTTCTAATTTATTACTATTCCATTCATATCCTTTTGATTTAAATACTTTATTCCCAAAAAGCTGTAACTTTTTACTATAATCTCTGTTTATATTAGATACTACATTGTGAAGATGATGTCCATATTCATGTTGAATGACATCAGGTACATTTTTAATTGTTGCTTTTCTTACAGATTGTTTATTTATTAATGCATTTTGATATTTCTGTTTCGCAAAAAATTTATGTGCAGCATCTTTTTCCTTTTCCATCTCTTCCACTGCTTCTTTCATGAATTTGTTACTTAGAACATCTAAATTCTTTGTTTTTCTGAAATTTTTCCAATTTTCTTCACTTGTAACTCTATCTTTAATATATTGAATCGCATCATTTGTTTTATTTGAAAGATACATGGTTTTAGAAGACCATTCATATGTCGCAACGCTTCCAAACATATTACATTTACCTGGACTATACTTTATTTCATTTAGAGGAGGTAATCCATTAGTATTAACTAATTTTTGTAATGTATCTTGTACTTCTTTTAATGTTTCAATACTCATTTTATTTGATAATTTAGCTTTTTCACATATACCTTTATTAATTAAGTATTCTTCCACTTCCTTTGCTTTTTCACCTTGTATATTTTCAATTTTTGTTACGATGGCATCTATCTCTGATTTTTTATTTTCTACTTCACTTGCTAATTTAATAGATTTATCCCATGTTTTTTCTTCAAATGTAGTTATTGCTTCAAGTTCAACTGCTTTTTCCTTTTCATTTAAAGTTTCATATTCTATTTGTAATGACTGTTTTTTATTTCTGAGTTTATTGTAATCTGAATACTTTCCAATATTTTTGTTATTATTTTTTGTATCAATAATGTTATTTTGTTTCTCTTTGTAAATTTCACTTACTTGATTTTCACTATACCACTTATCAAGCTTTTCGTTATTTTCTCCATTACTCCATGCCTTTAGTTCTTTAATAGTTTTATTAATATCTTCATTTTCTTCTGTGAAATAGCAAAGGCAATTTGGATGCTGCAATGGAACCTCATTAGATCTAAATATTCTTCCATCATAATCATCACAAATATCTGTTTTACCATGCATCCTAAAACTATGACTAGCGCTCAAATTCCACTTTATACCTAAATTAAATGGATTGTTTTTAGCATTTTCTATAGTTGTTTCTGAAAATGAATGAGTTATTGACGTTCTGGCCAATCTTTGAGCTTGATAAGATATACTTTTATTCATTCCAATCTCTAAAGATTTAGCTTCTATCCTTTTAGTTGGATTTATATATCTTTCTAATTGTTCAGCTAATTTTCTAGCATTAGCACCTTTAGCTACATTAACTTTTATAAGAGTATCTATATCCTTAGCATTACTTTTAGTTACATTCCAAATTCTTTTATCTAATATCTTACCATCTTCATAATAATTGCCTTGTATAAGTTTTTTAACTGTATTAGATGATGTTCTTATAACTGATTTATTAAACATGGACCTTAATTTTATATCATCAGTTATACTCTCATAATAAGCTAAGCTTGTTGAACTAGCTATTTGTGAACTAGCTTGAACATTGCCTTTTATAGTTTGCCTTAGGTTAATATTTAATTCATTCATGTAAGCCTGGACTATTTCTTCCATTCCATTTAAATGTTGTTTACTTGAACTAGTTTTACATGAAGCTATTTCACCTGATAGTTGCTTGGCTAATTCCTGATATATTCTTAATAATTCTCTTTCCTGCTTCTTATTAAGCTTTAAAAATTCTTTTCTGGCATCTAATACCTTCTGTTGGTATAAATTCATTATTCATCACCAACAATTCCTTTATTATTAGACTTATCATCTAAATTATCTAATTCATTATCTAAAGCTTTATTGTATTGATCTGATTCTGCATTAACTATCATTGCTTTTTCATCTAATATTTCTTCAAAAGCTTTTTCAACATCTTCTTCATCACTGTATTCTTTAATATAAGATTTCCTACTTCTAACATCTGCTTCTACTTCTTTCATAGCTAAAGTTTTCTTTTCATCAATGTCATTAGGAATAGGATAGTTTTGTTTTATAAGTTTAGTACATTTCATATTTATCCAGGCTTTATTAAATATGCCTGGATAGCACACTGGACCTACTTCAATAATAAAATTCATTAAAGATAATAAAGGCTTTTCCCAATCATTAAATTTCTCCTCACATCTAGCAATTAAATCATTATATAGATATATCATAGCTTTTGCACTTGGTATATTATTTAAGTCGCTTATCTTAGGAATATCTAGTGTTTCTTTCATATCGCTGTCTGCTCTATCAAGATAAGCATTCATTGCTTCACTATTACCTATATTGTATTCTTGTCTCTGGATAGTAGCTTGCTTCCCTTCTACTAACGCTTCATCTCTAGTTCTTATTGCATGAACTGCATTAGGAGCTATAGTTAATCTATTTACATCATCCTCATTACCATCAACTATACTTTCAGAGCCAAACATTTGAAACCTTAAAGCATCTGCAAAATCTGATATTCTTTTATTATATTGATTTTGTGCATCTCTTAAATCTGTAATATCACTTTCACCAAAAGTATTATTAAGTTCTCCACCATTTCTTATAAGCCAACATGGTATAGTAGAAAATCCTGTGTCATGTTCAATTTTTTCTATTAAATCTGTATTCTTGTAAGTTTCTTTTCTATACCAAGCTTGAGGTGTACCAATTGTTTTATCCATTTTGTAATAATAAGTATGTAAGTAATAAATTTTGTCCTTATCTTCTTCTTTGTATGCATTCATTTCATCTTCTTCAAAGAATACTGCTTTTAATAACTTTCCATTCTTCTCTTTATAATAAAAATTTTCTATACTCTCATACTTAATTACAATTGTTTCTCCCGGATTGGCTTCAACTCTAAGCAATACTCTCTTTTTAATAGTAGCTTCTAAGAATGCTTTTCTAGTATTATTCCAAAAATTATTATATTCTAAAACATCTTCTATAAATTTTCTTAGTTCTTCACATTGTTCCTTATCTTTTAAATCATCAGCCTTAAATATTAATGTTGGCTTCTTTCCGAACATCCATCTAGCCTGTTTCTTAAGAAGTGGCTTGACTTTATTTCTTATATCCTGTGTGGGTTTATAATCAACATTATCATCTACTGGCCAATTCTGACCATATAAAGCTGGATTTTGTTTTGCTTTCTCTAAGTCTATAGATTTTCCTTTGTAATAATAGTAATCAGCAAATACACGTTTCCTTTCAGCTATTTCATTATCTGGCAACTTTAATAATGTATCTCTTATTGTTCTTGCTTGTTTTTCCATCAGAACACTGTACCTCCTTTCCTTCCATATGGATCAGTAGTTGTCTTCTTAACAACACCTTTTCCTTTTTTATAAACTTTATCATTATATTTCTTTTCTTCATTAAATCTTAAAATATCTCTTTCAAGTGCATATCTAGTAGCATCAATAGTATGGTTATTCTTATCCGGATATTCTCCTTTAAAGTTTCCATCTTTATCTTTTTCAAGCTCATACCCTAAGAATTCTCTTTTAGCATTTGGACAACGAATTGGGTCAATAATTATTTCTTCTATTTCTTCACTTAAGAACTTTATTCCATGTTCAACACTATCAGGACCTTTTATTGCTCCTATAATGTTTAATCCTAATTTTCTAAACTCACTTATTGTTCTAGGTTCTGCACTATCTGCTGTTACTCTCATATTTAATTTATTTTTCTCTTTAATAAGTTTAACTGCTTTACTATTTCCTAATTGAACTTTTACTATTTCATCAAATATATAAAGCCTCTTTCTTGTTTTATCATAATGACATTTTATATAAGCTAATGGATCTGCAGCATATCCAAAATCTAATCCATTTTTAACATGGTCAAATACTTTTATCTCATCATCAGTTATATTTCTAACAGTTACATTTCTAAATACTTCCCCACCAGTTCCAGTTACTGCACCTAGATAATCATGGTCATACTTAGTTTTATTAACCTTTTTAAGATGTTCAGCTTCAATTACAAACTGTTCTCCTAGCCATTCTTTAGGTACTGTTAGATATGTTGAATGATGTACAAACTTATCTTTTCTTTCCTCTAATACCTCCATATTAGTCCAATTCCTTTGACTTTCTGGTGGATTAAAAGAATAAAACACCTCAAACTCTGGTCCACCCCTCATAAGAGATTGATTAACATTACGTATCTTATCATAATTTTCAAATTCATCTGCTTCTTCATACCATATATATTTAATCCAACCTTTTGATACCTTTGTAGACTTTAATTTTTTGACTTTATCTGCACCTCTAAATAATATTGCCTGACCAGTTGGTTTATAAGTTATTCTTAATTTACTTTCTGGCATATCCCATTCATCTTCTACACCTAACATATAAATGGCCCATTTAATTTGATCATAAACTGATTCTCTTAATGTTTCTTTAACTCGTCTTATTACCAGTCCATTAGAATAAATTTCTTCTTGAGCATCTCTCATTATTCCTAGTACAATTTCTATAGAAATAAAAGAAGACTTCGTACTTCCTCTTCCACCTTTGAACCAATAATGCGTATGAAGTTTCTTTTTTATATCTCTATGAGCGTCATAAAAGCTTTCTGCTATAATTGATTTTAATTTAACTTTAATCATCTATATCATCTACTATCTGAACTGCTTTTGAATTAATGTTTTTATTACCATTAACTTTTTCTATATCTACTTTAAGTTTCTCATTTTGAAGTTTCTTGTTTTCAATATCAAGCTTGTGTTTAGTATCTTCATCAAGAAATTCAATGTGTTTTCTTAGAAAATCAATAGCTTTTATTTTATCCTGCAATTTAATTGATACTCCATCTTTGCCCTGTTTGACCTCACTTATAAGTGTTCCATCAACTTCATTGCTATTCTTAAAGTCTACATAGTTAACTTTAACCATTACCGGATTATTCTCTTCATCCTTATCAATTTCTATTTCTTTCCTACCAAAAGTTACATAGTCCTTCATATCAGCAAAAGCTATATCTATATTAAGTTGTATTAAATCTTGAATATCTATTTTTATGTTATCTCTAATTTCTTTTAATTGCTTATCTATTTCATTTCTTACTCCCACGTTTTCCCACAGTTCATATGCATGGGCATTCGCGTTTTCCCAACTACATTGATAAGCTTTCATGTAGGCCTTAGTTTTATTTCTATATTTAATATAATAACTACAAAAGAGCCTTTGCTTATCAGTAAGTTCAGAGTTATTTAAAACTTCCTTTTCTTCCTGTTGCATTGGCTCCTGTACACTTTTTTCTTTATTCTGTTTTTGTGTGCATACTTTTTTCTTTGTGTGCATACTTTTTCTATTCCATTTATACCTTTGTTTCCAACTCTTAACGGTATTAATAGATACATTATACTTAGATGCTATGTCTTTATACTTCATCCCAGATATATAATATTTTTCTGCTTGTTTTTTTATATCTGGTCCTCTTATACTTTCCATACCACCACCTCGTTGCTTTGTTTGTTTTGTATATAAAAAAGAGCCCTTATGAGCTCTTTATTTTAGTACTATTATCATCATAAACTAATTCTATTCTTTTTACATCTTTGATATTTAGCAGAACAGTTCTACAATTATCATCTACATAATTGCATATTTCTTCTCCATCATAAGAATAACACGAATAATTTGATAGCTGAATATATCTATGATTATCTTCTGTTGTATTTTCATAATAAATTAATTTTCCTGAATATATTATATTCTCATCATTTAAATAAATATACATCCATATTCCTAATTCTAAATCAACAACATCATCAAATGCATCTTTTCTAAATGTTTTATATAGCTTAAATTTATGTGTAGTCTTCTCCATATGACTAGAATATATGAATTTCACATATAATACTGAAACTACAATTGCCAGTATAATTGAAATTATATTGGAAAGATAATTGTTTTCTGATATAAAAATATTTGTAATGCTATTAATTACAAAACTTATAATTAAACTTTTCAATATTATATTATCATCTTTTTCTCTCTTACTTTTAGTATAAAAATTTTTAATTTCCAAAAAAATATATCCAGGTACCATAAATCCAATAATAAGAGGAATAGACTTAATCAATTCATTTAAATTGTATATTTTATCCATTACTATTTACTTTTTGTTGGTTGTTTAGGTGGTGGTCCTGGATTTCCTTTACTAGTAGGAGTAACAGACACACCATCCCTTATTTCTCTTTTTCCACTTCCTATATGTTTATTCAAAATATCGCCTCCCAGAATATAAATTCTACATTTTAGGATATTTTCCTTCTTTATTTTTACATTTTATGAAGGATTTTTATATTTAACGTTGAATTTCAACAATATGGGGAGAGAATCAATTTCAAGAGGTGTTGTCAATGGGTAATAAGAAACAAACAAGTAAATCAGTAGCTTCTAAAGCAAGTAAAATTTTAAAAGATGGACGTTATAGTAAGACTTCTAAATCTGTGGCAGGTAGTGCTCTAGCTCAGACTAAAAAATCTAAATAGTTTTTAATTTACTCTCCCCAATTTCATATGAAATAATAAATTCACTATTTATAACTATCTTCTTATTGCTTTGTTTTATTTCTACCCATTCACCTTTATCTATCTTATTCTTAAATTCTATCTCTTCCAAATCTGTTGTTACATTTTTATAACAATCTCCATTTGCTAAGCACAGTATTTTTATAAACAATTTTATTTCACCTATCTTATAAAGTTATTTATTTAGTTTACTTTTAATTTTACTTTACATAATTATATTTAAGTAACTTACTCTATTTACTCCATGTTCTTTGCTTTATCCTCCCACCTCTACCCCTACAATAACTATCATGACTCATAAGCTCCATAATATCAGAAAAGGAGAGGCCCTCTTTCTTACCTCTCCCACGCTTTTTCTTATTCTGTTTTCTATTTTTATTTAATTGCTTATGTGTGTTCGGCTGCTGTGTTTTTAATATCTTTTCTATCCTCACCTGGACCACCCGCCTCACATTCATTTATACAACTAACTATATCTACTTTACATCCCATGTAATGCTTACAAAATCCATTAATACCTTTTATAAAGTTCTTACAGTATTCTTTTTTATTTAGTTTCATAATCTACTCTCCTATGTATATGAATATAGTCTCCTAATCAATTTTAGGTATGTAAAAAGCACCTAACCTCTAGTGGGAAGCGAATCACCCACCTTATAGTTAAGTGCTTTTAGTACTTATACACAATATGTTATATATTTTTTTATTTTAGCAGTTACCTTATTTTGTACGATAAAATCTCTGCTTTTTTTTCTATAATACTATACTAACACATATTCTAGGCATCTGTTATTCAAGTTTAATTCATTTTTAATTCACTCTTTTGCCACGTTTCCCATCTTGCTACATTTTCAACTAATCTTTGTCTTGTCCTTGTAGATGTAGGTTGCGACATTCCTAATTCATTTCCTACTTGCCAATCCTTCATTTCTTCCCCATACTTTAATCTTAAAAATTCTCTTTCTTCTCCCCTGATATCTTTTATATTATCCTCAATTATTACGTTATCAGCTACTATTTGCCTTATTTGCTCTTCTAAATTTGCTATTTCTTCAGTCTTTCTACTTTTCTCTATTAATAATCTATCGGTTATTCTCATAAGAGTCCTTTCTGCATAACTAGATCCATCACTTGATGTTTGTACTCTTTCTTCATATCCTATAGATTTACTTTCCTCTGGAATATCAATGTCTATATTTCTTAATCTTTGATCTATATCATTAATTTGCTCCCATAGTAAATTAATCTTTTTATTTAGACTACTTATTTTTTTGTCTTTTCTAAAATAGTTGTATAACTTTTTCTCTGTCTTCCTAAATGAATCCTTGTCCATTTAACCCCTCCTGTAATAGTTTTGGATCTTCATATACATTCCCTATAACTTGAAAAGCCGTATTATAAAATCCATCTAACCCTATAAAATCTCTATGCCATCCCCACACAACACCAAACTTACAATCTTTATATTTTACAACTTCATTACTACTTGCTATGATTTTATCTTTTATTGATTTATCTTTTATTTCTATGTGTAATATATTTCCCTCATAAATTTCTTTTCCATTCTTATCTTTTAAACCTGTATATTCTAATAAAATAACTTCTTCAAAATCACGTAAATAACTTTCTCCAGTATAATCATTTAATAATTTTACTTTTTTATATTCAAAATCAATTAGTGTAATCTCTCTTATTTTTTCATCTATTTTATCCCATGCTCTAAATTTAATCTCTCTCATATCGCCTTCACCTTCCTAATTTCCTTCCCCTTTAAGTTGTAGACTATACCATGTTCCATATCAATTTTTGCCTTTATCCTTTTTTTATTTCTTTTAAGTACGCATGGATAAGTAATCTTGTAGTCTTCCTCAAATAGCTTATACTCACCATTTAGAAACTTGTCCAACTTCTTTCTCCATGCTTCCATAGTTAATCCCTCCTTTGTATTATTGATTTATTACACTAGTACAGTTAAGGTGTAGAAATACATAGTTTAATCCCTACACCTATTTAGTTTAAACTTTTTATAAATCATATCTAATTTTAAGCAATTTCAATGCTTTTGTTATGGTCCTAAAATTATCTTCTTGCCATGTATCTTGATTCATAAATTCTTCTAAAATTTTTGTAATCTCTTTTTCTTTTCTTCTATAATTTTCTCTATGCTTTTTAACATCTTCATTAAGCTGCTCTGGATTAAATTTGTATTTGGATGATCCCATCATTGAAAGTTTACGCATTTACTTCACCTTCTTATTAAGATATTTTCTTATATTCATGTTTTATGTTTTCTTCTGATAATTCTGCATATATCTGTGTAGTTGCTGGACTCTCGTGACCCATTAAGTGCTGTATAACTGGCATTGGCATACCAGCATTTAGTTTATTAGTAGCAAAAGAATGTCTAAATAAATGAGGATAAATAGATTTGTTTATACCTGCTCTACTCGCAATTTTTTTAATCTCTCTTTGAACACTTCTGCCACCCAATCTGCCATAAGGCTTTTTACTAGTTACAAATAAAGCTATATTTTCATCACTTCTAGCTAGCAAATATTTTTTTAATAAAATTTTAGCTTTTGTACTAAAATATACCTTGCGTTCTTTATCACCCTTACCTATTACATTTAAAGACATTTCATACCAGTTTATATCATCTTTATTTACGCCAACCGCTTCTGATAATCTGCACCCAGTAGATATTAAAAATTCTACTAGTGCCTTTTCTCTATCTGTTTTACAAGCTTGTCTTAAAAGTTCTATTTCTTCTTCTGTCATAGCATGTCTTAATCTCTTTGGCTCTTTTGTTTGCTTTAACTTCTTCGCTGGATTTTTAGGTATATACTCTTCATCTGCAAGCCAGCCAAAGAAACTTTTTAATATAGAGATTTGTCCATTAACACTGCTTTGTTTCATGCTCTTGCATCTAACTGCTAAAAACATTCTAAGATCCATTGTATTTATAGCTACCAATGGCTTTCTTAAGTGGTTTGCAAATATTGCTAAATTATATTGATAGTTTCTTAATGTTTTTATACTTAAGCCATCCAGTTTCTTAGATGCTAAGTATATTTGTAATTTTTCTTCTATATCACTCGCCATTAGCCCTGTCTCTTCTGGCAATATACTGTATTTATATAACACTTCCTCCACTATGCTTCTAACCTTTAACTGGTCTATTCCCTCAAATTCCATAGACAGCTTACCTACTAATTTAATTACAACTTCATTCTTTGCACTTGTACTATACAT
Protein sequences of DBSCAN-SWA_4 >NC_009495|2474630:2506923|2482265_2483396_-|WP_012047786.1|plate|DBSCAN-SWA MKRELLIPDFLKEDADTVHERMLEKAPPNVSIIEGDFYWDNTRPAAEEKASLMQVQLQNMLRLAFPQTSYGVWLEYLGECKGVFKNLPTKAIGVIKIIGRKNTNIYKDQLIGTVATDDSESIVFKFIENKAIDETGVAYVKAECVKSGTIGNVLRNTITVLMDRINDIESITNEEEFTGGTDLEDEEHYRERVLEEYKNEATSGNNEHYKKWAKEVDGVGYAYVIEEWNGPGTVKVLILDKNNKPATKELIDKVQNYIYEIVPKEENRGGKAPIGAIATIDTPITLVIDIKANFKFKEDFNSEIVLNSLKESLSKYLSGIPIGGTILYNAIHTIVGSMILTGEGIEDFENLTVNDATENIKLIDQVAVIGEVTNIQ >NC_009495|2474630:2506923|2478054_2478309_-|WP_012047781.1|DBSCAN-SWA MELKVCEEKHKRIEEKINVHDIRLNDHSKRIDKIEQNQSRTDAKIENLCDQLKQLVSVLKWYIGLTVGALVSFFFYAIQHNIFK >NC_009495|2474630:2506923|2494263_2494494_-|WP_012047803.1|DBSCAN-SWA MAKSKEEPKKETTEITDLEATENGQDENVEEKKVFKAKAKQYIKYGGKHIKVDEDFEVKECDLEELRKYAEIEEDE >NC_009495|2474630:2506923|2503624_2503822_-|WP_012047813.1|DBSCAN-SWA MFIKILCLANGDCYKNVTTDLEEIEFKNKIDKGEWVEIKQSNKKIVINSEFIISYEIGESKLKTI >NC_009495|2474630:2506923|2476130_2476937_-|WP_012047779.1|DBSCAN-SWA MVNIVNEKIRRDSLCEIIDEVAYSYYDKNKKCANIIDDDKKLKLITGYSIVLFNYASEISYLIKGDKFTTIHSLTRDFLECYAIIIESIKLYDKENENIRFQKELIINGLNQEIKTIKELKINGYNAYSNNIKYVKSRLNNYFLEERVKNKILTKDVIEKMEFKELGRVVYELYNRYAAKKSANNFIARQLKQNSFLEEFKTNNAIYRELCNYTHMNRAAIENMILLEDENVSVITNFKPSDNIPFLLTLIYSCLKDVFQKINKIINE >NC_009495|2474630:2506923|2493147_2493552_-|WP_012047800.1|DBSCAN-SWA MSFEAIAYIAKKKAGMNILCNTMAKKLESQAKNNAKWTDRTSHARQGLKSGCEGGGNNYSIYLAHGVEYGEILEEGSKPHVITPKNGKALYWKGAAHPVKKVNHPGTKGFKTIENTLEGNREMVKSAVINYWSD >NC_009495|2474630:2506923|2485856_2486375_-|WP_012047791.1|DBSCAN-SWA MNRRLSKISILLIFIFILSLNLMGCGNETAKDSKETTKEIKVENKKEENNKKTAEITKGELYDKINSIEKVKGISTIEDTEVGFINLNIGINVTKGTAMEELDSYTKKAANIQTNLENYFIEKKFVRIAYVMYVDNEMKSVVVTYKKEDGKYILENTSIVDEKYKKAADALK >NC_009495|2474630:2506923|2486427_2489409_-|WP_012047792.1|tail|DBSCAN-SWA MAKKEIYRLDIKIGVEGDSEAKKKLAATERFAKQTEKRTKALDKIKASPSVKLKDKLSKPLEKIEGKLSNFSKKACSKLAAITAAGALMVGGLGITAAVRDFSNFEQGLANVKAISGATAQEMQVLGKEARRLGAETAWSAKDVTDAEMLLSQAGFKIQETIAALPGLLDMASAGDIQLAEATDIAAGTIRAFGMEAKQSAHVADVLALTASRTNSDISGIGESMKYVAPVSKALGISFEETSAAIGMLADANIKGSQAGTVLRASFARLSNPSEKAAEAIEKLGFKAFDSNGKMLPLSQVIGNLKTSMSGLTKQQKAQAISTIFGTEAMSGMMALVEQGPEKLQSLTKELEGSDGAARKMAETRLDSLQGQFTILKSAVEGMNIELGEKLAPYAKEFVSWFTAKIPDITQGIVKVVDTISNLAKKFNSLGTGTKKMFAAVAIGAVAFNPLTKYIKGTTKALTFLIGLSPKLSTFFGITKKATATAEATKTLATGAGLASKGVGALGLAAKGGALLLNPWTWAIGGATYAGIKLYRHFKKDSIPAVKEFGEEVSKSTAEAMNSYMKLDKHVGQSLMDIKINNKKITKEISQSVISDFNQMSDQLKGAIDKRYNESYQTMQTFMSKKSGLKAEENQQILQKIREKQEAEKNIVQQGQQRIDEIVNQAFQNHKKLTTQDLNEINTIRNNMTQTAVQNISKSAQEQRVILEKLNFDSGNLTAQQAAKVVENSAKARDGSIQAAEEQYNRIVAEIIHQRDDLGIITSDQANQMLDAASRQKEDAVTKAQEMHTEVVSHAQQQAGEHVTEVDWETGRVRDNFDAMIAKIHEFNALTIKEKVIKITTWINDFFKGDDKNGMDTYNGPGSIAGAGKALATGTNNATSGVHEVAERGFEILVGRQTRLFKGGERVLNNRESKKFLQSGLNKENNQIAEEKPKPQFTIAQPQFAGAGGINVYVGDVGVENNFDSDANVDEIIEETTKEVGRKIKEAFKNIKK >NC_009495|2474630:2506923|2505927_2506923_-|WP_012047820.1|integrase|DBSCAN-SWA MYSTSAKNEVVIKLVGKLSMEFEGIDQLKVRSIVEEVLYKYSILPEETGLMASDIEEKLQIYLASKKLDGLSIKTLRNYQYNLAIFANHLRKPLVAINTMDLRMFLAVRCKSMKQSSVNGQISILKSFFGWLADEEYIPKNPAKKLKQTKEPKRLRHAMTEEEIELLRQACKTDREKALVEFLISTGCRLSEAVGVNKDDINWYEMSLNVIGKGDKERKVYFSTKAKILLKKYLLARSDENIALFVTSKKPYGRLGGRSVQREIKKIASRAGINKSIYPHLFRHSFATNKLNAGMPMPVIQHLMGHESPATTQIYAELSEENIKHEYKKIS >NC_009495|2474630:2506923|2478333_2479347_-|WP_164928187.1|DBSCAN-SWA MKLLSLFSGIGAFEKALSNINQDHEIINYCEIDKYASYAYSVLHNANESLNLGDVSKINPDTLKDFDLLTHGSPCQSFSLAGKGEGGDEGSGTKSSLMWYTVDIIKKKLPKYIIWENVKAVTCKRHKHNFSKYIDTLNKLGYNSYWNILNSKDYGSPQSRERMFCISIRKDIDACLFKFPKPMDSIVPINTILDEYVDKKYYCINKYTREFINKVDRKVVDNKEPNKYGLLRIGKIENPTALNMNKRVFSSQGACPTILTGSHSVPKIMEYKLRRLTPCESWKATGFTEEDYNLVKTKLTNKFYKGVDRTDTQMYKMAGNSIVVPVLETILKELFKA >NC_009495|2474630:2506923|2474630_2475722_-|WP_012047778.1|DBSCAN-SWA MYTELIKIIEGGIKGDKEKVLNYSKVLVDNLKKEGQENLSRKILNILESNNTRMVSLDSFASKPVDQESRMDIVDIKMPTSMEEKLIFDKFIEEEINDFIKTFEYRDMLKSKGIDVSNTLLLYGPPGCGKTSLAKYISYKTQLPLVTARFDSLLSSLLGNTAKNIRKIFDYASKRPCILFLDEFDVIAKVRDDKNELGELKRVVNSLLQNIDEFSEESILIAATNHHELLDLAIWRRFYKIIELDKPSKEQIKRLIVEYSQSFQVYFIENEKKMDYVIEAIRELSPADIKNIIYTSIKKSIMKEKNSLEFIQVIYEIYLFKKHNVSDEEELIKYLNSYGVTQKEIVEFFNLPIRRVREILSNK >NC_009495|2474630:2506923|2485135_2485789_-|WP_012047790.1|DBSCAN-SWA MDVYLRNEKEKTTFQFPVNPIDNVMVNRTKKYDTADIVDYGEVDLSDKGKKIKEISFNTLLPAEYDTYCRYRNIPIPLEVIAKLEKWMEQQEPLRLIITDFGFNDLVNISSVSEEERGGETGDKYINISFRTHRDLKIQTLASPKTISTVKKVALKDNRPTTKSNSRIYVVKQGDSLWKIAKWWYGNSSKWQEIYNKNRATIGPNPNVIRPGQKLVM >NC_009495|2474630:2506923|2496024_2496639_-|WP_012047806.1|DBSCAN-SWA MAHIKDIIGEELFKQLSEDKQKEYKDKDFEDVSGGAFIPKSRFDQVNEQSKEYKKQVGERDTQLKDLKEQYKDVDGLKEKVEKLELDNKTQKESYEKQLNDISFSNALEKSLGAFNVKDKKLIMALIDKDKLKVDGDNVIGLKEQIEPLQKSHDFLFEKEVKGTGSFGTGGEGGQEPTKPNFATKLGKQRAENMKIKGLADFAK >NC_009495|2474630:2506923|2490052_2490463_-|WP_012047795.1|tail|DBSCAN-SWA MALDASRTIHGSKGKILVDGEWQTNLTECTAEVELDKKELNLLGDDWTRYKQGSKKGTGSISGYKVSSKMIQQGFKRFETISSLEDPEAYGFERIRLMNCMADKLNLINLKANELVEEETPFTYEGYELLDPIVIE >NC_009495|2474630:2506923|2493553_2493940_-|WP_012047801.1|DBSCAN-SWA MSTLKAKKIINTINKGIELNPSTITIKQVKKVVVGGAIEEAESEKNLKVLIYLEDNSNKVIVDSKTIGTSYSSNKYKMIADKDANIEINPKEAIEFECIEGHMKVTATYPIQIENTICGYICDLERID >NC_009495|2474630:2506923|2483401_2483857_-|WP_012047787.1|DBSCAN-SWA MPNLFPEDTNLEENNIEELEEPLEFKGSYLFDFKTGEFVTNPDGSIARANDLESYVQWCYKAMATPRYKLAYSDLYGQEFKNIIGQDISKDAIELEVKRMTEETLMVHPRTKDVYNFIFEWSDNKEKVLYTYEILTIDEEKFMLHNELKVW >NC_009495|2474630:2506923|2504058_2504232_-|WP_012047815.1|DBSCAN-SWA MKLNKKEYCKNFIKGINGFCKHYMGCKVDIVSCINECEAGGPGEDRKDIKNTAAEHT >NC_009495|2474630:2506923|2494551_2495604_-|WP_012047804.1|capsid|DBSCAN-SWA MPNLRDYINSKNIALYIKELPAEQTIDKALFPDKKVSGTKLEMAKGAKKKPIALRMSTFDAATKMRALSADLTVKSTEIPFFKEGMGIDETTRRDLQNAIGANNENFVSALLGQVFENYSNLIDGANIISKKMRSSVIQNGLLNFTSKDGDIVVDYGVPSNHREILTGTDKWTNPDADIIGDTKAWQKSITNDQYAKPKTLLLTENTFDSTFLVNKAITNHIKNSNLNTSLILSQANYIQFVKEVLQLTVVFLEDVTYIPYEGADPVPYYADGKVTLMSGNILGNTVYGTTPEEFDKQSGSSKLDTYMVDKGIAVTTMVKEDPVTVDTKVSVMPIVSFDRADEVFFATVY >NC_009495|2474630:2506923|2481633_2482269_-|WP_012047785.1|DBSCAN-SWA MIKSKKGKEMITYVSPIYEQSKVIQAIFESIGYEWDVAESLADDILKQFFPQSATWGLIYWEEAVSIVTNLTDEIERRRRKVIAKLQSRYAINPKRMALILKNYTGADILITENIAPYTFEVKLTGREGFPKSLEDLYKEVKRIKPSHLSVRYKLIALTESNLYVGATSFSGETITVYPWTPNNIETTGNIEIALAQNAGLETITTYPKEG >NC_009495|2474630:2506923|2505406_2505598_-|WP_012047818.1|DBSCAN-SWA MEAWRKKLDKFLNGEYKLFEEDYKITYPCVLKRNKKRIKAKIDMEHGIVYNLKGKEIRKVKAI >NC_009495|2474630:2506923|2477045_2477807_-|WP_012047780.1|DBSCAN-SWA MKIGIDCGHTLSGADYGAVGIKAESNLTREVGIRVISKLQALGHKVIKCYKDTCNSLNDSLSYRTNTANNNNVDLYVSIHFNCYNGSAYGTEVFTYGGKELQQARAVLNNICALGYTNRGLKDGSSLYVLKHTKSKAMLIECCFCDNAGDMNRYNAENMANAIVKGLVGQTTSSTSNKPTGNSDNGWINLDGKTGAINTPSGINVRAGKSTSSKILGTLANGAKVNLYRKEGDWMHIYYPPCGGYVYAKYIRY >NC_009495|2474630:2506923|2493940_2494261_-|WP_012047802.1|DBSCAN-SWA MTLTSLEILKINLNENRYPVFSDEELNNLLAVNDNDVLKASWRGCLMKANTDKKIKVGPIEVENADPDYWNNLAAMYQADYLQEQANVNPSKATGYKTSMRRADGC >NC_009495|2474630:2506923|2501734_2502586_-|WP_012047810.1|terminase|DBSCAN-SWA MESIRGPDIKKQAEKYYISGMKYKDIASKYNVSINTVKSWKQRYKWNRKSMHTKKKVCTQKQNKEKSVQEPMQQEEKEVLNNSELTDKQRLFCSYYIKYRNKTKAYMKAYQCSWENANAHAYELWENVGVRNEIDKQLKEIRDNIKIDIQDLIQLNIDIAFADMKDYVTFGRKEIEIDKDEENNPVMVKVNYVDFKNSNEVDGTLISEVKQGKDGVSIKLQDKIKAIDFLRKHIEFLDEDTKHKLDIENKKLQNEKLKVDIEKVNGNKNINSKAVQIVDDIDD >NC_009495|2474630:2506923|2489591_2490029_-|WP_012047794.1|DBSCAN-SWA MSNEKIKDEEILNMTEEDIINRLMEPDEVPEATYFIERLRIPVTLKGLSEKEINKIKRQCTYTRKERGKRIKELDDEEFNAALIEAATVTPNWNDERLLDALKASDGKQVIRKKFLAGETSAMGDKVLELSGFDNELEEIEDIKN >NC_009495|2474630:2506923|2484165_2485134_-|WP_012047789.1|DBSCAN-SWA MATIILRNKYKIDSLSEGIQLSEAIDGIAYTANINLVETEELKKLGIEKGHSIEIYDIDFETKKNKQVFKGVIWDMDKSRKSKKITLTCKERTIYIEESEDEYLFGESTATQRIIKYCRDWGIPTASLVNTRTKLAKAVYRSESILGMMLKDLKETAQKGGNLYKLRMLDKLNIVQLGSNKTVWKLESIAEDINEKSSLDGMITQVKILGKQEENKKTPVTGVYKKDTSKYGTIQKLVQDEKIKSGAEAKKRANTLFNTGEETTHVYGIDINSIRAGDRVSLNGNILYAIDVTHNLGSTGRMDLNLSNLDYIRRKFYSGDNI >NC_009495|2474630:2506923|2491882_2492083_-|WP_012047797.1|DBSCAN-SWA MDEETNVIQNEIEETYPIKDLIENCEALTGYRKEVAVGATFNCGKEEMTKKEFEGRIKNFLERKVN >NC_009495|2474630:2506923|2498875_2500396_-|WP_012047808.1|portal|DBSCAN-SWA MEKQARTIRDTLLKLPDNEIAERKRVFADYYYYKGKSIDLEKAKQNPALYGQNWPVDDNVDYKPTQDIRNKVKPLLKKQARWMFGKKPTLIFKADDLKDKEQCEELRKFIEDVLEYNNFWNNTRKAFLEATIKKRVLLRVEANPGETIVIKYESIENFYYKEKNGKLLKAVFFEEDEMNAYKEEDKDKIYYLHTYYYKMDKTIGTPQAWYRKETYKNTDLIEKIEHDTGFSTIPCWLIRNGGELNNTFGESDITDLRDAQNQYNKRISDFADALRFQMFGSESIVDGNEDDVNRLTIAPNAVHAIRTRDEALVEGKQATIQRQEYNIGNSEAMNAYLDRADSDMKETLDIPKISDLNNIPSAKAMIYLYNDLIARCEEKFNDWEKPLLSLMNFIIEVGPVCYPGIFNKAWINMKCTKLIKQNYPIPNDIDEKKTLAMKEVEADVRSRKSYIKEYSDEEDVEKAFEEILDEKAMIVNAESDQYNKALDNELDNLDDKSNNKGIVGDE >NC_009495|2474630:2506923|2505695_2505911_-|WP_012047819.1|DBSCAN-SWA MRKLSMMGSSKYKFNPEQLNEDVKKHRENYRRKEKEITKILEEFMNQDTWQEDNFRTITKALKLLKIRYDL >NC_009495|2474630:2506923|2500395_2501742_-|WP_012047809.1|terminase|DBSCAN-SWA MIKVKLKSIIAESFYDAHRDIKKKLHTHYWFKGGRGSTKSSFISIEIVLGIMRDAQEEIYSNGLVIRRVKETLRESVYDQIKWAIYMLGVEDEWDMPESKLRITYKPTGQAILFRGADKVKKLKSTKVSKGWIKYIWYEEADEFENYDKIRNVNQSLMRGGPEFEVFYSFNPPESQRNWTNMEVLEERKDKFVHHSTYLTVPKEWLGEQFVIEAEHLKKVNKTKYDHDYLGAVTGTGGEVFRNVTVRNITDDEIKVFDHVKNGLDFGYAADPLAYIKCHYDKTRKRLYIFDEIVKVQLGNSKAVKLIKEKNKLNMRVTADSAEPRTISEFRKLGLNIIGAIKGPDSVEHGIKFLSEEIEEIIIDPIRCPNAKREFLGYELEKDKDGNFKGEYPDKNNHTIDATRYALERDILRFNEEKKYNDKVYKKGKGVVKKTTTDPYGRKGGTVF >NC_009495|2474630:2506923|2483849_2484182_-|WP_012047788.1|DBSCAN-SWA METIFNEIAREIKSSTNKAVYNAISYIGLDLGTVTSTGLKLDNFKYEIQDYMMLDYLKMKNGYNTETAGEHSHSHNFKTPKELKPLGPGDRVLVTLLKNEFVVVGRVVNA >NC_009495|2474630:2506923|2492919_2493144_-|WP_012047799.1|DBSCAN-SWA MDNLKLADVEIHYDIDKSISKVVIDGKDFSMVTKSAKVKIDARNIPILQLDIYTDNVKFKGKANTNTDINKIED >NC_009495|2474630:2506923|2492095_2492917_-|WP_012047798.1|DBSCAN-SWA MRAGIRQKLIDSIPELKNCYEPTVPSKDTPKPYAVIVQGSDDEQNNPTSFKRTIEIWFYEKRTTFQKLDSLSEKVIKALDLQTIEDANANETFTCIFNGAIGQDIIDEEWNAIARGLRFEVISLHEEDEVNKDEWLDALEEYTKQIINYPIYLNNWKKDFEVPSILWRTTNSARERINTALIKINKTLVCHIVSNNKNEINELLDKIEDKLIKDLKIPLDLEDRRYLTIESIQEDRAADMLGVGQLTIELTRRKMIEDNIPTIDKIYGRGNLE >NC_009495|2474630:2506923|2477846_2478041_-|WP_003494435.1|DBSCAN-SWA MEFLKQFLQIKKIIALLTTIVFCILSTKGNLSSTEFLSVFTLIIGFYFGQSSARQAVKESKEQE >NC_009495|2474630:2506923|2490475_2491882_-|WP_012047796.1|tail|DBSCAN-SWA MATGVWNENNRPTIPGFYNRFKSLAEKRIGTGIHGILAMPVKANWGPVNKVISVKDEKDLINKFGKDNTAYRLGRLALLGQPKELLLYRLTDGTEKIASVMLKDTEDTDLLKIETQYPTTRDFNVTVRTNIVESDKKDLILYEGAKQLYIFSELGGTVEEIAKYINENVENIWLKAIKVDEGNGKLASVANQTFTGGNDGTTSITNEHYIKAMEILEGYKADGFCLDGVTDESLQSTVKAWVKRNSSKGNNIIAYLGIKDTDTIQQANTKSKEFNFEGIVNVGISGYYEGVKYTPPETACYIAGLATGKRLKESICNEKTIFEDVEPRLSKEEVENCLEAGTLVMVKEDDEVIVVDDVNTLKKYSEEQNETWGYIRGIKFMNAVDGDTALKRKEFIGKVPNEGTGRLALICALKQYFEVLEKEGVIEDFTVEIDEELQAKAKNDEVFWKWDAKYVNVMKRIYGTGYLR >NC_009495|2474630:2506923|2479464_2479587_-|WP_003400227.1|DBSCAN-SWA MLSYIKEYFLMGLYNEEDLDIFVTAKWMSVEEKEDIIKTQ >NC_009495|2474630:2506923|2479945_2481631_-|WP_012047784.1|tail|DBSCAN-SWA MAEKFYTLLTEIGKAKIANSAGFGSKVNFVKMKVGDGGGSYYNPREDQEDLINTVWEGNITHVAIDEKNPNWINVEMMIPANVGGFMIREYGVFDEDNNMLAIAKCAESYKPLAEDGSTKELIMKMVLTVSNTENITLKIDPTIIFAKKSEIEVLENKIKNIKVPVTKVNEKIGDVVLTASDIKTEDGKTVESQLADITKQIDNIDLSADKVTLNSSNIKSKNVKGALEELFTSASNGKNKIATAITGKGIQSSGNDSFDTLSNKIKQIPAYSPANLLIEVKRSSPITIPDYDTIEKIALDVYGKIYCKSTKILSKIDEDGYIYWQYTHDRIITSVTVKNGYVYIADWEGNRIIKINSSSGEIIWNNRYSSKYGTESIVIDDNNIIYAGTDNGKVIKIDSTGEVIWTYDKHKSRVDAISIDKNGYIYSGGGNRLVKLCSNGGEEWIRDFGRSIASIAIDSNGYIYIGFINYGIVKINPDNGEQIWHVDLGLNISANSIFVDDYVYVASSDKIIRKISLDGLQIWKYYCDYNLRSIIKRYSYIYIGHDKIVRKLTDEIYVKK >NC_009495|2474630:2506923|2504470_2505004_-|WP_012047816.1|DBSCAN-SWA MDKDSFRKTEKKLYNYFRKDKKISSLNKKINLLWEQINDIDQRLRNIDIDIPEESKSIGYEERVQTSSDGSSYAERTLMRITDRLLIEKSRKTEEIANLEEQIRQIVADNVIIEDNIKDIRGEEREFLRLKYGEEMKDWQVGNELGMSQPTSTRTRQRLVENVARWETWQKSELKMN >NC_009495|2474630:2506923|2504984_2505410_-|WP_012047817.1|DBSCAN-SWA MREIKFRAWDKIDEKIREITLIDFEYKKVKLLNDYTGESYLRDFEEVILLEYTGLKDKNGKEIYEGNILHIEIKDKSIKDKIIASSNEVVKYKDCKFGVVWGWHRDFIGLDGFYNTAFQVIGNVYEDPKLLQEGLNGQGFI >NC_009495|2474630:2506923|2502632_2503220_-|WP_164928181.1|DBSCAN-SWA MIKSIPLIIGFMVPGYIFLEIKNFYTKSKREKDDNIILKSLIISFVINSITNIFISENNYLSNIISIILAIVVSVLYVKFIYSSHMEKTTHKFKLYKTFRKDAFDDVVDLELGIWMYIYLNDENIIYSGKLIYYENTTEDNHRYIQLSNYSCYSYDGEEICNYVDDNCRTVLLNIKDVKRIELVYDDNSTKIKSS >NC_009495|2474630:2506923|2479579_2479933_-|WP_012047783.1|DBSCAN-SWA MKLLWIEKITQNKARVYSIHNFPEIVEDKTGGIVVDDILPKPQLKESEYAVHYINPQTKKQSYEICIREKTQEEKQQALNAKLLKDNAEIQIELNKQKELNSSLLLKIAQLGGNANA >NC_009495|2474630:2506923|2495617_2496010_-|WP_012047805.1|DBSCAN-SWA MRQSSYTIGAKQNKLRLIAGDHFITLPIKVRKGDVQLLLDENEVLLAGTLITKEGKAVTSTADKTDVFGVVYQDVSFKDSMSSTNYSGDATEVVPIFVHGALYESAVKFNEDEAIKKAEMAALKQIIFGE |
41 | uncultured_Caudovirales_phage(50.0%) | terminase,plate,capsid,tail,portal,integrase | attL 2478955:2478970|attR 2507941:2507956 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_5 |
2510335 : 2520594
Sequences of DBSCAN-SWA_5
Nucleotide sequences of DBSCAN-SWA_5 >NC_009495|2510335:2520594|DBSCAN-SWA TCTATTTAGCTGCCTTCAGATTAAATTTTAATTGCTTGTCTGCTTTTTTAAGCATTTTAAAATCTTCATCTTCAAATCCTTCTAATAAGTTAGGTATTGGACTTAAAGTAGTTTCCCATCCTAATCCTAAGTTTCCTATTACCTCTTTCCACCCTTTAACGTCTGGTTCTATTAGCTTGTCCCCATCTATCTGTTTTAAGCAGCTATATATGTGTGCTACTACTTGCTCTTTTGATATTCTAGACATCCAAAATTCTCTACTCTCTATAATAAATTTATATCCTGTAAGCTCTGTAACTTGTTTTGGCGCTTTCTTAATCCACATAACATCATCAGATTTACTCATTTCATCTCCTACATAATCTATGTCCTCAACAAATAGAATCTTTTCCACATTAACACGACTTAACTCTGGAACCTGTCCCATAAGATTTTGTTTAATTTTTAAGGCCATAGGTTGATATATATCATTTTTAATCCAATGCTTAATATCATACTTTCCATTACCTAGAGCTCTTATTTTTTGAATTTTTCCATCTCCTGTAGCTTCTGCATACTGTAAGTTATAACCTATACATTCTATTTCCTTTACTTCTCCTGTTAGCTCATTAAGTATTTTTATTTTTGGCATTTTTTATTCTCCCTTCTAATCTTCTTTAGCTCATCATATTCTATCCATCCAGTTGAGCTATACTTTAAGGATCTCGCTACCCATGTAAGTTTTAAATCTGGATATTTATAATCAAACATTTTCCTTCTCATTTCTCCTTGTTGAGTACTCATACCCTTAACATCTATTAATTCTTCTTTTCCATCTAAATGATATATTAAAAAGTCCGGTGCATATGTTATAGCTCTATATGTCTTTCCATTCTTCTTGAATCCTGGTTGTAATTCATACTTAGGCTGTAACTCAAAATTTAAAATTTTTTCTTGGGATTTAAGTTTTTTAAGATACTCATAATATTTCCCTTCATCCTTACTATCAAAAGTAATTCCATCTATGACAATTTTCTTAGCTCCATATTTGCTCCTATTCATCTCTGTCCCTCCAATCTAATATGCCTTTTACTGCTCTTCTTTCTGCACCTGTTCATGCTTTCAATTACCGTTGCCTTATACTCCTGTTCTCTCCTACGTCTTCTTTTTGCTTGTGCTTTTAATATGTTTTTTACAAACTCCTCTTTGCTTATTTCCATAAAAACACCACGTATTACTGTTTTAGTATTATAATACACCGTAGGTATAAAAGTACCTAGAGTTAGCCTATACCTACAGTATTTAGTTATCTAAAATACTTTACCATGCTTATATGGTCTACTCCTATTCTTTTTCATTTTCTTTTTAATCTCTTTTTCAATATCAACTGTATCTCCTAGCGAAGTATCAGACGTTCTTAAAATTATATCTGCAAGCTCTTCAGCATAATTTTCTTTATCATCTTTTCTTAATGCATTAACTGCTTCTGATACTTCACTCACTATAAGCATTAATCTTTGACACATAAATGCTTTTTTTACGGCTTTAATTTCCTCATTTTCAAATTCTTTTACACACATTTTAGTTATTATATTCTGTTCTTCTTCCCAAAACCCATGATCTATTGCATTTCTATGTGCATCATTTACCATTTCTTTAATTTTTAAATTCACATAATCTTCAATACTCACTATTTGCCTAACTCCTTTAAACAGATTTTACAAATATTTTTACCTTTGAAGTTTATAATCTCTTTAGCTTCTCCGCAGAATATGCAACATGGCTCATACTTTTTTAGTATTATTTGCTCACCTTCTGTATAAATCTCTAGTCCATCACCTTCATCTATATTTAAGACCTTTCTTAATTCTTTAGGTATAACTATCCTTCCTAACTCGTCTACTTTTCTTACTATTCCTATATTTTTCATAATTATATCTCTCCCTTATTTTTATTTAATTCATATAGCATTATTTCTTTACCTACTGCTCTTAGGGCTTTATCTAAATCCTCATGATGGTTATATAATCTTACTACTTCATCTGCCCATAAATTAGTTCTTAAACTTAATTTCTCTACTTTCTCCTGGTACTTGTCCAACAAATCCAAACTCTCTAGTAATAAATCCTTATAAGACATACTTTTCTTTACATATTCCTTTAGAATAAATTTTAAAATTGTATTTTCTTCTTTAAGTGTTTCTTTGTTCTCCATTCCTTTAACTAATACAGTTATCATACTCATCCTCCTAATATTTATCATAGTAACTACATTACCTCTTTTAATGCTTTAAGCTCTTTTATAAAATCATCAATTTCATTAGCATTTAAAACTAAGTTAGTTGTACCCGTAAGATTTTTTATAGAAAAACTATTCTCTTGAACTCTATATTCCATTACCTTACCTCTTAAAACTAAAGGTTGTAATATCTTATTATTGCTTGGAATTTCTTTTTTAGATTCATTTATTTCTTTATTTGTATTATCTTTAGTTGCAGCAGGCTTTGCATTATTTAATTTATCTCTGATACCATACTTCCCTAAATAAGTATCTATAGTTCTTTCTGTTAAACCATATTTTTTACTTATTGCTACTATAGCTTCTCTTCCAGTTCCAAGTATTTTAGCTTCTTCCATAAGTTGTGCCTTAGTTATTTTAGGTTCTTTTGTAAACATTTTATTTTCCCCCTCATATTTATTTTTAATGGTATTAGGTATCTTTTTGAGAATTCTACTTATATAACTTTGTTTTAACCCTATTTCTTCCCCTATCTGTTTTTGAGTTTTATTATTAAAATAGAACTCTTTAATAATTTTCTTATCTCTTTCATTTAAATTTTCTATTATTGCAGCTACTTCTTTGCATGTTATATTAAAAATACTCTTATCTTCATAATTTGTTTTATCTGATATGAAATCTATTAAACTTAAATTTTCATTATCTTGTTTTTGATTCAATATAGGTTTATCTAAACTATCTACATCTAAATGCTTTTCTTCTTTTCTGTTAAATATTCTTAATTCATTATTTACTACAGCTGCTAAGTATGTCATGAATAAAATATTTTTATCAGCATTATAAGCTGTGAATGCTTTAGTCATACCTAAAAAAGCTACTTGAAATAAATCTTCTTCTTCAAATTTACGTTTCCATGACTGTATCAACTTATATAAGAATTTTTCAAACTTAAAATAAACTTCTTCTAAACTCATTAATTTCAAGCCTTCATCTTTGGTGAGAATTAATTTTTTCTCAGCCACCATAAAAATATGTTCCTATTCCTGTGGCATCTGAAATACAAAGTCCCTTGTTTTTCTTTTTCCGCTTTGTATTTCATCGAACCTTGTGCCTTGCATAATCCTATCTTCTATCATGTCTAGCACCTGTATTGCTCTTTCCTCTGTAGCATATTCTCCTAAAAAATAGTGTTCTCCGTATATACTTAATCCATCAGCCTCTATATTTTTACAACACACTAAAGTGTCTTTATTTTTACTTCTAATCCACATATTTTTTATCCCCCATTCTTTAATTTAATAATTCTTTTAATATTTGTGTCTTTTCTTTAGCCTTTTCTACTCTTATACTCTTTCCATCATTGAATACTGGAGTACACATTTCTAAGAGCCTATCATAAGTTCTTTTGTGATATTTTTCTTTAAGTTTTACTAAGGAAATATTTGTAGTAACTATAATTGGTAATCCATTTCTATACCTGCTATCCAAGATGTTGTATATTTTAGTTTTGGCCCAATCTGTATCCTGCTCTGTTCCTAAATCATCTATAATCAATAAGTCTGCATTACTTAAACTCTTTAATATAGTTTCTTCTCCTTCTTTACCCCATGTGTTATATGTTTCTTTGATTCTATTTAGTAAACCATCTATATTTACACATATAACAGGAATCATTTTATCTATTAGTTCATTTGCTATACATGCTGTTGTATGAGTTTTACCATTGCCAGGATCACCATGAATTAATAGTCCTATTGATTCTTTTTTCATTTCAGAAAATTTTGATGCATACTTAAAGCCTATATTGTACATTTTCTTAGTGCCTTTACTAAAGTCCCAGCTATCAAACCTGCTGCTCTTAAACTTTTCATCCATCAATGAATTTTTAATAATGCTTCTAACTCTCAATTGTTTCTCTTTGTTTTCTTCTTCAATTTTTTTAGCCTCATGCTTTGCCTTTTTACATGAACACATTATGGGAACAATTCTTTCTGTACCTAGTAAATTAATTACTTTTTCTACTGGCTCACCACAATTATCACAAGTTTCTATTTTATATTCCGATACCTTCGGCTGTAAGTCTTTGCTGTTCATCAGTACCTGAGCTACTGTTTCCATCTTTTGAGTTTACTCCTTTCTTTTTGATGTTTATATTATTCCAAATTTTTAATATTACTGGTTTACAATAGTTAAATGAACTTATCTTTTCACCTTTAAAACTTGGTTTATAATTTTTAAAAGCATCATCTATGCCCTTTTTAATTACATCTACAGGAACTTTTTGCAATAGTTCTTCCACTGTTTCAAATTCTTTTGGTTTAAAATTAATTGATACAATACCAGCTTTAGAACAATAATAATCTATAATTTTTTCTATGTTATTTTCTATATAAAGAAGATTATTATCTTCTTCTATATCTATATCTTCTTCTTCTTCTGTTCCGTTACTTAACGTTTCATGTAACGTTACATTCTTTTTAGCTTCGTTACTTCCACAAGTTTCCTCTTTAGCAGCTTCTAATAATTCTTTTTTCTTAGCTCTATGCTTTGCTACTCTTTTCTTTGTTTGTTCCCTTACTTTCTCCATACCTTCTATGTTTTGATGCTTTGACCAGTTAGTAATCTTAATTAAATGATTTTCAGCTAATTCTATCATTCCAAAATCATTCAATGTTTTTAGAGCTAACCTTACTGAATTTAAAGGTCTGTTAAAAATAGTACTTAACATCTCCTCTGTATATGGAACATTCTCATTTAAAAAAATATATCCATTTGCATTTGTTTTTCCTGCCTGAACTAAAAGCCTTATCCAAATATAGTGAATTGTATCTCTTTCTGGCATGGCATCTATTAGCTTTATTTTTTCATCATCAAACATATTGGTCGTTATCTTTATCCACTTAACCTCTGCCATTGTATCAATCCTTTCTTTTGTTATCTTTCTGGTTACTTATACATAAAATAAGTCATTAACACAAAGCTACCAAATATTATTATTGTTGCTATAAGAATAATTACATTAGCCCAAAACTTAAATCTGTACTCTTTTAAAATAGATTTTTTGGCTACTTTTAAAGCCTTTTTATCCTCTCCAATGCTTGTTTCTGTAAGAGAATCTATGTGATATAAAACTTCTATTCTTTTCATTTTTTCCATCCTCCATGTATATTTTTTCTATTCTGTCATATACTAATTGAGAAAATACTCTTACTAATGTTATAATGGGGACAAGAGCTTTGCAGAGCTCTTATCCAATTTTTTAGAATGACCTTTTAAGAATGGGTGCTTTGCAGAGCACCTATTTACTTTTATCTTCAATAGTTTCAAACACCACTTCATCACTATCGCTGTCATATTTTACACTACTTATAAAGTATTCTGGATTATCAATATCATATATTGCATATCCATTTTTATTTAGTACAGCCAGTTGTGCATTTATACTTTGTATTAAAGTTTTAAAAGAATTATCCAGACCATAACCTCCTTCCTAAAATGGAACTACTAAGTTATAATGATTTATTTCATCTATAAGGCTTTCCACTTCATTTTTTATGTTCTCTATCTTTCCTTCTTCAGCATATTTTAAGACCCAATTTAAACGATACACTAATGCTTCTTTATCGCTTTTATCCATAACTATACCTCCTGGTCTTGTAAAAATGGTGGTAAATCCTCTTCTTTTGTTTCTGGTGTATCTTCTTTTTTACTTAATCCTTTATCTACTAATATCTTGCAAGCTTTTTGTATTACGGGATCTTTTGAATTTTTCATAAGCCAATCTATATAGTCAGGAGTTTCTTTCATTATCTGACCTAAAGTTTTACCTTTGTTTTTACCAAAGTTTATTTTAATGTTCCCAGCACTATTTTCATCAATATTTTGTACATGCTCTTGTTGTAAAAACTCTTGCATTTCCTCTAGGTCCTGTGTAAATACATCACTTAAGCTTGCAACTTGTAATACAGCGTCTATAAATGCTCTTTTCTTAGCCATCTTTAAAATAGTATTTACTAAATCTGCTATATGTGGGTTTGGTATTTTATATTTAACTGTTCCATACCTAGTCGTTACTTTTTCTACTGTACTAGGATCTATTCCATCTGGTACTGCATCAACATTTATATATCTATATTTCTTTTCCATGCTATTGCAATTCCCCACACCTTGGCTTACCGGATTACCGTTTCTGTATAGAGTACATTTAATGTTATAAGCAAAGAATCCATCTTTATAATCCTCTGTTCTCTCTAAAAACTCATACTCTGGATTAAGACCAAACATCATGCATATTTTTTCTCCACCTGGTTTTAAAAGTGTTGGTTTACTCCCTGCTCCTGCAACCACTCCAAAGTCATGACCATCTTTTAAATTTTTTTGTATAACAGCCTGAAAGGTTGCTATCTTTTGCATAGTTCCTTGTATAGTGCTTATATCTACACTGTCTATAAGGCTAGTAACTTGATTATTTTTAACTATTTCTAATTGATTTTCCATTTTTATTCCTCCTATCTAATTCTTAAACTTTCTGTTTGTTTTATAACAGCGCCTGGGATTTCTATTCCTTCTTTCAGTGCAGCTAATATATCTTTCTTAACTAACTTCTTTTCGATTGCAAAATACTGCTCTGGTATGTTTTCCTCTTCTGTTATCTCAACGCTAGGTGCATTTTTCTGTATTCCTAATGTAAATATCTTACCTTTTACTTTTTTAAGTCCTACAGCTTTCATAGAATTTTCTGCATATTGTTTTAAATTAACTATCCTACTTTCTAAGGATTTTCTTCTATCTACTAATCTCTTTTCTTCTTCCTTTAGTCCTTTTGCATCTACTTCTATAGATTTAATTACTTTAGCTACATTTTCTAACTTTATATCTATTTCCTCTCCTATGTTATCTAAGCTTTCCTTTAGTATTTCTACTGGTACTTCTGGATTATCTACTAGATCCAAAAGATTGTTATAATTTTGAGTTAACTCATATAATTTAGTCATTGCTTTTTCCTCCTTTATTTTTGCACCTCTTCACCTCCTTGTAACTAAATCAACTAACTGTTATCGCAGTGGCCATACATTTTATTGTGGTGTGGCTCTTATCTTCGCCTACTCCCGCTCTAATTAGTTCATTTAGTTACAAGGATTTTGGTACTATTTTCAATGTTCTAACATATACATAAACTAGAAAAGTATATGCATTTTTGCTGTAGTAAAATTTTTTAAAAAGGCTTTTCAGCCTTAATTTTTCTTAAGCTTTCTCTCTTTATATACTTTAATAAGTTCATCAATTTGTTCCGGAGGTAAAGTTTCTATAAGAACTTTGGCTACTGCTCTTCCCACTCTTTCCTCATATGCTTTCATATGTTCTGGAGGTGGGTAATTTATTCTTATATTAAATTTAGGTTCTTTAGCCATCAGTTCTTCCTCCTCTCTCTACTTAGTTATTATTTATCTTATGAGAAATCGTATCTATTTGTTAAAATTATTTTTATTTATAAATCTAAGTGACGATTCCATACATTTACATTCCAAAACTTTTATAGTGTCCTCTAACAGTTTTTTAGTAAATACTGCTGTAACATCTATTCCTTTAAATTCTTCTTCTACAAGCTCTAGTATTTTATCTATTGTTTCTTCTCTTTTCTCTTGTGTAACAGTTACTTTTATATCTTCCATACTGTTACCTCCTAAAGGATTTTTTACATTTTTGTAGAATATCACCATTTAAAAGGTGGTGATTGTTATGGTTTATAATATTTCTTATGATCTACATAACCCTGGCCAAAAATATAAGAAACTTCATGAATTAATAGTAGAAGTATCAAATAATAGATGGGCTCACATATTAAACTCTACTTACGTAATTCAGTCTTACAAAAATGCAAATGAAATTTATAATTATCTATCAAATGCAATTGATGAGAATGATTTAATATTCATTTGTGAAATAACTAAAAATATGCAAGGTGTATTAAAAAATGAACATTGGCCATACATTAGTAATCTATTTTAATCTGGTTTTCTACATAGTTCTCCAGTGCAAATGCCTTCTGATGTAGATGGTGTGAATTCATATTGCTCTTGAGCTGGTATCTCAGGAGCTTCTTTCACTATCTCAACATTTTCAAATATCCAATTTAAAGCAAATTTTTTTAAATCATTATGATCCAAATTACTTTTGTCTTTTTCCAAATTAATTTCTTCTAAAAATTCATAATTCTCTCCATCTAAAACTTCAACTGTTATACAATATATTTCTTGGTCATATAGAAATCTAAAAATATCTATATCTACATAAATCATTGTTCCTGTAGAAACATTTAAATTTAAATCCGTTGTTTTTATCTTTTTATTCATTAAACAACCTCCTCATTAAGTGAATACAAGTTTTTAGCAAGTTCCCTTACATCATTCTCATAAAGTTTACAAGCTATTTCATAAAGTTCTGGTATCTTATTCATAACCTTGTCAATGTAATCAACTTTACTTTTTAACTTTGGTTTATGGCTTTTGTTATATTTCTCTAGTTTATTTTTTATACTTTCAATGTGGTACTTCATTTCAAATTGTTTATATAATTCATTCCAACGTTCTCTATAATTTGCACCTTTGTACCTAACAACTCTATTTAATATCTGTCGTTTCTCTGCTAATGATATTTCATCAACTAAGCCTACAATGACATCTTCTTTATGTTCTATTTCTTTCTCTTTTAATGCTATAATCTCATTTTGCTTCCTTACAATTTCTAAGGTGTTCCTGAAAACCATTTTGCTTTGCTCATCCAAATAAGGTAGGTAAGTATTAATAAATAGGTCTTCGCTTGCAACATAACCACCAGTTTTCCTTATAGTTGGCAATATTTCATCAAATATCCAAATTTCAAATTTTTCTGCGGATGGTAATTCAGAATGAGTTATTAATCTATAAAGATTACCTTCATCTATAAATTTCTTATTCTGTTTGCCACCCTTTGTAAGGACCGAACGAATCGTGCACCCCTTTTGTTTACAGTGATCTCTTATTGCCTTTTGTGGATTAGAATACCCCAATATGGTGGCAATATCTGTTGCTGGAAACCATTCCTTTTTATTTTCATCTACAAGCAATTCAAATTCTCCAAATTGCTGGTTTTTAAAAATCTGTAAGTTACTCACTCCCTCATCTCCCTTTTGTTCACTAATGTAATTTTCAAAGAAAATGTTTAAACTATTTATTAAGCAGTTCCTGTCGTCACTTTGACGTCATGCTTTGCAAAAAAAATTTCTTCTATTGTACTGTTATATTTTTGTGATATTTTATATGCTTCATTAAGAGTGAAATCAGTTTTACCATTTTCTTTAAAGTTGAATGTAGATACTCTTACGCCTAAAAAATCTGCTAAATCTTTTTGAGTATCTCCATGTTTTGCTCTAAGTGATTTCAATTTACGATTAATCATATATAATCACCTCCTTGTTGTCATTTTGACTACTTGTATGCTTTTATTATAGTTGTCATTATGTCGTTTGTCAATACTATTTTTACTCTTTTTTTAAAAAAATATTCATTATGACGTTATTTATTTTTAAAACAACAAAATGTGTATAATAATATATAGGAGGTAGTCAATATGAAAACTATTGGTGAAAGAATAAAAGAATTAAGAGAAGAAAAAGGAATAAATCAGCTTGAATTATCTAAAATATTAAATGTTCATAAAGGCAGTGTTTCTAATTGGGAGAACAACAAACGAACTCCTGATGCAGACATGCTTACAAAAATTGCTGATTTTTTTAATTGTTCAGTAGATTACTTATTAGGCAATACAGATATAAAAAATAAATTAAATATGTCAAAATTATTTAGTGGAGCTGGAGGCTTAAAACTAGATTCATTTAAAGAATTAATAGAGAAGGATGAATCTAATGACAATACTTTATTTAGCTTTATGCTACAAGATAAACTAAAAGAGGCTGGATTATATAATGAAAATATGAGTAATGAAGAAAAAAACAACCTCGCTAATAAAATTCTTGATATTTTAAAAATTATGCAAAAAAAATAG
Protein sequences of DBSCAN-SWA_5 >NC_009495|2510335:2520594|2511623_2512004_-|WP_164928184.1|DBSCAN-SWA MSIEDYVNLKIKEMVNDAHRNAIDHGFWEEEQNIITKMCVKEFENEEIKAVKKAFMCQRLMLIVSEVSEAVNALRKDDKENYAEELADIILRTSDTSLGDTVDIEKEIKKKMKKNRSRPYKHGKVF >NC_009495|2510335:2520594|2513841_2514645_-|WP_012047835.1|DBSCAN-SWA MNSKDLQPKVSEYKIETCDNCGEPVEKVINLLGTERIVPIMCSCKKAKHEAKKIEEENKEKQLRVRSIIKNSLMDEKFKSSRFDSWDFSKGTKKMYNIGFKYASKFSEMKKESIGLLIHGDPGNGKTHTTACIANELIDKMIPVICVNIDGLLNRIKETYNTWGKEGEETILKSLSNADLLIIDDLGTEQDTDWAKTKIYNILDSRYRNGLPIIVTTNISLVKLKEKYHKRTYDRLLEMCTPVFNDGKSIRVEKAKEKTQILKELLN >NC_009495|2510335:2520594|2517785_2517962_-|WP_012047842.1|DBSCAN-SWA MAKEPKFNIRINYPPPEHMKAYEERVGRAVAKVLIETLPPEQIDELIKVYKERKLKKN >NC_009495|2510335:2520594|2516041_2516188_-|WP_012047839.1|DBSCAN-SWA MDKSDKEALVYRLNWVLKYAEEGKIENIKNEVESLIDEINHYNLVVPF >NC_009495|2510335:2520594|2517059_2517545_-|WP_012047841.1|DBSCAN-SWA MTKLYELTQNYNNLLDLVDNPEVPVEILKESLDNIGEEIDIKLENVAKVIKSIEVDAKGLKEEEKRLVDRRKSLESRIVNLKQYAENSMKAVGLKKVKGKIFTLGIQKNAPSVEITEEENIPEQYFAIEKKLVKKDILAALKEGIEIPGAVIKQTESLRIR >NC_009495|2510335:2520594|2513588_2513822_-|WP_012047834.1|DBSCAN-SWA MWIRSKNKDTLVCCKNIEADGLSIYGEHYFLGEYATEERAIQVLDMIEDRIMQGTRFDEIQSGKRKTRDFVFQMPQE >NC_009495|2510335:2520594|2515497_2515698_-|WP_012047837.1|DBSCAN-SWA MKRIEVLYHIDSLTETSIGEDKKALKVAKKSILKEYRFKFWANVIILIATIIIFGSFVLMTYFMYK >NC_009495|2510335:2520594|2516190_2517048_-|WP_012047840.1|DBSCAN-SWA MENQLEIVKNNQVTSLIDSVDISTIQGTMQKIATFQAVIQKNLKDGHDFGVVAGAGSKPTLLKPGGEKICMMFGLNPEYEFLERTEDYKDGFFAYNIKCTLYRNGNPVSQGVGNCNSMEKKYRYINVDAVPDGIDPSTVEKVTTRYGTVKYKIPNPHIADLVNTILKMAKKRAFIDAVLQVASLSDVFTQDLEEMQEFLQQEHVQNIDENSAGNIKINFGKNKGKTLGQIMKETPDYIDWLMKNSKDPVIQKACKILVDKGLSKKEDTPETKEEDLPPFLQDQEV >NC_009495|2510335:2520594|2514604_2515465_-|WP_012047836.1|DBSCAN-SWA MAEVKWIKITTNMFDDEKIKLIDAMPERDTIHYIWIRLLVQAGKTNANGYIFLNENVPYTEEMLSTIFNRPLNSVRLALKTLNDFGMIELAENHLIKITNWSKHQNIEGMEKVREQTKKRVAKHRAKKKELLEAAKEETCGSNEAKKNVTLHETLSNGTEEEEDIDIEEDNNLLYIENNIEKIIDYYCSKAGIVSINFKPKEFETVEELLQKVPVDVIKKGIDDAFKNYKPSFKGEKISSFNYCKPVILKIWNNINIKKKGVNSKDGNSSSGTDEQQRLTAEGIGI >NC_009495|2510335:2520594|2512245_2512551_-|WP_041350637.1|DBSCAN-SWA MITVLVKGMENKETLKEENTILKFILKEYVKKSMSYKDLLLESLDLLDKYQEKVEKLSLRTNLWADEVVRLYNHHEDLDKALRAVGKEIMLYELNKNKGEI >NC_009495|2510335:2520594|2518016_2518223_-|WP_164928185.1|DBSCAN-SWA MEDIKVTVTQEKREETIDKILELVEEEFKGIDVTAVFTKKLLEDTIKVLECKCMESSLRFINKNNFNK >NC_009495|2510335:2520594|2518903_2519704_-|WP_012047846.1|DBSCAN-SWA MSNLQIFKNQQFGEFELLVDENKKEWFPATDIATILGYSNPQKAIRDHCKQKGCTIRSVLTKGGKQNKKFIDEGNLYRLITHSELPSAEKFEIWIFDEILPTIRKTGGYVASEDLFINTYLPYLDEQSKMVFRNTLEIVRKQNEIIALKEKEIEHKEDVIVGLVDEISLAEKRQILNRVVRYKGANYRERWNELYKQFEMKYHIESIKNKLEKYNKSHKPKLKSKVDYIDKVMNKIPELYEIACKLYENDVRELAKNLYSLNEEVV >NC_009495|2510335:2520594|2519763_2519988_-|WP_012047847.1|DBSCAN-SWA MINRKLKSLRAKHGDTQKDLADFLGVRVSTFNFKENGKTDFTLNEAYKISQKYNSTIEEIFFAKHDVKVTTGTA >NC_009495|2510335:2520594|2520159_2520594_+|WP_012047848.1|DBSCAN-SWA MKTIGERIKELREEKGINQLELSKILNVHKGSVSNWENNKRTPDADMLTKIADFFNCSVDYLLGNTDIKNKLNMSKLFSGAGGLKLDSFKELIEKDESNDNTLFSFMLQDKLKEAGLYNENMSNEEKNNLANKILDILKIMQKK >NC_009495|2510335:2520594|2510335_2510965_-|WP_012047827.1|DBSCAN-SWA MPKIKILNELTGEVKEIECIGYNLQYAEATGDGKIQKIRALGNGKYDIKHWIKNDIYQPMALKIKQNLMGQVPELSRVNVEKILFVEDIDYVGDEMSKSDDVMWIKKAPKQVTELTGYKFIIESREFWMSRISKEQVVAHIYSCLKQIDGDKLIEPDVKGWKEVIGNLGLGWETTLSPIPNLLEGFEDEDFKMLKKADKQLKFNLKAAK >NC_009495|2510335:2520594|2518290_2518560_+|WP_164928186.1|DBSCAN-SWA MVYNISYDLHNPGQKYKKLHELIVEVSNNRWAHILNSTYVIQSYKNANEIYNYLSNAIDENDLIFICEITKNMQGVLKNEHWPYISNLF >NC_009495|2510335:2520594|2510952_2511375_-|WP_012047828.1|DBSCAN-SWA MNRSKYGAKKIVIDGITFDSKDEGKYYEYLKKLKSQEKILNFELQPKYELQPGFKKNGKTYRAITYAPDFLIYHLDGKEELIDVKGMSTQQGEMRRKMFDYKYPDLKLTWVARSLKYSSTGWIEYDELKKIRRENKKCQK >NC_009495|2510335:2520594|2512003_2512243_-|WP_012047831.1|DBSCAN-SWA MKNIGIVRKVDELGRIVIPKELRKVLNIDEGDGLEIYTEGEQIILKKYEPCCIFCGEAKEIINFKGKNICKICLKELGK >NC_009495|2510335:2520594|2511371_2511533_-|WP_003398537.1|DBSCAN-SWA MEISKEEFVKNILKAQAKRRRRREQEYKATVIESMNRCRKKSSKRHIRLEGQR >NC_009495|2510335:2520594|2512580_2513576_-|WP_041350636.1|DBSCAN-SWA MVAEKKLILTKDEGLKLMSLEEVYFKFEKFLYKLIQSWKRKFEEEDLFQVAFLGMTKAFTAYNADKNILFMTYLAAVVNNELRIFNRKEEKHLDVDSLDKPILNQKQDNENLSLIDFISDKTNYEDKSIFNITCKEVAAIIENLNERDKKIIKEFYFNNKTQKQIGEEIGLKQSYISRILKKIPNTIKNKYEGENKMFTKEPKITKAQLMEEAKILGTGREAIVAISKKYGLTERTIDTYLGKYGIRDKLNNAKPAATKDNTNKEINESKKEIPSNNKILQPLVLRGKVMEYRVQENSFSIKNLTGTTNLVLNANEIDDFIKELKALKEVM |
20 | Clostridium_phage(36.36%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_6 |
3056732 : 3066201
Sequences of DBSCAN-SWA_6
Nucleotide sequences of DBSCAN-SWA_6 >NC_009495|3056732:3066201|DBSCAN-SWA TCTAGTGTTTAAAATGTCTTATTCCTGTAAATACCATAGAAATCCCTTTTTCATTACATACCTTTATAGATTCTTCATCTCTTATAGAACCGCCTGGTTGAATTATAGCTTTTATTCCCCATTTTGCAGCTTCTTCTGCTACATCTCCAAATGGGAAAAAAGCATCTGAAGCTAAAACTACGCCATCTCCAGCTCTATCTAACGCTTCCTTTGCTGCCCATATTCTATTTACTTGGCCTCCCCCAATACCTTTTGCCATACCATCTTTAACTACTACAATAGCGTTGGATTTCACATATTTAACTACTTTCATACCAAATATAAGATCTTTCATTTCTTGCTCTGTTGGAGATTTTTCTGTAACTACTTTTGTATCTTCTAATAATTTATTATCACTCTTTTGTACTAATATTCCTCCATCTACCTTTGCCATATCTTTTCCTTCTGTAGATTTTTCTTCACATTTTATAACCCTTAAATTTTTCTTGTTTTTTAAGACTTCTAAAGCATCTTCATCAAAATCTGGTGCTACAACTATTTCTAAAAATATTTTTGCAAGATTTTCTGCTGTTTCCTTATCTACTTTTCTATTAAAAGCAACTATGCCACCAAATATAGATATAGGATCACATTCATAGGCCTTAGTATAAGCTTCCTGTACAGTATCCCCTATAGCCACACCACAAGGTGTATTATGTTTTAATGCACAACAAGCCACCTCTTCAAATTCACAAACGGTTTTCCACGCTATATCCATATCCTTTATATTATTGTAGGATAATTCTTTTCCATTTAACTTTTCAAAATTTTTCATAGGATATTTTCCAACAGTAGATGTGTAATAAGCTGCTGTTTGATGAGGATTTTCTCCATATCTTAAATCCATGTTCTTTTTATAGGATAGAGTTAAATATTCTGGATATTCCTCTTCTAATAAGAAATTACTTATAGCTGCATCATAGGCTGACATTAGATTGAAAACTTTTCCTGCTAATTTTTTTCTAGTTTGTATATTAACCTGATTATTTTCTTTTATCTCATTTATGACATTTTCATAATCCTTAGTATCTGTTAGTACTACTACATCTTTAAAATTTTTAGCTGCTGCTCTTATCATAGTAGGTCCACCAATGTCTATAAACTCTACTTTTTCATCAAAACTTAAATTTTCTTCTACTTTATTAAAGAAAGGATATAAATTCACTACTACCATATCTATAGGGTTTATGCCCTTTTCTTCTATTACCTTCATATGCTCTTCATTATCTCTTATAGCTAATATGCCTCCATGAATTAAAGGATTTAATGTTTTTACTCTTCCATCTAACATTTCTGGGAAACCTGTTACCTCTTCTATATCTATTACTTTTACTCCATTTTCTTTTAAATGTTTATAAGTTCCACCTGTAGATATTATTTCTACATCTCTACTTTCTAAAAACTTTGCCAAATCTAAAATTCCTGTTTTATCAAATACACTTATTAATGCTCTTTTTATCACTTAAACTCCCCCAGTTTCAATATTTTTTATTATCTTATTTATCTGTCATAAGTAACTGCCACCAATATACCTTCTTTCAAAGAAAACATATAAGTGGCACTATTTCAATTTACAAACTACAATTTTTTATATTTCAATAAATTTAATCTACTCTAAACACATTTTTCTATTAGTTTCATTTATATTAATAGTAATTTTTTCATTATTATAAATTTAGTATGTTTTAATAAAAACTTTTCTTCCTTGTAATTTTACTTTTTCTTCACTTATAAGTTTTATAGCTTCTGGTAATGCCTCATGTTCTTTTTCTAGAACTCTTTTTTGCAATATTTCTGCTGTATCTTCTGCAAAAACTGGTACAGATTTTTGTATTATTATAGGTCCACTGTCCGTACTCTCATCTACAAAATGAACAGTGCACCCAGATACTTTTACTCCGTATTCTAATGCTTTTTGGTGCACTTTTATACCATACATTCCATCTCCGCAAAAGCTTGGTATTAATGAAGGATGTATGTTTATTATCTTATTTTCAAATTTATTTACCAAATCCCCATTTAATATAGAAAGCCATCCTGCTAAAACTATTAAATCTACGTTTCCATATAAACACTCACATATTTTATTAGACAGATTGCTTTTATATATTTTTCTATCTAGAGTTAAAGTTTTAATTCCCTTTTTTTCTGCTCTTTCTATACCATAAATATTAGATCTATCCCCTATAACCATTTCTATCTTGCAATTTTTTATATATCCCTCTTCTATTTTATCTATTATAGATTGAAGATTGCTTCCTCCCCCTGAAACAAGTACTGCAATTTTAAACATCTTATTCTCCTTTAATTTAAAGAAAATTTTTCATATATACTCTATAAATAATTAATTCCCCAATCAATTATTTTAAAGATCTAACCTATGAACTAATTTTTATTATAAATTTATTTAATGCCTTTTTTTAAATTAGTTCAACAGACTTATCTCCTTTTTTAACATATCCTATTTTATAACCCTTTTCTCCCATTTCTATCAGGTCTTTTATTATATTTTCCCCATCTTTTTCATTTACACATAATACAAAACCAATCCCCATATTAAAAGTATTGTACATATGATCTTCTTCTATCCCTAAACTTATTAGATGGCTAAATATATTTGGTAATGGATAAGATTTTTTATTTATAACTGCTGTAAAATCCTCTTTAAACATTCTAGGAATATTTTCATAAAAACCTCCTCCAGTTACATGAGCCATACCTTTTATATTATATTTTTCTAAAAGTTTCATTACAGGTTTTACATATATTTTTGTAGGAGTTAAAAGAGTATTTCCTATTTTATTTCCTTCAAAATCTTTATGCAAATCTTCTACTAATTTTCTAATAAGAGAATATCCGTTGCTATGAGGTCCTGAAGATGCTATACCTATTAATATATCCCCATCTTCTATTTTACTTCCATCTATTATTTCATCTTTTTCTGCTATACCTACAGCAAAACCAGCTATATCATATTCCCCATCTCTATAAAAGCCTGGCATTTCTGCTGTTTCTCCACCTATTAGAGCACATTCACTTTGGATACAACCATTGCTAACCCCTTCTACAAGCTGAGCTGCAACTTCTGCTTCCAATTTCCCACAAGCTATATAATCTAAGAAAAATAACGGCTTAGCACCATGACATAATATATCATTTATGCACATAGCTACGCAGTCTATTCCCACTGTATTATATTTTTTCATTCTAAAGGCTATATCTAATTTAGTTCCAACTCCGTCAGTTCCTGATACTAATACGGGATTTTTATATTTAGGAAGTTCAAACATTCCTGCAAAACTTCCTAAATTATTTAATACTCCCTTTGTAAATGTCTTTGAAGCATGTTTTTTTATAAGATCTACTGATTTATAACCTTCCTCTATATTAACCCCAGCTTCTTTATAAGATACCATGAATAACATTCCCTTCTTTACATTATTAGTTATTCTCAAAATTTAAAAAACTTAAATTCCCTATTCCAAACTATCTTTAGGCATTTCTATAGGTGCAGATATAGGATATACGCCATTAAAACATCCCAAGCAAAAACCTTTATCTTTATTAAGTGTTTCTACTAAGCCTTCCATACTTATATAAGCTAGACTATCTGCTCCTATTTTTTCTCTTATTTCTTCTACTTCTGAGTGAGCACCTATTAAATCTTTTCTATAAGGAGTATCTATTCCAAAATAGCAAGGATATTTAACCACTGGAGATGATACTCTAAAATGAACTTCCTTAGCTCCAGCTTTTCTTAATATTTGTACTAATCTTTTACTAGTAGTTCCTCTTACTATGGAATCATCTATTATTACTACTCTTTTTCCTTCTACATTTATTTTAAGTGGATTTAGTTTTACAGATACAGCTTTTTCTCTTAATTCTTGAGAAGGTGCTATAAAAGTTCTTCCCACATATTTATTTTTTATAAATCCTATACCATAAGGTATTCCTGAAGCTTCAGCATATCCTACCGCAGCTGGTATACCTGAGTCTGGGACTCCTATAACTATATCTGCCTCTACTGGGTATTCTTCATAAAGTTTTCTTCCCGCTCTAATCCTTGATTCATAAACATTTATACCATCCATAGTACTATCTGGTCTTGCAAAATATATATATTCAAAAGCACAGGTATGACATCTTGTTTTTTCTGTAAACTTAATTGAATTTATTCCACTTTCGTCTATAATAACTATTTCTCCAGGCTCTATATCCCTTATAAACTCTCCACCTACGCAATCAAAAGCACAACTTTCCGAGCTTAATAAATAATCATCCCCAATTTTTCCTAGGCACATAGGCCTTATACCATGAGGATCACGTGCTCCTATTAACTTATCTTCTGTAAGTATAACGATAGCATAGGAACCTTTAATTGCTTGTATTGCATCTACTACTGCTTTATCTATACCTTTTTTAGCGCTTCTTGCTATTAAGTTTAATAATACCTCTGTGTCTATAGAAGTTTGAAAAATACATCCGCCATCTTCTAAAAGTTCTCTTATAACTGCTGCATTAACTAAATTACCATTATGAGCTATAGCAATAGAACCTAACTTATAAGTACCTACTATAGGTTGTGCATTATCTGATTTACTCGCTCCTGTAGTTGAATATCTAACATGTCCTATAGCAGAATTTCCTATTAATCCTTCTATAGTTTCTTTGCTAAAAACATCCGATACAAGACCCATACCCTTATGATATTTAAATTTTTCTCCATCAGATACTACTATTCCTGCACTTTCTTGTCCCCTATGTTGAAGAGCATATAATCCGTAATAAGTTATTTCTGCTGACTTTGATTCATTATCTTTAGAAAATACTCCAAATACCCCACATTCTTCTTTAAACTTATCTCCTTCTAAATCAAAGGGCATATTTTCATTTAAATCATCTAACATATAGCACATACTCATTTTTACTCCCCACTTATTTTCTATTTTAAAAATTTAATCTTCTCTTAGATTATTTCCAGCTGCTGTAAAAATAATTTTAAACTATAACAATCTATTTATTGACTCTTTTTAATATTTCCATATAAGCTTCTTTTACATTTCCCATGTCTCTTCTAAATCTATCTTTATCTAACTTTTCTCCTGTGCTTTTATCCCATAATCTACAAGTATCTGGGGATATTTCATCTGCTAAAAGGAGCTCACCATTAAATCTTCCTATTTCTATTTTAAAATCAACTAGATTTATTCCTTGCTCATCAAAGAATTCTTTTAATGTATTATTTACTTTTTCTGCTATAGAATACATTTCTTTTAGTTCTTCAAAGGTTGTAAGTCCTATAGCCACTGCATGATAGTCATTTATAAGAGGGTCATTTAAATCATCATTTTTATAACTTATTTCAAATACAGTAGTATCTAATTTTCTTCCTTCTGAAAGACCTAATCTTTTTGCCATACTTCCTGCTGCTATATTTCTAACTATAACTTCTAGTGGAACTATTTCTACTTTTTTGCAAAGCTGTTCTCTTTCATTTATCTTTTCTATAAAATGTGTTTTTACGCCCTTTTTTTCTAAAAGTTCAAATAACATTGCCGTTATAGAGTTATTCATAACTCCCTTATCTTCAATAGTTCCTTTCTTTTCCCCATTAAAAGCTGTGGCATCATCCTTATAATACACAACAACTGTATCCTTATCATCCGTTCTGAATATTTTTTTAGCCTTTCCTTCATATAACATATCCTTCTTTTCCATTATAACTCCACTCCCTCTTTGTTATCATTTATAAATTTTTCTTTCATATCTTTTCTATATTCTATAAGTTTTTCTTTTAACTTTTCATACTTTAAAGATAATATTTGTACCGCAAGCATTCCTGCGTTATAACTATTATTTATACCCACTGTAGCTACAGGTATAGATTTAGGCATTTGAACTATAGATAAAAGTGAATCCATTCCTCCAACTGCGGCTTCTATAGGCACTCCTATAACCGGAAGAACCGTATGAGAAGCTATAACCCCAGGTAAATGTGCTGCAAGACCTGCCCCAGCAATTATACATTCATAACCTTCCTTTTCTAAATCTTCAATTGTTTCCATCAACTTTTCTGGTACTCTGTGCGCTGAAAGTATGTAAGCTTTATATTCTATACTAAACTCTTTTAAAGCTTTAGCCGCTCCCTTCATTTTATCAGTATCAGATTTACTTCCAAAAATAATAGCTACTTTCATGTACTAGACCTCCTTATATTTAAATATATAAAAAATTCCGCTAAGATTTCTATGGAGAATCCTAAAGCGGAACTTAAGCGCACTGCAAAAGCATAGCTAAGATTCATCCATAGACAGGGAATTTATGGTTCCCTCGTAGAGACTCTCAAACCTTATTATTGAGATTATATGGATGATATATTCATTTGTTTTATGTACTCATGGTAACATATAATTCTTAATAAATCAACATACTTTTATAAAAACATTCGTATTTTATTGGTATTTTATTTATTTTTTTATAATATTATTCGTAATGTAACGAACAATTAGTTAGGTGAAAAATTCACTGAAATATATATTATATTGTAATAGAAATAATTTATAATAGAAATTTATTTCTGAAAATAAAATAGATTTAATTTTCAGATATCAAGCAAAATAATATATGGTAATAAACATATGAATAAGCTTTAACATTTTCTAATCTTTTTAAATCGAGAGCTTTTGTTATTAATCAAAGAATGAAGGTAAAAAACCGATGGCCAAGCCACACATAGCTTTTCCACCGGGTAAAAAATTTTTAATGAAAAAATTTGAGATTCCTAGTCAAGTAAGTTATCTATCTATACATGTATTTTTTATATTTGCATGGTTAAAATTAAATCTATTTTAAAATATTACTATCTAAGATAATTATTTTTTTCTTCTATAAGCAGTATCCTCAAGTGGAAGCTTTTTTCTAAAGTTTCCATCAAATTTATAGTAAGCACCTTGAGCTGCTGGGGCTGTTGGTATGGTTGTAATTTCTCCTATTCCTTTTGCACCATAAGCTAAATCATTAGTATTCTTTTCAATTATTGTTGTTTCAATTTCTGGTATATCAGTAGCTCTAAACAAACCTAATGTGCCAAACTTAGCAGTTGGGATAGATTTATTTAATGGATAATCTTCTGTAAATGCATACCCAAGTCCCATAACTATTCCACCTTCAATTTGTCCTTCTACATTAGTTAAATTTATAGCTTTTCCCACATCATGTGCTGCAACTACTCTTTCTACTTTTCCATCATCATCAAGAATAACAACTTGTGTTGCATAGCCATAAGCCACGTGACTTACTGGATTCTTTTTATCAGAATTAATAGGATCTGTAATACTTTGATATTCCCCATAAAATTCTTCACCTTCACACTCTTCTAATGATGTAGTTAATAATTTTTCCTTAAGCTTTAATGATGCCATTCTTGTGGCTTCTCCAGTAAATACTGTTTGTCTTGATGCTGTAGTTGTCCCTGAATCTGGTGCAAATTTTGTATCTGGTAAATCTAAAATTATCTGTTCTGGTAATAAACCTATTGTTTCACATATTATTTGTGTAAGAATTGTTCCAAGACCTTGACCTATGCAAGCTGCACTAGTTCTTATATGAACCTTTCCATCTATTACTATTAAGTTACATCTTCCAATATCCGGTATTCCAACACCAACTCCTGAATTTTTCATACAACAGGCTATTCCTGCACATTTACTCTTTTTATATACATCTTTCACAGCTAATATAGTTTCTTTAATTGCAGTTCCTTTATCAGCAATTTGTCCATTAGGTAGTGCATCTCCAGGTTCTACTGCGTTTTTAAATCTTATTTCCCAAGGAGATATACCAACTTTTTCAGCTAAAAGATTTAAGTTGCACTCTGATCCAAAAACTGATTGTGTTACTCCAAATCCCCTAAAAGCTCCTCCTGGGGGATTGTTAGTATATACAGCGGTACCTTTTATTTTCACATTAGGACATTTATATGGGCCAGCTGCATGAGTACAAGCTCTTTGGAGTACAGGTCCTCCTAATGATGCATAGGCACCAGTATCTGATATAATATCTGCTTTAAAAGCAGTTAAATTTCCTTTTTCATCACATGCAGTAGTAATTGTCATTTCCATAGCATGTCTTTTAGGATGAATCTTTATACTTTCCTTACGACTTAAAGTTATTTTAACGGGCTTTTTAATAGTCCATGCAAGAAGAGCGGCATGATGTTGTACACTCATATCTTCTTTTCCACCAAAGCCTCCACCCACATATTTGCTAATAGTCCTTACTTTTTCTTTAGGAAGCCCTAAAAGCTCAGAAATCTCTCTCTGCTCATCATATATACCTTGGCTTCCTGTATAAATAATAACTCCATCCCCATCTGGCATAGCTAAAGCACTTTCAGGCTCTAAAAAAGCATGTTCAGTAAAGGGAGTAGAATAATGATTAGTAACCACATACTTAGAATTGGCTATTGCCTCATCTACATCTCCTCTATTAACTTTTTCCACTGTTAAAATATTTCCCTTAGGATGAATTTTAGGAGCATCTTCAGCTATTGCAATATTAGGATTAGAAATAGGTTCTAATTCTTCATATTCTACCTTTATTAAATTAAGTATTTCTTTTAAAGCCTTCTTGCTTTTTGCTGCCACTAAAGCCACTGCATCACCAACATACCTTGTTCCTTCTCCTACGGCTATCATTGCTGGCCAATCCTTTACAATATGTCCTATAAGCCTATTTCCTGGGACATCTTCTGCTGTAAGAATAGCTTCAACTTCTGGATGTTTTAAAGCTACACTTATATCAATGCTTTTTACTAAAGCTCTAGGATATTTTGATCTTAAAGCAGAACCATAAACCATTCCTTCTATCTTCATGTCATCTACATATTTTCCTATACCTAAAATTTTATCTTTTGCATCTATTCTTGGAATATTTTCACCTATTTTCCCTTTATATTCTTTCGCAAATGGAAGTTTACCATTTCTAAATGCCCCTGCTGCCATTTCAATGGCTTTTATTATTTTCACATATCCAGTACATCTACATACATTTCCTCTAATAGCAGTTTTAATTTCTTTCTTATTTGGATTTAGATTTTTATCTAAAAGTGCCTTTGCACTTATTATCATCCCTGGAATACAATATCCACACTGTACTGCTCCAGCTTTAGAAAAAGCCCAAGTAAAAACATCCTTTTCAAATTCTGTTAACCCCTCTACAGTCTTAACATCTTTTCCATTCACCTTTGCAGTTGTACATATACAGGCTCTAAGCGCCTTACCATTAACAAGTATCATACAGGCTCCACAGGCTCCTTCTGCACACCCATTTTTTACTGAAGTTAAATCCTCATTATCCCTCAAATATTCAAGTAAATTAATATCCTCTGAAACAGATACATTTCTTTCATTTAATATAAATTCATACAC
Protein sequences of DBSCAN-SWA_6 >NC_009495|3056732:3066201|3063645_3066201_-|WP_012099417.1|DBSCAN-SWA MYEFILNERNVSVSEDINLLEYLRDNEDLTSVKNGCAEGACGACMILVNGKALRACICTTAKVNGKDVKTVEGLTEFEKDVFTWAFSKAGAVQCGYCIPGMIISAKALLDKNLNPNKKEIKTAIRGNVCRCTGYVKIIKAIEMAAGAFRNGKLPFAKEYKGKIGENIPRIDAKDKILGIGKYVDDMKIEGMVYGSALRSKYPRALVKSIDISVALKHPEVEAILTAEDVPGNRLIGHIVKDWPAMIAVGEGTRYVGDAVALVAAKSKKALKEILNLIKVEYEELEPISNPNIAIAEDAPKIHPKGNILTVEKVNRGDVDEAIANSKYVVTNHYSTPFTEHAFLEPESALAMPDGDGVIIYTGSQGIYDEQREISELLGLPKEKVRTISKYVGGGFGGKEDMSVQHHAALLAWTIKKPVKITLSRKESIKIHPKRHAMEMTITTACDEKGNLTAFKADIISDTGAYASLGGPVLQRACTHAAGPYKCPNVKIKGTAVYTNNPPGGAFRGFGVTQSVFGSECNLNLLAEKVGISPWEIRFKNAVEPGDALPNGQIADKGTAIKETILAVKDVYKKSKCAGIACCMKNSGVGVGIPDIGRCNLIVIDGKVHIRTSAACIGQGLGTILTQIICETIGLLPEQIILDLPDTKFAPDSGTTTASRQTVFTGEATRMASLKLKEKLLTTSLEECEGEEFYGEYQSITDPINSDKKNPVSHVAYGYATQVVILDDDGKVERVVAAHDVGKAINLTNVEGQIEGGIVMGLGYAFTEDYPLNKSIPTAKFGTLGLFRATDIPEIETTIIEKNTNDLAYGAKGIGEITTIPTAPAAQGAYYKFDGNFRKKLPLEDTAYRRKK >NC_009495|3056732:3066201|3061786_3062491_-|WP_012047943.1|DBSCAN-SWA MEKKDMLYEGKAKKIFRTDDKDTVVVYYKDDATAFNGEKKGTIEDKGVMNNSITAMLFELLEKKGVKTHFIEKINEREQLCKKVEIVPLEVIVRNIAAGSMAKRLGLSEGRKLDTTVFEISYKNDDLNDPLINDYHAVAIGLTTFEELKEMYSIAEKVNNTLKEFFDEQGINLVDFKIEIGRFNGELLLADEISPDTCRLWDKSTGEKLDKDRFRRDMGNVKEAYMEILKRVNK >NC_009495|3056732:3066201|3060246_3061695_-|WP_012047942.1|DBSCAN-SWA MSMCYMLDDLNENMPFDLEGDKFKEECGVFGVFSKDNESKSAEITYYGLYALQHRGQESAGIVVSDGEKFKYHKGMGLVSDVFSKETIEGLIGNSAIGHVRYSTTGASKSDNAQPIVGTYKLGSIAIAHNGNLVNAAVIRELLEDGGCIFQTSIDTEVLLNLIARSAKKGIDKAVVDAIQAIKGSYAIVILTEDKLIGARDPHGIRPMCLGKIGDDYLLSSESCAFDCVGGEFIRDIEPGEIVIIDESGINSIKFTEKTRCHTCAFEYIYFARPDSTMDGINVYESRIRAGRKLYEEYPVEADIVIGVPDSGIPAAVGYAEASGIPYGIGFIKNKYVGRTFIAPSQELREKAVSVKLNPLKINVEGKRVVIIDDSIVRGTTSKRLVQILRKAGAKEVHFRVSSPVVKYPCYFGIDTPYRKDLIGAHSEVEEIREKIGADSLAYISMEGLVETLNKDKGFCLGCFNGVYPISAPIEMPKDSLE >NC_009495|3056732:3066201|3059190_3060186_-|WP_012099415.1|DBSCAN-SWA MVSYKEAGVNIEEGYKSVDLIKKHASKTFTKGVLNNLGSFAGMFELPKYKNPVLVSGTDGVGTKLDIAFRMKKYNTVGIDCVAMCINDILCHGAKPLFFLDYIACGKLEAEVAAQLVEGVSNGCIQSECALIGGETAEMPGFYRDGEYDIAGFAVGIAEKDEIIDGSKIEDGDILIGIASSGPHSNGYSLIRKLVEDLHKDFEGNKIGNTLLTPTKIYVKPVMKLLEKYNIKGMAHVTGGGFYENIPRMFKEDFTAVINKKSYPLPNIFSHLISLGIEEDHMYNTFNMGIGFVLCVNEKDGENIIKDLIEMGEKGYKIGYVKKGDKSVELI >NC_009495|3056732:3066201|3058445_3059063_-|WP_012047940.1|DBSCAN-SWA MFKIAVLVSGGGSNLQSIIDKIEEGYIKNCKIEMVIGDRSNIYGIERAEKKGIKTLTLDRKIYKSNLSNKICECLYGNVDLIVLAGWLSILNGDLVNKFENKIINIHPSLIPSFCGDGMYGIKVHQKALEYGVKVSGCTVHFVDESTDSGPIIIQKSVPVFAEDTAEILQKRVLEKEHEALPEAIKLISEEKVKLQGRKVFIKTY >NC_009495|3056732:3066201|3062490_3062970_-|WP_003357851.1|DBSCAN-SWA MKVAIIFGSKSDTDKMKGAAKALKEFSIEYKAYILSAHRVPEKLMETIEDLEKEGYECIIAGAGLAAHLPGVIASHTVLPVIGVPIEAAVGGMDSLLSIVQMPKSIPVATVGINNSYNAGMLAVQILSLKYEKLKEKLIEYRKDMKEKFINDNKEGVEL >NC_009495|3056732:3066201|3056732_3058232_-|WP_003385254.1|DBSCAN-SWA MIKRALISVFDKTGILDLAKFLESRDVEIISTGGTYKHLKENGVKVIDIEEVTGFPEMLDGRVKTLNPLIHGGILAIRDNEEHMKVIEEKGINPIDMVVVNLYPFFNKVEENLSFDEKVEFIDIGGPTMIRAAAKNFKDVVVLTDTKDYENVINEIKENNQVNIQTRKKLAGKVFNLMSAYDAAISNFLLEEEYPEYLTLSYKKNMDLRYGENPHQTAAYYTSTVGKYPMKNFEKLNGKELSYNNIKDMDIAWKTVCEFEEVACCALKHNTPCGVAIGDTVQEAYTKAYECDPISIFGGIVAFNRKVDKETAENLAKIFLEIVVAPDFDEDALEVLKNKKNLRVIKCEEKSTEGKDMAKVDGGILVQKSDNKLLEDTKVVTEKSPTEQEMKDLIFGMKVVKYVKSNAIVVVKDGMAKGIGGGQVNRIWAAKEALDRAGDGVVLASDAFFPFGDVAEEAAKWGIKAIIQPGGSIRDEESIKVCNEKGISMVFTGIRHFKH |
7 | Synechococcus_phage(42.86%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_7 |
3214760 : 3236668
Sequences of DBSCAN-SWA_7
Nucleotide sequences of DBSCAN-SWA_7 >NC_009495|3214760:3236668|DBSCAN-SWA GCTAATAATTAATTTTAATATTTCCACTAAATTTACATTCTACTTGCAATAATGTGTTACTAGCATAAATTACTTCATATAAGTCTTCTTTAACCTGTTTCCATCTTCCAACACCATCATATTGCAAATCTAGTTTATCTATCTCTTCAATATCTGTTATGCTGTCCATGCTAAACAAATAAGCAAATCTTATCTTTTTAGTAGTAATTAATTCATTCCAGAATACATCATTAATAGCATTAAAAGTAGCAATATTCATCCCACTTTTCCTTACGTCATCTACAGTTAAATTAACATTTACCCATTTTTCTCCACTAAATGTTTTCCATGTGTTACCGCTATCCACACTACAAACTATTCTTATATTGTTACCATTAGCAGTTAATCTAAAATAATCTATATGATCTACATTACTTAAATTCATATCACCTTTTGGAATAAGTAAACGATCAAATGGGATAGCCTTTGTCTTTAATTTTTGAATAACTCCATCTTCAAATGTTTCAAAACCTTCTATTTTTTTAAATAGCGTTTTATCCACATTAACACTATATTCTGTAAAGCTTTCTGTATCTTGAACAACTTCAAAATCACTTATATGATTTGTTTCTAAATGTGCTTTACCATCAAAGGTCATCATTCTATCGTCAATAAAATCATTACTCTCATCATTAGTAAATTCGTTTTTAACTGATATTAAATCCTGTGTATTTTCTGTATCATACCTCAAAACATTCACACGAGGCACTTTAAAATCTACTGTGTTAACAGGGATGTTAACGATTCTAGGCGTTTCAGCACTTCCCACTATACCCATTTTGGATATTTGTTTCATCCCTGCGCCAACTATTTCTCCTGCATCTATACCATCAATAGTTGTAAACTTTCCTGTTTCCTCTGAATAAGCTACTAATTGTTTATTTTTCTTATTAGTAACATCTACATCCTCAAGCTCCTCAAATTTTGTAATTCTTTTATCTATTATTTCCTTTTGTATTTTCTCACTTGACCATCCAGTTTTATTAGAAATTACACTATCATCTAAAATTATATCCTTGTCCAAAGTTACATTAAAAAATTCACTCATTAAGCCACCTCCTATTCACTAATAACTAAGTGAAAGTCTCTAACTGCAAAATTATGATTTTCTGCATTTTTAGTTATTTTTACATATATACCTTTACTTTCACGCTGTTTTATACTATCTATAGTTAAAGAGTCTGCATAATTTATACCATCGAAGGATAATTGTATTAAATCATTACTAGGTGTTTCAGTTCCTATTTTAATATTGTTATAATCCTTATCTCCTATATTTTTAATTGTTATTAGCTCTTCTAAATCTTGGAGCATAGCAGGACTAACATTAGTTACTACATTTCCATGATATATAATTTCAAAATTATATGGACTAAATACCCACATATCACCATATTGTAACTGAAGAGCATCACTAGTATATATCACTTTTCCATCCCTATCTTTAAATGTAAAATATCCACTTATTTTGCTATCTATAAATACTTTACATTCCATATCTGAATTAAATAATCTAGTTTTAATTAAATTATTATCTAAATCATATAATTCACATAAAGTATTTTCTGGGAAATTCTGAATAGTTACATAGGGATTAGCGTAAACCTTGTAATTATTTAATATAAAATCTTCATCACTATACTTCATAAAACCTTGCTTTGTAAGTGGCTCTGCAAATTCCATTCCGCCCATGTTTGTATAATTTTTGCCATCATTACTTGAATAAGCTTGTATATAATTATCTTTCTTAAGTATTTTCCAATATCTATTTTGTTCATTTGATTTTAAATCCTTAATACCAAAAATATGATCGCTATTCCCTAAATAAAGCATGGAATAATCCATATCTTTTATATCATTGAAATTTTCTTTTTCAACCTCAATAACAAATTCTTTATAATTAAATTTTCTTTCTATTTTATTATTACTTATTAGTTTTAATTTACCTGTTTTAATATCTCTAGTTATATTGCTTTCTCCCGCAAAATCAGCAAAAGAAGAAGCCAAGAAAAAATTCTCAGCTTCTAATAATCCATTTTTAACTTGTATAAGTTTCATTGAGATCACCTCTAAACTCTAGGCTGCATTATATAATCATATGGTACAAACTCAACTATTTGTATATCTTTAGTTCCTATACCATTTGCTAATAATGTATGTGCTTCCTCTAGTGCATCTTCATAACAATTAGTAGCGTAAGATGTTATTTCACTTCCATTTTTATCTGTTTCATGGCCGTATGGTAATTGGGCTAAGGTTTTATTTTTTAATATTCCCCACATCTTTTGTCTAGTTTTTTTAAAATCTATTGTACTTGTTAACATACTATCTACCTCCCAAATATATTTTTCTTTTCAAAGTTCTGTGTTTCTATCATGTAATTTCTCTTACCTTTTAGTTTATCTAAATCTTTCATAATATCACCATTAGTTGCTACTTTATTAAATTTCCTTTCAATATCCATAGCTTTCGGATTATGCCAAATTGGTACTAAATTAAAATGATGTTGTTTTAGATAATCTATTAAATTAGCTATAAGTAATCCTATAGCTTGTAATCCATTTTCAGTATTAAGGAAGTATACCTTTTCAGCCTCCCACCTGATCCATCTATATGCTCTAATATAATCTGCATTTGGACTTGATGTATCTAACGTATACCAATCATAAATTAATTCCATTATAAATTGGATAGATTCTTTACCTGTGCAATTTAACCAAGCTTGCGTATTTTTATGCCATATCATTATTAAGATATTTATTAAATCTAACATTATTTCAATACTAATTGTCATAGGTGGAATGTTATAATCCACTCCCCAATCTTTCCCCCATTCAATAGGATGATTATTAAATCTTAGATATTCATAATCTAAATTATTTAATAGATCATTATTATATATATAATCTTTATTAGGAACAATTAGCCTATCCGTTGGATTTGTAGGTTTTAACCACCACCATCTTTTGGTCATTTCAATAAACTTATTTTTATTAGGTGTATATATTTGTCTTATAGCTCCATTATTTAAATATTTATTACTTTGTCTATAAATTTGCCATATACTTAAATTTAATAAATCTCTTTCTATCTGCTTATAGATATTAATTATAGGGCTATTATCTAAATATTTTTCGTTATGTTTAAATATATTAGTTGTATATTCCCTATCTAAATATCTATTATTATATTTAAATATAGATCTTATAGCTTGCCTATATAAATACCCATTGATACTTTTATCTATAAATTTAAATACATCTTTATAAAAATATTTTTTATTATGGTCTTTGCATATTTCTTTATGTGCTATTTTATTTAATGCATTTTTAATTCTATATTTTTCTATATCCTTTAGAGCTATATTATACATTAACATAGTTTTATAATTTCTATCTATATCTTTTAAATCTAATATTTTTAAATTATTTATACTTGTATCTATATCTATTCCAATTATAATATCTTTGTTTAACATTGTTTTATTACTTATTTTAGCCACTTCTTTTAAATTGGATCTATCTATAAATCTATATTTATTTTTATTTATATTTTTAAATCCATGTTTCTCAGCAAACTTCAATTTATCTATATCTATTTCCTTGCAATAGATTCTATAAAGATAATATCCAATATTCTTTTCTATATTTATATACTTCTCTAGTTTTAAATTTTGTAAAGATTCACCTTTAAATATTTCTTTTTCTACTATTAGATCTGTATATATACTTTTGAATTTATTCAGTTGTAGATTTTCTCTATCTATAGATAAATTTATTAAATTATTAGCTTTATTTAGTTGTAGAATTTCTCTTACCAATAACTTATTGTTATAACATATAGATATATCTGTATTTTTTCTTACATCAAGTTCCTTACTTGTTATTCTATTTATACTTATATATTTTATTTTATCTAAAGATATAGTATTGTTTTTATTTACTTCTTTATTTCTTAATTCTAACTCTTTTTCAAATTCTTTTTTTATATCAGTAATTTTCTTGGATATATATTTATTCTTTTCTTTCTCTATATTATCTTTAGGTTCTTTATAAAATAATTTATCTCCTTTAATTTTATCTATTTCACCCATTGTTTCTTTGTAAAATAATTTTTCTGTAGTCTTTACTACTTTTTCTGTAGTATCGTATATAAAAGTTCCACTAGAAAAAGCATTGTCCCCTACATATTCAAAACTACATAGGGGTATTTTATGTAGGGGCATTTATACCACCTCTCTTATTTAGTTGTTTTATAACATCTAATAGCAACACAATAATTTATATTAGCACTATTGTTTAAGAAACAATATGGCGCAGTAATTTTAAATTTCTTATAATATTCTTCCTCTTCTGTATCTTTCTTATATGCTAATCTATCTGTATCGTTTATTGCACTGGCATCACCTACAAGTACATTAATCATTTTACCTCTTTCCATATCAACTGGATGTACAAGTGTTATATCTGAGAATTGATGTTTTTTATGATTATATCTACTACCTTCTACATTACATTTATCCATAAAAGGATTAGTAGCATAAAAAGCTGGATAATGTGGTTGATATGGCATACCTATTTTATTAGCTATCATACAAACATCTGTTACTCCTGTTGCAGTTCTTTCTCCATAAACCTTTGAATAATTTGGTTCTATATCAGAAGATACAGTTATACCAAAATTATATTTATCATCTGTATAAGCTGAATCCTCTACTGGTTTTAAAGCTCCAATATAAGCATAAGATGTAAGATAGTTTTCATAAGGATGAACATCCGCAGATGGATCTCCACATAATACTAAGTTTATACTATCTTTAGTTACATTTATCCAATATTGAACGGGTAAAAAGTCTTTTATTTCTGGTTGTAATTTTCTATACCATGCTAATCTATAATTATATTCAGCTTGTATATTTTTAGATATACCTAGATCTGTTTTATCTGCGTTTAATTTATCTGATATTTGCAATTTTATATTGTTTATAGAATTGCTTTTAGTCATAGCACTGACATAAACATCATAATCACCACTTTTACTCCATCTATCAGAAACTCCAGCCATCATTTCTAATACTTGTGCATCTGTTCTACTAAAACTATCCCCATTGCCGTTATAATAAGTATGCAACTTATTAAAGTCAATTAATGCCTTTTTTTCTTCTTTTGTTAAGTCCGCTTCTTCTCTATCTATTTTTACATAAAACTCTTTTCCATAGGTTGTTGTTGCTTTTATAATACACTTATCATTTTGAGAACCTACTGTAAATACAGTATCTACTTTATCTGTCTTAGAGTTATCTTTTATAAGATTTATTGTACTTCCTTCTCCTGCTGACCCTATTTTATTTATGCTATCTGGATAAACTAAATCCCATTTATATATACCTGAATTTTGTGTTATTTCAGCTGCTAATGTTTTTACTAAGTTTTTTACACTTGTATTTCCTTCAACAAAATAAAAATTATCTGTAGCCATTTTATCTACCTCCTGTTATCAATTATTTATTTAAATTTGTTATTTTTAAAGTATTTAAGTCCATTATAAATATATCTTTTAAATCTCTATTTGTATCTAAATTCACATTAAATTTTTTAAGTAGTTTATTACCATAAGGTCTATATTGATATATTTCCAAAGTTACAGGTTCTTTTAGTTCTACTCCATTAAAATTCTTTATACTTATAAGAAGCTTTTTATTTTTGTACCCTTTAACACTTATTATTTCAGGATTTTTGTTTGTTTTATGACTTGTATAATCAAAATTAAGATAAAATCCATCATAGGATTTATTCCCATACCAAACTTTTTTATCATCTATCTTGCCATGTAAATCTATATCTGCATCTGTATTTTCTTCCCAATTCATTACTACTGCTATATCCCATTCATTATCTATATCCTCTATGCCTGGTGGTGGCTCTACTGTAATACTAGAATCTTCTCCATCTATATACTCTAAATCCACAATTATCTGTCTACTATTGCCGCTTAAATTATGAAAAACAAAAGAAATAGGCGTATTAGCATTTACTTTATAGAATGTATTAAAGTATTTATGCTCTCCTATTTCCTTAGTTGTTACATTATCTATTATTTTAATTTTATTAATTTCTAAGCTATATTTATCTTCCTTTTTCCAGCCTGTTTGATTAAAATGCAATCCTGTAATATATACATCTTTATCAAATTTAAATTGTTCTTTGTAATCATTTTGTATTGCTGGGATATCTAATAATATACCTTTCACCTTTTGAATGCCTTCAATTTTTCTGTATATAAAGGCATCAATTTTTTTCTTTAATCCTTCATATTGTACACTTGGCAATAAATTCTTTAATTGTTGTAGTAAATCTTGTATATTGTTGGTATTTATCTCTGGATAATTAGTTCTTATATTATCATCTATCAGACTTAATAAATGATTTTTTAAATCCTCTGTAAGCTCTTCAAAATTAATTATATACTTAGGTAGGCTCAAATTAAGCACCTTCTTTATATTCAAAGATTGAACTTGTATCATTTCTTGGATAAACTTGAGCTGTTTGTGTTATCTTTAAATAAGGATTTTTAATATTAAATTCATCATAAAAATGTAATACACTTTGATATAATTCTTCCAAAGTTACAATTCTATTTTTATCTTTATCAGATTTTTTAGTTTTAATGCTTTGTGTTAATGCCCATGTAAAAGCTCCTGAAGGATTAGGATTTCCATTATATCCAGCGCTCAAGTCACCGGATGTTTCTGACCCTGCACTAGCTGTTAAAACCTTATATCCTTGTTTATTTAATGTTTTGTCTATACTTCTAAGTTTCTCCTCCACTACAGCTAATGTATATGCAAAATTTTTATCTATAGCAAGTCCACTGTGGCAAGTATCAATAAATATTACCTTAGTGCCTTTTATATCATCCAGTATTGTTTGTAATTCATATACTGTTATTATGTTATCTTTTGCTACTAAAGCAAACTTATCTTCATATACAGTACCATGTCCAGACCAAAACAAATAACTAATATCATTATCTTGTGCATCTTGAAAAGTGTTTTTTATTAAATTTAATGCTTCTGATTTAGTTTTATTTTTTGCAACTATATTTTTTGTAAATTTAGCACTTTCTTTATGCTCTTTAAATAAATTAGATATATTGTCAGCATCATATGTGCAACCCATAAGGTTATTAGCGCCTTGTAAAGTATATTCACTTTCTCCTATAGCTAAAAATCTATAGTTTTTTTCACTAGTGGTAGGTATAGTAGGTGTAGTAGGTGTAGGTAAATTACTATTTTCTAATATATTAAAATCTACCCATAAAACTTTACTAGTTCCACTAATATTATTGTAAATAAATTTGACTGTACCATTTATAGGATAAAATACATTTAAAAATTTATGTTCACCATATTCTTTAGTGCGTACACTTTCAAATAATTTATCATTACCTACTTGTAAATCCCAGCTATCTTCAAATCTCCAACTAGATTGAGAATATGTTATACCTGTTATTTGTCCATTTCCCTTAAATTCTATTATATGCTGTCCTTTTACTGCAGGAATCTCTAGCATTTTCCCATAAATTTTCTGTGTGCCTGATATACCTAAATTTCCACTTAAATTATCTAACTTTACACCTAAAGCATTTAACGCATTTATTAAATCATTATAATCTACACCTTGTATTTTATCTTTAATTTCTGATAATAAATTTTCCATATCTTTGGTAGAAAAATTTATATTGCCTATGTCAACTTTCACACCATTTTGTAAATAATCTTTAATAAGATCTGATAGTTCATCAAAGTTGACTACATAGGAAGGTAATCCCATATTATTGCCACCTCCTATACATAATCTATTGTTTCTAATTTACCATGATTATCTTTAATTAATTGTATTGTTTTATTTGTATTATTAGGGTACGTTGTTTTAATTCTATATACCTTACCTTCTGCATTTCTAATTAGTTCTTCTTGCCATTGCATATCTGTTCCACTAGCATATATAAATTTATATGCCTTATTATTACTATCTCTAATTATTCTACATGGATATTCGGGTAATTCCCCAGCATATTTTGAATCTTCATTTGTATTTATTTGATTTTTGAAATTTCTTTTTCTTAATTCTTGATTTAAAATATATACTACTGGCTCCCTAAAATTTTTATATCCCATATGTGCCATTTTAATCACCTACTATTGTTTCAATCTTCCACTGCCTATTTGGATACATTGGTCATACACTTTTGTTTTATCTCGCATACCTTGTAATTGCAATGTATCTACATATGTGTCAGCATTTATTTCTGTACTTATTCCTACAATTAAATACCAGCCATTACCTCTTTGATTATTTACTAATTTAACTACTTGTCCTAAATCAATATTAGGTATTCCAGTTACTGGTACTACATTTAAAGCAGTACTCTCCCTCCACATATCTAAAAATTTATATCCTGCTACCTTTTGTTTTAATAATGGAGTACTAGCTAATGGATTATCAATTATATCTACCCATCTTTCACCATTTAAATAACTAGTCATAGCTTTGGATTCAAAAATAGAATATTTATCATTACAACAAATCTTTAATATATTTCTCATTAAACTAGAATCTCTACTGGCAGTTTCACTAGATAAATTAGTATCAACAGATAAAACATAATCATGGTGATTTGCTTCATGATTTGATTCATTATAAGCAGGATATTGCTCTTCTAATATTATTGTACCGTTTTTGTTTGCCCTTATTCTGGCATACATAGTTTCTACCAAATTACTAATTATATCATTATACATAGTACCTATTTCACATTCTAATTTAGGCACAGTATAATTATTTCCTCCACCTCTTTGAAAACTACATTTTGCATCGGATACAACAGTAGAAATTATATCTGCTGCGGTTTTATTATAAAATTTTAATTCCTTATCACATAAATTTAACATTCTATAATACATATCATGACAAGTAATTTCTATTGTTTTATCAAGTGTATTATAATCGTATTTTTTAATTACACCTGTAAATTGAAGTACATCCTCTATATAAATTTTTATCTGTGCAAAATTATCTATTACACCTTGCGTTCCTCCTGCAAAAATAGCTGTGGGTAGATTCTCATATTGTGCTGTAACAGTAGCTTCAGCAGTAGGTGTAGTTAAAGTTCTATTTATTTTAACTGACACTAAACAATGTTCTAAGGTTATTTTATTAGCATCACCATTTTCAAAGGCTTGATAGCCATTTTTTTTATAAAATTCTACTTTACATTTTGCCATTATCTTTCACCCATCCACTAGCTTCATGATTACATAAAAGCTCTAAATTTATATAATATATATCACCTTCGATAGGAGTATCTATCTCAAACTTATTTTGTAAATATCCTTTATATTGAATTCCAAATTCATCTACAAATATGAATCTACCTGAATAACTTTTTCTAAAGTCTAAAAACTTAGTTATATTACTTTGTGTTTCCTCATCATTTTCTCCTTTTATATTAAAAGCAACTGTAAACTCAATAATACAGTCACTTTTAACACTTTTTTCAAAATATGTGTATCCTTGTACTGTTCTAATACCCTTACGAAAATAAGCAGGACGAGGTGGCTTATAATTAGTTATTACGCCACCTGTATTTTTTCTATCTTCATAAAGCAAATCTACTTTAAAATCTTTTATTCTATTTAAGTCCATATAAGCCACCCCCTAATCTCTCAATACATCATTCATAAATAATCCTGTCATAACATTTTTCATAGAACTTTCTGTCATTTGTTTAAATTCATTAGCTATCTTATTAGCCCCTTCTTTATCTGCATTTGGTATAGTTACATACATTTTTATATCCTGTGTAAGTCCCATACTTTTATTCATGTTATTAGGTCCATATGGAGATGCATAAGTACCACCATATGCTCCACTAAGTGACATATTATTTAATCCATTAAAATTTGGTCTTACATTTCCTAATCCTTTAATTTTATTAGCTATACCTTTAAATTTATTATTTATGGCGCTTTCTTGATTATCTATACCTTGTATAAGACCTTCTCCAATAAAATTACCATAATCAGCAAATACACGTGATGGAGAGTTTATTCCTAACATTTTCTTAAATCTACTAGATATTTCACTAGCTAGATTTCCTATTACCTGTCCTACTCTTCCAAACATAGCTCTTATACCATTTATAAGACCTTCAACTATATTTCTGCCTATGTTGAAAAGTGCTCCTGCTAAATTACCTAATCCTCGAAATATATTAATCCAACCTTGTACAATTCCATGTAATATAGTTCCAACACCTCGAAATATTGCTATACATCCGTTTATTATGTTGTGTACCATTCCACCTACCCATTGAAGGATTCTAATAAATCCTTGAAATGCATGAATAGCCCCCTGTATAATTGAATTTATAACTCTACCTATTCCTTTAAATATATTTGCTATGAAATTTCCAAACCGGGTAGCATATTTTTTCAAAGTATCCCAATGTTTAATCACTTCATATACTATAAGTCCTATTGCTGCAATAGCAACTAAAATTAGAAGTGTTTTTGAAGTTATTATGGTCTTTAATAATCCAAATATCCCTCCAGCTTTCTTTAATTTACCAAATATACCTATCACATTATTTATAGTACCTACTAATTTGCTAAGTACCGTAAATGTTTTAGCAACTCCAGCTATTGACACAATTATTATTGCAATAGCGTTTTTCACAGGATTAGGCAATTTATTAAATGAATTCATTAATTCTACTGCTTTATTAGCTAGCTTTGTAAATATTGGGATTAATTTATTATTCAATATAGGTACTAATTGATTATTAAATATAGGTATCAACTGTTTTACTATAGATGTTTGTAATTGTGCAAAAGAATCTTGTACTTTTTTTATGGAAGCTTGTATATCTTTTTGAATTTTATCATAATTGCCCTTTGCAATATTAGCAGGACCCTTTTTGGGGTTCTTACTCTTTGTCTCTTCAGCAAGAGTATTTTTCATCCCAGTTTTAAGAAGATTTTGTGCCGCAGCACTAGGTTTTTCCATAGATTTTCCTATTTTGCTTAAAGTTCCTGCTTCTTTGGCTAATGCTTCTTGTAATTTTTCAATTCTAGTTTTTTCTTTCTCAACTTTATGCACAAATATTTCTAAGTCTTTTCCAGCTCCATTAAGTGCTTTTTTAAATTCACTAGTATCTAATGTTAAATGGGCAACTGCCTCTCCTACATTTACTGCCATGTTGTTTCTCACCTCCCACCTTTGGGAATAAAAAGTTTTCTAACTTCATTTAAATAATAATTTAAATTTAAAAATCTATTTTCTATTATTAGCATTTAACCATTGAATCACATCTTCATTATTAGCTTTATTTATTCTATCTCCATCTATAAACTTAGGCTCTCTAGCATCTTCTTTACTAATCTCATTTAATATATAAACGCAGGCCTCATCAAAACAAAAAGCCTCATAATCATTAGTCAACCCTATAATTTCACTGGGCCTTTGTCTATATTGTTTACTTATTGATATTACACTCAGTATTCTCTGACTCTTCACGAAAGGAGTCTAATTCACTTACACCTTCCTGTGTATAATTAAACAATGCTACTATTTGTTCATCTGTAAGCTCTAATCCTACACTTTTTAAATCTTCTATGGAAGGTTCTACAAGTGCATTTTCGGCCATAATATACATAACATCTGTCATTTGTGCTAAATCAACATTCTCTTTTGAACTCTGTTTACCATAAAATAGTTCCTCTGCTGCACTTAATAATTTGTTAGGCACTACTCCTTTTCTTACCAAATTTAAAAGAGATACTCTTTTAACTCTAGCATTAAAAGGTATCCCTTGGCTAAATTGTGGCAACTGAATTACTTCATCTTGAGCTGCTTTTTTTAAATCTTCTATATTAGTTACCTTTAAATCCATTTTATTATCCCCTCACTATCTAATCTTTATTGTTTTAAATTCTGTGGATAATGCTGTGGTTTTACCACTTCCATCTAATTTGTTTATTTCTTTAGCTTCAGCAATATAAACTGTATCTATTGCTAAAGAATCAGGTACAAATGTTACTATTTTCTTAGTATCATCTATAGTTACATTTCCATTTACTCTAGAATTATCAGATTTTCTCTTTATAATAAAGTTTTCTAGGTTAACATCATCTTGATTAATTTTATTTGAAAAACTCCACACTACCCTGTTAGTTATACTTACCCCTACATCTGGATTTTTATTTTCTACTTCTCCACCTTCTACTCCTATATCTTCAATTGGAGTAGATTCTCCTGGCTTTTCTCCATTATTATTCTCTTGTAATTTATTTAAAAATTCTATTTCTACAGGTTTCTCATTTCTAAATGGTATACTTTCAGCCTCATATGAAGACACTAAGAATTTTCCATCTTGAATTTTATATTTAGCTGGCTTACCTTTACAATGCTTATACACGAATTTAACATAGCCTGTGGTTCTAGAATAGTCTTTTTCTTCTGTGAATATTTCCATAGTGAATGGATGTCTTTCTACTGCTATACCTACTTCTGTTCCACAATATTTATTATCTTGTATAGTTCCTCCATCTATTAAAGCCATAGTTTCTATATTAAATAGATTGTCCTTCATTTTTAACTTGTAACCTATAACAATATCATCTGTTTCATTTATTCCATAAATTTTATTTTTAATCCTTAATATATCTCTTTTGCCCTTACTGTTTATAGGTTCTATATCTATTTCATTGCTTGTTTCTATTGTATGTTTTGTATTTGTTACCTCATCAATAAAATTAACTTTCACAACATTAACTAAAGTTTTTCCGCTTGTCATTAAATTACCTCCTTAAACTTTTAAATTGTTGATATTCTATGCTTGTAGTGTAAGCTTGTACATCGTAATCTATAACGCTTGGTGTTTCATTCCCTGTAGGCCTAAGATCTTCTATTTTTTTTAAAGCTTCTTTTATATTCTCTACATAAAATTCTATAGTGGAATATTGATCCATAGGGCTATAGACTATAATATCAAATAGTTTATAACCAGATATATTTCCAACTAAGGCATGTACACCATTTTCCTTTATAACTACATAGCTTTCTGTACATTTGTTTCTCTTTTGTCCAGGAGCATACACATTATATCCTAATTTTTTTAAATATAAATATACATTTTGCCATAAAGTTTCTGGTATAACATTATTAATTATATCTTGCTGTATGCAATCCCCTGGAACCTTGTAATTAAATTTAGACATTTACATCACTTCCCAAATAAATTACTCATCCCCTTAAGTATTTGTGGACTCAGTTTATCTATAGTTGGTTTTAATATTGCATATTTTTTATCATTACATAACTCTAAAGACGGATAGTAATCCTCATTTCCAGTAATATAAATATTACACCTATCGCCTTTCCACTGTTTTCCACCTTTAATTGTTTCAATATCCATATCTAATTGATCCTTCCAAGGTGCATTCTTTTTAGCATCTTCTTCTAGCTTCTTTGCGGCAATATCTGCATACCCACTTATAGCAGTTTTAGATTGCATCTCAAATTCAGATAATCCATCAATAACACTATCTATATTTACTTCAAATTCCCTCATATCATCACACCCTGTTTAATATCATATCAAATACTAGGTTTTGAATATTTCCTGTGTCAACTATTTCATACTTAGTTCCATCTAATATAAAATAATCATCCTTTTGTATTTTAGAGCTTATATCATTATAGATAATTAATAATTTATCATTATATAAATTATTAAATTCCAGTCCTTCCATAGAAGTTGTAATTATATTACTATTATTTCTATAATAATATCCCCTTATAGTGCATACATACACTTCATCTAGTTTTTCTTCAAAAGCATTTTTACCTATTCTTAATATTTTTATTTCTCTTAATAAGTCTTTTTTTTCTAGATGTTCATATATATTTTTACTTATTTTTGCCCTATTTATATTATTCATTAATGTTCATCAACTCTTTCCATAGAAGTTTGATTCTTTAGAATCTTTTGCTCTTCTTTGAAATGCTCTGCTAGAGTTAACCAATAGGCTCTATTACTTTGTAACTTTATATCTGCAACTTCTATTCCATCATCTGCAATTGCTTTTAGAATACACCCTTTATAACTTGCTTTTTCTACATCATTATTATTGATTTCTAGTAGCAATTCTAGCTCTTTATCCTCAAAATAAGGATACTGTTTTTCTTGTAAATTAAATTTCAAAATCTCTAAAGGTGTTCTCACTTTTTCTCACCTTCCTTAGTTAAATTTTATTTGTTTAAGGTTACTAATTTTTCTGCAAATATTTTCAATAATAGTTTAATCATTTATTTAGTCAGTCTATTACATAACCTCAAATCATCCTCATTATGATAAATTATTGAATATAGCTCACCTCCTATGCTTACTGTACAACCTTTAAGTTTTCTTGAAATGAATAAGCATTAGATTTTATAAAAGCCTTAATTTATAACTTTATTTATAAGAAGTTATAAGAATTAAAACTTATTTTGCAAATCTAATGCATTATTTACGAATAATAAAATTTTTAGTTCAAATTATTCAGTTTTTTAGCTTACTCTTAAAAGCTGTAAATTTTAATTTGATTTCATAATATTCATTTATTTTTTAATGAATACTTTACAGTTGTTTTATATAATAAAACCTCTGCTATTTTTATAATACTATTATATTTCATTTGAATACTTTATTTATCCCAACTTTGTCTCATTTTTGTCCCAAAATATTTTTATCAGATGACTACCCGCTCTAATACTCCCATCTTTTTCAAAGTGAGAGTAAAGAGCGGGTACGTCCCTGGATAACGATTTCCCCTAAAGGATAACGACTTCTAAGGAGTAAAACTCCTAAGAATTCTGTTAATAAGCTTTAGAGGGAGTAAAAACTCCCTCTGAAGCCAAGAACTCTGTTTATACTATAAGGTTATTCAATTGTGCTACATGTTCTACTAATTCATTCTTTTTTCTATAAGCTGTACTCCTTGCTCTTCCAAACATTTCTACGGCTATCCAATCTACACTTTTATTTTCTCCATACTTCAACTCTATAAATTTTTTATTTTCTTCATTTAGTGATGAAATATTATCTTCCATTACTGATATTTCTTCTTCTATTTCTCTTATTTTATATTCTACTTTCCCTTTCTTCTTAATTTTTTCTCCTAGTTCTATCTCTAATCTTTCTATTTGTCTTATTAGCTCTTTCTCTGCATAGCCTGTTCCATTGCTAGAGGTTTGTACTATTTCATCATATGTTCTACTTCTAGACTCTTCTTCTAATGTTACATCATTATTTTTAATTTTATCCATTATAATTTCTATTCTATTAGAAAGATGCTTGGCTCTATTTTTTAGCTTATTCAATTCTTTTTTACTTCTAAAATGCCTATATAATCTTTCTTCTGTTTTTATATATAATTTTTTATCCAACATATCTAACCTCCTATAATAATTCTTTAATATATTTTCTTATAACTATAATGTTACTTTTTGATATCTTTAAAGGCCTTTAGAAATGCCTTTTGGTTTGAATTTTATATACTTTTTTACATTTCTTTATTATTTTTATTTAACTCATATATCATTATTTCTTTTCCCACAATATCTAAAAATCTTTTATTGTAAAGTAATGCTTAACCACTTCGTCCGTCCATCTATTTTTTGCAACTCTTAAAAATTCTAATTCCTCTTGATATTTGTCTAATAAATTTATACTTTCCTTTAATAATTTCTCATAATCTATGCTTTTCTTTACATACTCCTTTAATAAAATCTTTAATACTACATTTTCTTTTCTAAATGACTCTATCTCTTCAAAATATTTATTTTCTATTTCTTTAACTAATACAATTGACATCTTATGCCTCCATCATACTTAATTTTCTATTATATTACTAAAGACAATCAATATTCTTATTTCAATAATTCTTTTAATATTTCTGTTTTCTCTTTAGCTTTTTCTTCCCTTATATTTTTACCATCATTTAAAATAGGAGTACACATTTCTAAAATTCTATAGTATGTCCTCTTTTCATATCTATTTTTAAGTTCTATAAGAGATAAATTTGTTGTAATTATAAGTGGTAATCCATTCCTATATCTACTATCTAAAATATTATAGATTTTAGTTCTAGTCCATTCTGTATCCTGTTCTGTTCCCAAATCATCTATTATCAATAGATCTGCATTATCTAATCCTCTCAATATATCTTCTTCTACTTCTTTTCCAGATTTTTTATATGTGTCTTTAATTCTATTTAATAAGCTATCTGCATTTACACATATAACTGGTAACATTTTCTCTATAAGAAAGTTTGCTATACATGCCACAGTATAGGTTTTACCATTTCCCGGAGAACCATATAATAAAAGTCCTACAGATTCTTTTTTCATGTTTTCAAATTTTTTAGTATATTTATTAGCTATTTTATACATTTTGTCATTACCTTTAGTAAAATCCCAATTTTTAAATTTACTATTTCTAAATTTTTCATCTATTAAACTATTTTTAATAATCTTTTTTAATCTTAATTGCTTTTCTTTATTTATTTTTTCTTTCTCTTTTGCCATTAGAGCTTCTCTTTTGCACTTGCACATTACAGGACCTTTTATATACCTATTTAACCCTGGAATATAAGTAATCTTTTCAATAGCTTCTCCACATACAGAACATATTTCAACTCTTTCATTTTCACCAGTAATATTATAATCCAATTCCCTGCTTTTTAAGGTCTTCTCCAAAGCTTGTCCTACTTGTTTCATATACCTCGCCTTCTCTCCATTTCTTACTTATCTCGTTTCTCTTTACATCTTGTGGTAATTTATATCCTTTATTTATCCAGCTTTCGAAGATTGACATTGTATATTTAAATCCTTTTATTTTGCCCTGTTCCTGTTCTCTTTTTTTTGTAATATCTAATGCATATATTAATAAATCAGTATAATCTTCTTTAGCCATGACTTTTAATACTTGATTTAAATAAGTGGCACTTATTTGCCTATAAAAGGTATTAAAATATGCTTCATTAATTTTATCTAAATTTTTTCTAATATCACTCTTTCTATCTTCTTTTATTTCTATATCTATATCTTCTATATCTATATCTCTGCCGTTACTTAACGTTTCATGTAACATTATATTTTTTTTATTGTCATTATTTTTGCAACTTTGTCTTTTAGTTTCTTCTAATAGTTCTTTTTTCTTAGCTCTATGTTTAGCTACCCTTTCCCTTGTTTGTTGTCTAACTTTCTCCATACCTTCTATATTTTGATGTTTGGACCAGTTAGCTATTTTTATTAATTTATCTTCTTGTATCTGTATCATGCCAAAATCTCTAAGTACTTTTAATGCAAACCTTAAACTATTTAATGGCCTATTAAAAATTGTACTTAACATTTCTTCTGTATATGGAACATTATCATTTAGAAAAATATATCCATTTGAATTTGTTTTACCTGCTTGAACTAAAAGTCTCATCCAAATATAATGAACAGTATCTCTTTCTGGCATAGCATCTATTAATTTTATTTTTTCGTCATCAAACATATTTGTTGTTATCTTTATCCACTTAACTTCTGCCAACATATCACCACTTTCTTTTTTATCCATAGTATACAAAATAAAATATTGCTATAATTAAATCAATCCATAATTTATATATAGTTTTTCTATACTTCTTTAATAATTATTGATTTACTATGTTTACCACCACCTCCATAGTTCTTGATCTATCAATTCATTAGGTGTAATTTTCAATATTTTGCATAGATTACAAATAACCTTTAGCCCTGGATTTTCATATTTACCTTCCTCTAATTCTGTAATATAACTTCTAGCTATTTTACTTTTGTAACTCAATTTTGAAATAGATAAGTTTCTTATTCTTCTATATTCTTTTGTTTTTATTACTGCCACTTGAGGATTCCTCCTTAGGATTTATTCCTCTCAATATTAAACTATAAATTTTTAAGTATTCCTAAAGTTGACCATTTCTTTTAAAAAAAAGTTCGTCTATGGTAGTATCAAAAAAATCTGATATAATCTTAGCCTCATTTAAAGTAAAAGACTTCTTACCATTTTCTTTAAAATTATAAGTATTTAGAGATACCCCTATTAGTCTTGCTATATCCTCTTGCTTTGCTCCTCTTAAGCATCTATAAGCTTTTAATTTTTTTGCTGTTGTCATAAAGCTCACCCCTTAATAACTATTTTTAAGTAAACTATAAGAATACTATTTATATTTTTATTATAGTCAACATTAAGAATACTTTCAACTGTATTTTATCATTTTTCTGAAAAAATATTCTTATAGTTTACATTAGTTTTAAAAAGTCAACATATGGTTTATAATATAGTATAAATAGAGGGGTGAAAAAGTTGGCAGAAATAAAAGATAGGTTAAAATGTGAAAGATTAAGAAAAGATTTAAATCAAACTGAATTGGCAAAATTTTTAAATGTATCAAAACAAACAGTTTCCAATTGGGAAAATGGTAACAGAATTCCTGATACCCTTACCTTATCTAAGTTAGCTGACTTCTTTAATTGCTCCGTAGATTATATTTTAGGAAGATCTGAAAATAGAAATGGCATAATTTCTAAAGCTAATATAGATGGAAGTAATTACGAATTTGAATTAGATAAGAGTATATTTCCAAATGGCATAACTAGAGAACAAATGATAAATTATATTAAGGAACTAGAAGATAGAAATAAAGAATTAGAAAAAGAAGCTGAGATATCTAGAAAATTAAAAGAAGCTGGCTTCGATTTCAATCCCGATAAATAAAATATTCTAAAAATTAATTATTTAAAATTAAAATACAAATATGCAAAACTAACAAATATATATGTATTCATGATGTTATGTTTATAATTACATGAAATTCGTATATGTTTGTTAGTTTTTTATTTTGTCTAAAAAAGTAAATACTTGTCCTAAAATTCTGTATACAGACAATTACATTTTCAAAATAAATATGTAATAATTTTCACATAAAGTAATTTAATTATATAAACTTGCAAATTTTATTAAAAGATATTAAAATATACTTGAACACATGTTCGATTTCAGAAAGGAGTCTTAATTTATGTTTAATTTTAGTGGGGTATTAAGTATAAAAAAAGAAGGGGAAATAATATATGAAAAAAAGATACCTTTACACTGAATAGAAAAAAAACTTCTTGTGAAAAATCTTCTAAGGATAAAATACAATTAGTGCAGAAGGTTAATACATAATATAAAGAATATATAATAACTTCAAAATATAGTTGAAAGAAAAGTGTTAAGAAAGATGAGACTAAAGAACTACTTTAGAACAGTATATACACAACTTAATCGTTACAACTTATAAATTAAATAAGATAAAAAAACAAGTGCTGCTCCTTAGAAAATAAAATTACAACAACTTGATCTTTTTCATTTTAAAAATTTTTATAATTTTATAGTTAAATCATTGAATTCTAAAACTGTATTACAATATCATATAGTAATACATAAAATATTAAATAAAAATCATAGACTAAAATATATCTAACCTAATAGAATTATATAAAATAAAACTGGAACATTAAATATTAAAGAAGCTATTCAAACCTTAACACTTTTTAATAACTTTAGAGTATAAATGCTAATTTAGAAAATGCTTTGCTATTAAGCACTAAGGAAATTCTAAAGCCAGAATATTTAAAGAATTAATGAATGTTATTTACTTTTAATTCTTCTACTAACTTTCTAATGATATTTTAAAATAAAAAAGACTTTGGAAAACTAATCCAAAGCCCTCAAAGTTATATCTATAATGGTGCCGAAGGCGGGAGTCGAACCCGCACGAAGTTACCCTCGACGGATTTTGAATCCGTTGCGTCTGCCAATTCCACCACTCCGGCAAGAAAGATTTAACGTTATAATAATAACATATTAATAGTCTTTAGTCAACCAACATTTTTATTTTCTATATTATATAGAAAGGCTGGTAATCCCACAAAACATCAATTCTTAAGATAATTATGCTTCCTCTCTAAAAAATCAAATAATTTATCCCTCCCAAATAAAATTTATAGTTTTATATTAAACATTAATAGATTATTATAAAAATTTATAAAAAGTTAACCATATCTTATCAGGCTATTCATTGAGTCTTTACATATAAGGCTTATAATAATTCTTGTAAATTTTTGTCGAAAAATATGAAAATATTAGTAAACTAAAAATTAAAAAAGGAGGAGAACGTCTATAAAAATTGTTTCTAAAAAGTTGATGTAATCTAGTATTTATCATATTGGGATTATGAATTAATTAAGAAGGAGTGTATGATAATTGTTATTTAACTCGATGCATTTTTTATTGTTTTTTCCAATCGTTACTTTTATATATTTTTTTATCCCCCATAAATTTCGTTATATCTGGTTACTTATAACTAGTTATTATTTTTATATGAGTTGGAATCCTAAATATGCATTATTAATTGGTATTTCAACAATAATTACATATTTAAGTGGTATATTAATAGAAAAATCAAATAAAATAACTGATAAACAAAAATCAAAATTTTTTAAAAAACTTTGGGTTTTCTTAAGTTTATTTATTAATTTAAGCATATTGTTTTTATTTAAATATTGTAATTTTTTCACATATACCCTTACAAAAATATTTTCCTTAATTAATATTACAATTAAAGTACCCTCCTTTGACTTTATATTACCTGTAGGAATCTCTTTCTACACATTCCAGGCTCTTAGCTATACTATAGATGTCTACAGAGGTAATATTAAATTTGAAAAAAATCTAGGCAAATATGCTTTGTTTGTGTCATTTTTTCCTCAATTAGTGGCTGGACCTATAGAAAAATCAAAAGATTTATTGAATCAATTTAATGAAAAACATATATTTGATTATAATAGAGTAAAAAATGGTTTAGTACTAATGCTATGGGGATTTTTCCAAAAGGTATTCATTTCTGATAGATTAGCCATTCTAGTAGATACTGTATTTAATAACCCTAGTAATTATAAAGGTTTAGAAATTATTGTTGCATCTGTTTTTTTTGCCATTCAAATCTATTGCGACTTTTCTTCTTATTCAAATATAGCTAGAGGAGCTGCTGAAGTTATGGGATTTGATTTATCACTAAACTTTAAACAACCTTATTTTTCAAAATCAATACAAGAATTTTGGAGACGTTGGCATATTACTCTCGGAGCTTGGTTTAAGGATTACTTATATATACCTTTAGGTGGAAATAAGTGCAGCAAATGGAGAAGATATTTTAATAATATGGTTGTATTCTTAATAAGTGGATTATGGCATGGAGCAGCTATAAATTTTATAATCTGGGGTGGCCTACATGGATTTTACATAATAATAGGAGATATGCTAAAGCCACTTAAAGAAAAAATAATAAATAATTTAAAGATAAAAACTAATGTATTTAGCTTTAAATTATTCCAAACATTGTTTACTTTCATATTAGTTGATTTTTCATGGATATTTTTTAGAGCAAATTCATTTTCTGAAGCTAAACTATTAATTAAAAATATGTTTTATTTTAATCCATGGATATTTACCTCTGGTTCCATCTATAAATTAGGATTAGATCAAAAAGATTTTAAAATGTCAATACTAGGTATATTAATAGTTTTTATTATAGATAATATTGCGAGAAATAAAGATGTACGTGTTGAACTCTCTAATCAAAATATAGTATTTAGATGGGCTATTTATTTATCTGCTATTTGCTTTATATTAATATTGGGTATATATGGAGCAGGGTATGATGCCAATCAATTTATTTATTTTCAGTTTTAA
Protein sequences of DBSCAN-SWA_7 >NC_009495|3214760:3236668|3228437_3228803_-|WP_012048059.1|DBSCAN-SWA MNNINRAKISKNIYEHLEKKDLLREIKILRIGKNAFEEKLDEVYVCTIRGYYYRNNSNIITTSMEGLEFNNLYNDKLLIIYNDISSKIQKDDYFILDGTKYEIVDTGNIQNLVFDMILNRV >NC_009495|3214760:3236668|3227660_3228080_-|WP_012048057.1|DBSCAN-SWA MSKFNYKVPGDCIQQDIINNVIPETLWQNVYLYLKKLGYNVYAPGQKRNKCTESYVVIKENGVHALVGNISGYKLFDIIVYSPMDQYSTIEFYVENIKEALKKIEDLRPTGNETPSVIDYDVQAYTTSIEYQQFKSLRR >NC_009495|3214760:3236668|3224070_3224505_-|WP_012099497.1|DBSCAN-SWA MDLNRIKDFKVDLLYEDRKNTGGVITNYKPPRPAYFRKGIRTVQGYTYFEKSVKSDCIIEFTVAFNIKGENDEETQSNITKFLDFRKSYSGRFIFVDEFGIQYKGYLQNKFEIDTPIEGDIYYINLELLCNHEASGWVKDNGKM >NC_009495|3214760:3236668|3214760_3215846_-|WP_012048045.1|DBSCAN-SWA MSEFFNVTLDKDIILDDSVISNKTGWSSEKIQKEIIDKRITKFEELEDVDVTNKKNKQLVAYSEETGKFTTIDGIDAGEIVGAGMKQISKMGIVGSAETPRIVNIPVNTVDFKVPRVNVLRYDTENTQDLISVKNEFTNDESNDFIDDRMMTFDGKAHLETNHISDFEVVQDTESFTEYSVNVDKTLFKKIEGFETFEDGVIQKLKTKAIPFDRLLIPKGDMNLSNVDHIDYFRLTANGNNIRIVCSVDSGNTWKTFSGEKWVNVNLTVDDVRKSGMNIATFNAINDVFWNELITTKKIRFAYLFSMDSITDIEEIDKLDLQYDGVGRWKQVKEDLYEVIYASNTLLQVECKFSGNIKINY >NC_009495|3214760:3236668|3230775_3231576_-|WP_012099498.1|DBSCAN-SWA MDYNITGENERVEICSVCGEAIEKITYIPGLNRYIKGPVMCKCKREALMAKEKEKINKEKQLRLKKIIKNSLIDEKFRNSKFKNWDFTKGNDKMYKIANKYTKKFENMKKESVGLLLYGSPGNGKTYTVACIANFLIEKMLPVICVNADSLLNRIKDTYKKSGKEVEEDILRGLDNADLLIIDDLGTEQDTEWTRTKIYNILDSRYRNGLPLIITTNLSLIELKNRYEKRTYYRILEMCTPILNDGKNIREEKAKEKTEILKELLK >NC_009495|3214760:3236668|3229773_3230295_-|WP_012048061.1|DBSCAN-SWA MLDKKLYIKTEERLYRHFRSKKELNKLKNRAKHLSNRIEIIMDKIKNNDVTLEEESRSRTYDEIVQTSSNGTGYAEKELIRQIERLEIELGEKIKKKGKVEYKIREIEEEISVMEDNISSLNEENKKFIELKYGENKSVDWIAVEMFGRARSTAYRKKNELVEHVAQLNNLIV >NC_009495|3214760:3236668|3222644_3222986_-|WP_012048051.1|DBSCAN-SWA MAHMGYKNFREPVVYILNQELRKRNFKNQINTNEDSKYAGELPEYPCRIIRDSNNKAYKFIYASGTDMQWQEELIRNAEGKVYRIKTTYPNNTNKTIQLIKDNHGKLETIDYV >NC_009495|3214760:3236668|3228802_3229087_-|WP_012048060.1|DBSCAN-SWA MRTPLEILKFNLQEKQYPYFEDKELELLLEINNNDVEKASYKGCILKAIADDGIEVADIKLQSNRAYWLTLAEHFKEEQKILKNQTSMERVDEH >NC_009495|3214760:3236668|3226768_3227656_-|WP_012048056.1|DBSCAN-SWA MTSGKTLVNVVKVNFIDEVTNTKHTIETSNEIDIEPINSKGKRDILRIKNKIYGINETDDIVIGYKLKMKDNLFNIETMALIDGGTIQDNKYCGTEVGIAVERHPFTMEIFTEEKDYSRTTGYVKFVYKHCKGKPAKYKIQDGKFLVSSYEAESIPFRNEKPVEIEFLNKLQENNNGEKPGESTPIEDIGVEGGEVENKNPDVGVSITNRVVWSFSNKINQDDVNLENFIIKRKSDNSRVNGNVTIDDTKKIVTFVPDSLAIDTVYIAEAKEINKLDGSGKTTALSTEFKTIKIR >NC_009495|3214760:3236668|3233239_3233650_+|WP_012048067.1|DBSCAN-SWA MAEIKDRLKCERLRKDLNQTELAKFLNVSKQTVSNWENGNRIPDTLTLSKLADFFNCSVDYILGRSENRNGIISKANIDGSNYEFELDKSIFPNGITREQMINYIKELEDRNKELEKEAEISRKLKEAGFDFNPDK >NC_009495|3214760:3236668|3231565_3232471_-|WP_012099499.1|DBSCAN-SWA MDKKESGDMLAEVKWIKITTNMFDDEKIKLIDAMPERDTVHYIWMRLLVQAGKTNSNGYIFLNDNVPYTEEMLSTIFNRPLNSLRFALKVLRDFGMIQIQEDKLIKIANWSKHQNIEGMEKVRQQTRERVAKHRAKKKELLEETKRQSCKNNDNKKNIMLHETLSNGRDIDIEDIDIEIKEDRKSDIRKNLDKINEAYFNTFYRQISATYLNQVLKVMAKEDYTDLLIYALDITKKREQEQGKIKGFKYTMSIFESWINKGYKLPQDVKRNEISKKWREGEVYETSRTSFGEDLKKQGIGL >NC_009495|3214760:3236668|3226134_3226377_-|WP_012048054.1|DBSCAN-SWA MKSQRILSVISISKQYRQRPSEIIGLTNDYEAFCFDEACVYILNEISKEDAREPKFIDGDRINKANNEDVIQWLNANNRK >NC_009495|3214760:3236668|3219037_3220276_-|WP_012048048.1|DBSCAN-SWA MATDNFYFVEGNTSVKNLVKTLAAEITQNSGIYKWDLVYPDSINKIGSAGEGSTINLIKDNSKTDKVDTVFTVGSQNDKCIIKATTTYGKEFYVKIDREEADLTKEEKKALIDFNKLHTYYNGNGDSFSRTDAQVLEMMAGVSDRWSKSGDYDVYVSAMTKSNSINNIKLQISDKLNADKTDLGISKNIQAEYNYRLAWYRKLQPEIKDFLPVQYWINVTKDSINLVLCGDPSADVHPYENYLTSYAYIGALKPVEDSAYTDDKYNFGITVSSDIEPNYSKVYGERTATGVTDVCMIANKIGMPYQPHYPAFYATNPFMDKCNVEGSRYNHKKHQFSDITLVHPVDMERGKMINVLVGDASAINDTDRLAYKKDTEEEEYYKKFKITAPYCFLNNSANINYCVAIRCYKTTK >NC_009495|3214760:3236668|3217127_3219023_-|WP_012048047.1|DBSCAN-SWA MPLHKIPLCSFEYVGDNAFSSGTFIYDTTEKVVKTTEKLFYKETMGEIDKIKGDKLFYKEPKDNIEKEKNKYISKKITDIKKEFEKELELRNKEVNKNNTISLDKIKYISINRITSKELDVRKNTDISICYNNKLLVREILQLNKANNLINLSIDRENLQLNKFKSIYTDLIVEKEIFKGESLQNLKLEKYINIEKNIGYYLYRIYCKEIDIDKLKFAEKHGFKNINKNKYRFIDRSNLKEVAKISNKTMLNKDIIIGIDIDTSINNLKILDLKDIDRNYKTMLMYNIALKDIEKYRIKNALNKIAHKEICKDHNKKYFYKDVFKFIDKSINGYLYRQAIRSIFKYNNRYLDREYTTNIFKHNEKYLDNSPIINIYKQIERDLLNLSIWQIYRQSNKYLNNGAIRQIYTPNKNKFIEMTKRWWWLKPTNPTDRLIVPNKDYIYNNDLLNNLDYEYLRFNNHPIEWGKDWGVDYNIPPMTISIEIMLDLINILIMIWHKNTQAWLNCTGKESIQFIMELIYDWYTLDTSSPNADYIRAYRWIRWEAEKVYFLNTENGLQAIGLLIANLIDYLKQHHFNLVPIWHNPKAMDIERKFNKVATNGDIMKDLDKLKGKRNYMIETQNFEKKNIFGR >NC_009495|3214760:3236668|3235180_3236668_+|WP_012048068.1|DBSCAN-SWA MLFNSMHFLLFFPIVTFIYFFIPHKFRYIWLLITSYYFYMSWNPKYALLIGISTIITYLSGILIEKSNKITDKQKSKFFKKLWVFLSLFINLSILFLFKYCNFFTYTLTKIFSLINITIKVPSFDFILPVGISFYTFQALSYTIDVYRGNIKFEKNLGKYALFVSFFPQLVAGPIEKSKDLLNQFNEKHIFDYNRVKNGLVLMLWGFFQKVFISDRLAILVDTVFNNPSNYKGLEIIVASVFFAIQIYCDFSSYSNIARGAAEVMGFDLSLNFKQPYFSKSIQEFWRRWHITLGAWFKDYLYIPLGGNKCSKWRRYFNNMVVFLISGLWHGAAINFIIWGGLHGFYIIIGDMLKPLKEKIINNLKIKTNVFSFKLFQTLFTFILVDFSWIFFRANSFSEAKLLIKNMFYFNPWIFTSGSIYKLGLDQKDFKMSILGILIVFIIDNIARNKDVRVELSNQNIVFRWAIYLSAICFILILGIYGAGYDANQFIYFQF >NC_009495|3214760:3236668|3226336_3226753_-|WP_012048055.1|DBSCAN-SWA MDLKVTNIEDLKKAAQDEVIQLPQFSQGIPFNARVKRVSLLNLVRKGVVPNKLLSAAEELFYGKQSSKENVDLAQMTDVMYIMAENALVEPSIEDLKSVGLELTDEQIVALFNYTQEGVSELDSFREESENTECNINK >NC_009495|3214760:3236668|3222998_3224084_-|WP_003403529.1|DBSCAN-SWA MAKCKVEFYKKNGYQAFENGDANKITLEHCLVSVKINRTLTTPTAEATVTAQYENLPTAIFAGGTQGVIDNFAQIKIYIEDVLQFTGVIKKYDYNTLDKTIEITCHDMYYRMLNLCDKELKFYNKTAADIISTVVSDAKCSFQRGGGNNYTVPKLECEIGTMYNDIISNLVETMYARIRANKNGTIILEEQYPAYNESNHEANHHDYVLSVDTNLSSETASRDSSLMRNILKICCNDKYSIFESKAMTSYLNGERWVDIIDNPLASTPLLKQKVAGYKFLDMWRESTALNVVPVTGIPNIDLGQVVKLVNNQRGNGWYLIVGISTEINADTYVDTLQLQGMRDKTKVYDQCIQIGSGRLKQ >NC_009495|3214760:3236668|3220298_3221279_-|WP_012048049.1|DBSCAN-SWA MSLPKYIINFEELTEDLKNHLLSLIDDNIRTNYPEINTNNIQDLLQQLKNLLPSVQYEGLKKKIDAFIYRKIEGIQKVKGILLDIPAIQNDYKEQFKFDKDVYITGLHFNQTGWKKEDKYSLEINKIKIIDNVTTKEIGEHKYFNTFYKVNANTPISFVFHNLSGNSRQIIVDLEYIDGEDSSITVEPPPGIEDIDNEWDIAVVMNWEENTDADIDLHGKIDDKKVWYGNKSYDGFYLNFDYTSHKTNKNPEIISVKGYKNKKLLISIKNFNGVELKEPVTLEIYQYRPYGNKLLKKFNVNLDTNRDLKDIFIMDLNTLKITNLNK >NC_009495|3214760:3236668|3228085_3228433_-|WP_012048058.1|DBSCAN-SWA MREFEVNIDSVIDGLSEFEMQSKTAISGYADIAAKKLEEDAKKNAPWKDQLDMDIETIKGGKQWKGDRCNIYITGNEDYYPSLELCNDKKYAILKPTIDKLSPQILKGMSNLFGK >NC_009495|3214760:3236668|3216867_3217122_-|WP_003360052.1|DBSCAN-SWA MLTSTIDFKKTRQKMWGILKNKTLAQLPYGHETDKNGSEITSYATNCYEDALEEAHTLLANGIGTKDIQIVEFVPYDYIMQPRV >NC_009495|3214760:3236668|3224517_3226059_-|WP_012048053.1|DBSCAN-SWA MAVNVGEAVAHLTLDTSEFKKALNGAGKDLEIFVHKVEKEKTRIEKLQEALAKEAGTLSKIGKSMEKPSAAAQNLLKTGMKNTLAEETKSKNPKKGPANIAKGNYDKIQKDIQASIKKVQDSFAQLQTSIVKQLIPIFNNQLVPILNNKLIPIFTKLANKAVELMNSFNKLPNPVKNAIAIIIVSIAGVAKTFTVLSKLVGTINNVIGIFGKLKKAGGIFGLLKTIITSKTLLILVAIAAIGLIVYEVIKHWDTLKKYATRFGNFIANIFKGIGRVINSIIQGAIHAFQGFIRILQWVGGMVHNIINGCIAIFRGVGTILHGIVQGWINIFRGLGNLAGALFNIGRNIVEGLINGIRAMFGRVGQVIGNLASEISSRFKKMLGINSPSRVFADYGNFIGEGLIQGIDNQESAINNKFKGIANKIKGLGNVRPNFNGLNNMSLSGAYGGTYASPYGPNNMNKSMGLTQDIKMYVTIPNADKEGANKIANEFKQMTESSMKNVMTGLFMNDVLRD >NC_009495|3214760:3236668|3232564_3232777_-|WP_003384849.1|DBSCAN-SWA MAVIKTKEYRRIRNLSISKLSYKSKIARSYITELEEGKYENPGLKVICNLCKILKITPNELIDQELWRWW >NC_009495|3214760:3236668|3221280_3222630_-|WP_012048050.1|DBSCAN-SWA MGLPSYVVNFDELSDLIKDYLQNGVKVDIGNINFSTKDMENLLSEIKDKIQGVDYNDLINALNALGVKLDNLSGNLGISGTQKIYGKMLEIPAVKGQHIIEFKGNGQITGITYSQSSWRFEDSWDLQVGNDKLFESVRTKEYGEHKFLNVFYPINGTVKFIYNNISGTSKVLWVDFNILENSNLPTPTTPTIPTTSEKNYRFLAIGESEYTLQGANNLMGCTYDADNISNLFKEHKESAKFTKNIVAKNKTKSEALNLIKNTFQDAQDNDISYLFWSGHGTVYEDKFALVAKDNIITVYELQTILDDIKGTKVIFIDTCHSGLAIDKNFAYTLAVVEEKLRSIDKTLNKQGYKVLTASAGSETSGDLSAGYNGNPNPSGAFTWALTQSIKTKKSDKDKNRIVTLEELYQSVLHFYDEFNIKNPYLKITQTAQVYPRNDTSSIFEYKEGA >NC_009495|3214760:3236668|3232838_3233048_-|WP_012099500.1|DBSCAN-SWA MTTAKKLKAYRCLRGAKQEDIARLIGVSLNTYNFKENGKKSFTLNEAKIISDFFDTTIDELFFKRNGQL >NC_009495|3214760:3236668|3215857_3216856_-|WP_012048046.1|DBSCAN-SWA MKLIQVKNGLLEAENFFLASSFADFAGESNITRDIKTGKLKLISNNKIERKFNYKEFVIEVEKENFNDIKDMDYSMLYLGNSDHIFGIKDLKSNEQNRYWKILKKDNYIQAYSSNDGKNYTNMGGMEFAEPLTKQGFMKYSDEDFILNNYKVYANPYVTIQNFPENTLCELYDLDNNLIKTRLFNSDMECKVFIDSKISGYFTFKDRDGKVIYTSDALQLQYGDMWVFSPYNFEIIYHGNVVTNVSPAMLQDLEELITIKNIGDKDYNNIKIGTETPSNDLIQLSFDGINYADSLTIDSIKQRESKGIYVKITKNAENHNFAVRDFHLVISE |
25 | Clostridium_phage(85.71%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|