Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NC_017299 | Clostridium botulinum H04402 065, complete genome | 9 crisprs | DEDDh,csa3,WYL,cas14j,RT,cmr6gr7,cmr5gr11,cmr4gr7,csx1,cmr3gr5,cas10,cmr1gr7,cas6,casR,cas3 | 1 | 12 | 8 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_1 | 848632-848720 | Orphan |
III-B
Consensus repeat of NC_017299_1
|
1 spacers
spacers of NC_017299_1
>1.1|848655|43|NC_017299|CRISPRCasFinder TTTAAATTTTGAATTAAATTCTGCTGTAATTTTCATAATTTTT |
CRISPR arrays and Neighbor proteins around NC_017299_1
The CRISPR arrays of NC_017299_1 >merge|NC_017299|1|848632-848720|CRISPRCasFinder GTTGAACATTAACATGAGATGTATTTAAATTTTGAATTAAATTCTGCTGTAATTTTCATAATTTTTGTTGAACATTAACATAAGATGTA >NC_017299|1|1|848632-848720|CRISPRCasFinder GTTGAACATTAACATGAGATGTA TTTAAATTTTGAATTAAATTCTGCTGTAATTTTCATAATTTTT GTTGAACATTAACATAAGATGTA
>NC_017299.1|WP_014519939.1|847185_848343_+|restriction-endonuclease-subunit-S MLVKYKLWELGEILTGNTPSKKNGEFYDAKDIMFIKPDDINNNITEIECSKEYISNKAEKKARIIPKDSLLITCIGSIGKIAINKEKSAFNQQINSIVHNEKIISSKYLAYVIMINKQRLESISNAPVVPIINKTQFSEFEVYIHEKKEIQEKIANVLDKAQSLIDKRKAQIEALDELVKSRFIEMFGDLKSNSKNWDVSEFNEFATIDTNMTKDFRKYKDYPHIGIECIEKNTGRILEYKLVKNSDLKSGKYIFDNRHIIYSKIRPNLNKVALPSFAGVCSADSYPLLCNEKITTRSYLGYVLRSEFFLSYILAFSGRTNIPKVNKEQLRGFKMPTPPINLQNQFADFVKQVDKLKFEMEKSLKELEDNFNSLMQRAFKGELFN >NC_017299.1|WP_014519938.1|845634_847092_+|SAM-dependent-DNA-methyltransferase MITGELKSKIDRIWETFWTGGITNPLEVIEQFTYFLFIKDLDDNEILAESDAELLGIPFEGMFPSDKQYLRWSKFKNEEAGEMYRIVSQEVFPFIKDIHGDKQSAYSKYMSDAMFKIPTPLMLSKIVDAIDNLEIEDKDTKGDLYEHLLSNISAAGMNGQFRTPRHIIKMMVELMKPTPEDIIVDPAMGTAGFLVKLEEYLREKHSELFLVQGLKEHFNNKMFNGFDMDRTMLRIGAMNMMLHGVDNPNIEYKDSLSETNKDSEKYTLVLANPPFKGSLDYEAVSADLLKVSKTKKTELLFLALFLRILKTGGRCASIVPDGVLFGSTKGHKDIRREIADNNKLEAIISMPSGVFKPYAGVSTAIMIFTKTGTGGTDKVWFYDMKSDGYSLDDKRNPIEDNDIPDIIERFNNLDKEENRKRTEQSFFVPVEEIRENNYDLSINKYKEIEYEEVVYDEPKVILERVKKLEKEITEGIDELEKMIEG >NC_017299.1|WP_014519937.1|844610_845363_+|hypothetical-protein MFYCPYYFFRKNVGNNKVYIIDRKKGDVNGDKVEDTILLIGNKPSGTDSPFVSNIRLVIKDGKTGKSITVPLKENSGYNPTIFLGDFTGDKIKDILVSIDSGGSGGFGFYYIYSFANNQLKLIFDFEKFGEEYTYEVNYKDNYKVEVISENLKIKYIIDITYKGKEYLNEIYDLNGKLKEPISGFVIPLSNLYAIDFERDGTYELYVFQRIAGRYNADGLGYVQTALKWEKDKFTTFFQNVGIQGKYIGG >NC_017299.1|WP_014519936.1|843984_844449_+|transcription-elongation-factor-GreA MKNILTEENMNKLKEELEYRMTKKRAEIAKEKLEAAAHGDRSENAEYKEACANYRENDNRIQYLLTMISTASVIDEKNQDKSVLGVNSKCKIKFVEDEFETNVSLVTTMDAEPEKMLISVESDLGKALMGKKVGDVAEVDAPGEKYTVEVLEII >NC_017299.1|WP_041926536.1|840527_841499_+|ABC-transporter-substrate-binding-protein MKKLVTGILLTISILTLAACGKTTKKDKVLNIGINQIVEYVALDDNRKGFIKALEESGYKDGDNIKIDYKNAQGDIGVSQTIAKKFASDKKDLIFAVGTPAAQSVFNATKQTPIIISAVTDPIKAGLVNSLEEPGKNVSGTIDYLPVENQLKLLKNLVPKAKKIGFIYNTSEINSGVQLNELKKAAKGYEIIETGVTSTNEINNAIANLVNKIDVLYVPTDQLVVSSMPIIAKHTLDAKIPIIAAEKGSVEAGALATVGIDYYQLGYETGKMAVSVLKGEDISKMPIKMTSKTEIYVNKNSLEKLGIDKGNLGNLGNVKYVEK >NC_017299.1|WP_014519933.1|839741_840497_+|ATP-binding-cassette-domain-containing-protein MLEIQNLSKSFHNSYMGENKLFHNLNLTINEGDFVSIIGSNGTGKSTLLNILSGVVKETSGNIILKGVDITKLPEHKRTKIISRVFQNPELGTCPSMTVRENLSLALNKGKLTNIKYCLRYKDDYLQSLLNDISLDFKKMLDIEVKYLSGGQRQVLSLIMASVNNPKVLLLDEHTAALDPKTSGEVMAITEKIVTQKNITSLMVTHNLRDAINYGNRLIMLHKGKIILDLNEKEKRNLTVEDILKKFEYAV >NC_017299.1|WP_012704485.1|838885_839779_+|ABC-transporter MEVVSSILMQSLILSIMVMGVYISYKILDFPDMSADGSFTLGAAIVAVLLTKGVSPITASIVALIGGLVAGLLTGILNVKIKISNLLSGILVMGILYSFNLRIMGKANIPIFSEKNIFYDFNPLMIMLFIVILIKILIDLFLKTGLGYLLKGVGDNSQMIKSLGIEVGKIKILGLMLSNGLIAFSGGIMAQYQGFSDASMGIGTLILGIASIIIGTSIIKRKSFIKETSMVIMGTIIYQGTIYLAMTLGLTTVDLKMITSLIIIVFLALREIDNKYEEKSWRWIKNVRNSKFIKKLS >NC_017299.1|WP_014519932.1|837557_838544_+|MBL-fold-metallo-hydrolase MRETYENIYLEELPLPNNPLKYLNFYIIKGKDKSMIIDTGFNREDTKERMMEIFKELDLKPENTILFLTHLHSDHTGLATYFQDMGLTIYISKTDGDLLNGSVEKSDPMWSGTIQRAVWQGLEEEQLDIEDNPGFKFRPISHINFVPAIPGEYIEIGDYNFEIIDLKGHTPGMVGLYEKKHKILFCGDHILGKITPNITFWGFEYGDMLGTYFKSLDFVYNMDIDHLFSSHRFLIEDHRRRINELYLHHEKRLDEIRQVLRKFGACTVKQVTKELHWDIKSKNWDEFPKSQKWFAAGEAHAHLEHLRALGEVTMEEKNRILYYKMRLT >NC_017299.1|WP_014519931.1|835946_837290_+|hypothetical-protein MRNTIQRYDYSVENKFSEESFLKDVLVTCYKKKLLDENTLARIYYERMELLRVKLKYYTKDESSSVMTEVAESILKCIDYTIGIYLKNFENIELITEELKHTSLDDMLKMGQDLIKNKKLECKKLFKEIKANKLKVDNYSYNDTVDDGLSPFFKEYDDFFASHETPGCSIDYQLYIDTMNFIGIEYVYNYLYDLSLENEFCNKFDIGEINKLLKGYDKKCELLLINIFELVLINSLGLIICNKDLSSLNINNLDRKIIKNRLEKLSIDELNAELIKDAKICLEILEIKNTELMTYIKKGILNIALLINERIKLNKLETVFISFNEEECNEIVEYIDGIRMANSKFKKLTEEIRECSLVEDKILLIKNNIKSLEDLVDMLNADCLFGDEYIAFFKSLSKMEIVLLSKYISDLSFEYEKDLYVEFNKYILSLRKEEQREISELKEKINL >NC_017299.1|WP_014519930.1|835472_835940_+|hypothetical-protein MKNSIDLFESNLLDKKVFNDIIQCNEITREYGLKLSEKDVKEIIDTRNIELQKSGRIEFNGQIINKIVTAFCDSPYISQYNYSETINELVEIFYNYKNETLDYISDDELIEIMKENFDNYCQGSLEILEGKALYRIANNIKSGFKDYTNLDNEKD >NC_017299.1|WP_014519942.1|849939_853287_+|DEAD/DEAH-box-helicase-family-protein MCTNFEFLKFKKEFNAFSDACIEAEKSILVSPSTTAILSRRALELAVKWVYSFDEDLGIPYRDNISSLIHSGSFLELIDSEMLPLLKFVISLGNVAVHTNKGITREEAILSLHNLYQFINWIDYCYGDDYKEKKFDENSLLQGEEKRVRPEELKDLYDKLSSKDKKLEEIIKENEELRKEITQKRKDNTENYDFDIDEISEFDTRKIYIDVELKLAGWDFNKDIGEEIELFGMPNNAEKGYADYVLYGDNGKPLAVVEAKKTSKDPKIGREQAKLYADCLEKQYDVRPVIFYTNGLETYIWDDYNGYSERRIYGFFKKDELQLMIDRRTQKKTLRNINIKDEISNRYYQKEAITACCEELERRKRKLLLVMATGTGKTRTAISLVDVLTRHNWVKNILFLADRTALVKQAKKNFSNLLPDLSLCNLLDSKDNPEESRMIFSTYPTMMNAIDDTKAKDGKRLFTCGHFDLIIVDESHRSIYKKYKAIFDYFDAYLIGLTATPKDEVDKNTYGVFDMENGVPTYAYEFDKAVEDEFLVEYETIEVKSKIMEDGIKYDELSDEDKEEYEDKFDKDENIGEEIYSSAINQWLFNANTIDLVLNKLMEKGLRIEGNEKLGKTIIFAKSHKHAEAIKERFDILYSKLGSNYAKVIDNQINYVESVIDDFSDKDKLPQIAISVDMLDTGIDIPEILNLVFFKKIRSKTKFWQMIGRGTRLCEDLLGIGQDKDKFLIFDFCNNFEFFRMNPKGFKGNLGQTLSERIFNLKLDLVKELQDLRYSDEEYVSHRNELLKYLIEDVNNLNEDNFMVKMNLKYVQKYKNKNEWQSLGAISTQDIKEHISPLISKLKDDEFAKRFDILMYTIELVNLQGNNATRPIKSVIETAKSLSKLGTIPEIQEQKYIIDKVRETEFWEDVDLFELDEVRSALRELLKYLEKITQKTYYTHFEDMIINEESHGAMYNANDLKNYRKKVEYYLKEHENEIAIYKLKNNKQLTKQDLETLESIMWQELGTKADYEKEFGDMPVNKLVRKMVGLDRNIANELFSEFLNNENLNTKQIHFVKLIIDYVVKNGFIDDNKILKEDPFRAVGNLSALFKDNRNEAISIMGKVAKIKTNAEIII >NC_017299.1|WP_014519943.1|853378_853639_+|TfoX/Sxy-family-protein MGELSKLPNIGKEVERQLNKIGIFTYDELKDIGTEQAWLKIQEIDASACIHRLLALEGAIQGVKKTALPQERKADLKDFYNWHKCK >NC_017299.1|WP_014519944.1|853736_854192_+|GyrI-like-domain-containing-protein MDINIEMIPSYKIAYIRRTGPYGSENVQIMEKLKSWAREKNLFNENSIILGITQDNPQFTEAKDCRYDTCLVVSDEFKVDNKYINFGKTIGGKYCVFKISHTVDAMQKAWMEIFSELSKRNYEFNDRRPILERYAMQMINKHYCEICVPIL >NC_017299.1|WP_014519945.1|854788_855715_+|CBP-family-penicillin-hydrolyzing-class-A-beta-lactamase MKKIVNSKLKLNKFKMCIFISILIFSLTGCGNVENKTSENTKPEIQYNSAFSKIESDYGVKLGVYAFNTETNKEVTYNADKRFAYCSTFKSLISGAILQKYSSDQLKQVIKYSPKDVLSYAPVTKNHVDKGMTIEELCDAAVRFSDNTAANLLINLIGGPNGFKSALNQLGDTVTEPARIEPELNVATPGDNRDTSTPRQLSIDLKEYTTGNILSDDKKKILIDWMSGNATGDKLIRAGAPKDWMVSDKSGTGSYGTRNDIAIVIPPNKKPIFVAILSSKNAKDAKYDDKTISEASKIVFDYFINTRK >NC_017299.1|WP_014519946.1|855920_856295_+|BlaI/MecI/CopY-family-transcriptional-regulator MGDIPKISETEWKVMKIIWSNPYITANEVIDILDDYVEWKPKTVKTLLNRLLNKGAIHFEKEGREYKYYPLVSEDECIKEENKSFLDRVYNGAFKTMIANFIEEQNLTKEDIDDLKKLLEKNNK >NC_017299.1|WP_014519950.1|858868_859690_+|helix-turn-helix-transcriptional-regulator MEINLIDLVEHFAHTAFQVEGVYNYSIEPGSAGIMKTSPFPGFIFPLAGEANFIFDGTSYTAGLGNVIHGGANMRLSKKVIGKKKWNYILVLYSIRKPQPEGFSLEDSHFELVLGQSPRLVDLLQRLWRVSNQPGAIATFQKETIFRCVLDEIFICTRNQSSGDDRILFRQVSDYIHEYYMDTLTIRSLAELHGVNENRLFYVFSKYAGMGAGDYLMIHRLNRAKELLVTGNAPVVAVAKSVGYHDPYHFSKRFKKQFGISPSKFRDKFRYKG >NC_017299.1|WP_014519951.1|860240_861230_+|ABC-transporter-substrate-binding-protein MKKFMGLFVSLILIIGVLSGCSGSNNKDSQSKSDNTSAEQTKDNENSQWPRTIKDATGKEIKFDKKPERVVILHAAFLDYFFALETPPAASAGATVGNAMKALDEFETLKPYKGTANVMDLGSARDLNLEAVLKSKPDVIVTFKGHADKIYDKLAKIAPVVQIDFKDSWQNKTMQCAKIVGKEDLANKIINETEKEIKNTKKLLENHKDKTVALLRVDGKGNFVALGSKDTLYYNKEDGFNLSIPKGYPENSKVISLEGLSKMNPDYIIFRHFPEIVNSAVEKQKTSPVWQSLNAVKKDQILFFDDSLNSESPLALQISAKNLTKAISK >NC_017299.1|WP_014519952.1|861325_862366_+|iron-ABC-transporter-permease MKKPMEKVNININKKDHIRKMWFIVLGGLGLLVFIMMFSTTKGAENIPLASLWDALFHFNGKEMNHLVILNLRIPRVIASALVGAALAVSGAIMQGTTGNPLADSGLLGLNAGAAFALSICFAFFPGMKYIHIILFSFLGAALGAVLVNGIASMKRGGQTPIRLVLAGAAVSTLLVAMSQGIALYFNVAQSIMFWTVGGVAGSNWEQVRIMIPWIIGGLIGSVILSPYISILSLGQDVAKGLGINIRVVNVLSSIIVLILVGASVSVVGSVGFVGLIVPHIARFFVGMDYKLIIPSTAVMGALLVVLADLGARTLNPPFETPIGAIISLIGVPLFLNLARRQRSAI >NC_017299.1|WP_014519953.1|862365_863406_+|iron-ABC-transporter-permease MKEQQQIIEAYKRKVAIRNTLIVIGCVLLLGVSLIVSMDTGYIKMSPFDVLRTLFGKGTEKEKLILFDFRLPRIVISMLVGAGLALSGCIIQSVSKNPLADPGILGINAGASLMVILYVLIFSAESFLSVFTLPFLALIGAGITAVIVYIFSYKRDEGISTMRLVLTGVAVQAGISALTTLLVVKLDDTQYNFVVAWQAGSIWGSNWKFVMTLLPWLLILIPYILTKSSVMDILTLSDDIAYGLGASVEKERRKLLAAAVALAASCVAVSGSISFVGLIAPHLSRRLVGPRHRVLLSTSILIGAVLVSLADTIGRVIIQPSEIPTGIVVAIIGAPYFLYLLSNSKS >NC_017299.1|WP_014519954.1|863681_864467_+|ABC-transporter-ATP-binding-protein MNSITTTNLAIAYEDKLIVDGLNMNIPKGKITTIIGPNGCGKSTVLKTIGRILEPKEGLVYLNGDDIRKFSTKEVAQKMAILPQSPQAQGGLTVGELVSYGRFPHKKGFGKLSPEDKKVIQWALDITKLTELEVTMVDNLSGGQRQRVWIAMALAQQTDLILLDEPTTYLDMAYQLEVLELLYNLNREESCTIVMVLHDLNLAARFADYMIAIRSGNIVRCGTPKEIMTNKVLKDTFNIDAEIVWGSKTDRPTCISYELIK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_2 | 2310240-2310337 | TypeIII-C |
III-B
Consensus repeat of NC_017299_2
|
1 spacers
spacers of NC_017299_2
>2.1|2310271|35|NC_017299|CRISPRCasFinder GATGTTTCTTCATATAAACAACAGGTTAACTATCA |
cmr6gr7 |
CRISPR arrays and Neighbor proteins around NC_017299_2
The CRISPR arrays of NC_017299_2 >merge|NC_017299|2|2310240-2310337|CRISPRCasFinder CTTAAATACATCTCATGTTATTATTCAACTAGATGTTTCTTCATATAAACAACAGGTTAACTATCATTTAAATACATCTCATGCTAATGTTCAATTTT >NC_017299|2|2|2310240-2310337|CRISPRCasFinder CTTAAATACATCTCATGTTATTATTCAACTA GATGTTTCTTCATATAAACAACAGGTTAACTATCA TTTAAATACATCTCATGCTAATGTTCAATTTT
>NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP >NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >NC_017299.1|WP_003358211.1|2306073_2307438_-|PTS-ascorbate-transporter-subunit-IIC MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE >NC_017299.1|WP_014521022.1|2303768_2305862_-|transcription-antiterminator MLNKRCSNILQIIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFATINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKVLKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNSSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTPTEDHKPSLKELLKPDFIKLNEEAKDWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISNVKNIKASSEIDSILYS >NC_017299.1|WP_003358205.1|2303089_2303443_-|zinc-ribbon-domain-containing-protein MIIWGWGKVTKKIIGAVFERTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK >NC_017299.1|WP_014521021.1|2301535_2302303_-|ABC-transporter-ATP-binding-protein MQNILSVEKIEKYYGNKDNVTKAIDNISFKVDEGEFVGIMGPSGSGKTTLLNCISTIDNVTTGKIMINNNDITRLKSKLLDKFRQNELGFIFQDFNLLDTLTAYENIALALTIQGEKTSKIDGKVKSVAKYLEIEKVLEKYPYQMSGGQKQRVASARAIVTNPSLILADEPTGALDSKSARLLLERFEKLNKELKATILMVTHDAFAASYAHRILFIKDGKIFNELVRGNDTRKEFFNKIIEVTSLLGGDDNNVF >NC_017299.1|WP_014521019.1|2299554_2301546_-|ABC-transporter-permease MYSKIALKNIKKSYKDYTIYFLTLILAVCIFYSFNSIDSQKALTDIKSSGGSYVSRLMEFMSAISVFVSIILGSLILYANNFLIKKRKKELGMYMILGMGKRKISKILVTETSIVGVISLIAGLIIGIGVSQGLSVFALKLFEVSINEYRFAVSTRAIGKTILYFGIMFLLVMIFNVFVISKYKIIDLLTSGRKNENIKFKNTFIYLLSFLLCAALLGFAYKSILKIGLKLREPMFKPSIAFVIVGTVLFFFSLAGVILYVVNKNKKIYFKGLNMFVVKQINSKVNTNFLSMSLICLMLFITILILSTGISFKNGFEEGVKIRAPFDASIIISNNSKKNNLEDVLDKINFKRSKDEKYATFNEYFSGVKLESLLSITDKNYKDGEVSFVKISDYNKILKLKGKKEINLNKDEILVMSTNNAVVKQANEKLKNSKKFNIKGKEYLVKNDTIIEENLATYLLADNVFTIVISDEFLYDYNKIVYSILNVMYSDKNREQNNKKYSEINKNYLDGKYKSLNISYMGAFSKDDIYSGSKGGTTSILFVGIYLGLVFLITSMAVLALQQLSEASDSIERYKVLKRIGANSKMIEKTIFLQTLIYFALPMILALIHSVIGIKVISDYIEVFTKIDISFSALITALIFSVVYAGYFYTTYIGYKNIVESNI >NC_017299.1|WP_014521018.1|2297849_2298989_-|DOIS-domain-containing-protein MYMNLAQKINDDYYHPEVKLETNLLESSPIYLGCNIWRESLLEKMMDLNTDKFFLITDDVVYNLFGKELLEYMNRKVSVKLIKLPSGEKHKNIKVFNDLMEDLFDNNVTKSSILISLGGGVVGNITGLAAALAFRGIRFFHIPTTFMSQTDSILSRKQGINSFYGKNMIGSYYTPLFNFIDTSFLTFDSERFIRGSFVETVKNGFIYNADFLNKLKSVIKNDFNVNQEGIFNLVKMSIESKLPIMKADPTEKGLAMILEYGHTVGHAIEKLSYGKLSHGESVSIGMMVAARVSEKLGYLSKQDVKEHLDILSALKTPTKIPSNIKISDIINRIKLDNKKDMNGIRFVVLENIGKCINTDGSYMIKVPFNIINEAIEETC >NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP >NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ >NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI >NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN >NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK >NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_3 | 2310663-2310889 | TypeIII-C |
III-B
Consensus repeat of NC_017299_3
|
3 spacers
spacers of NC_017299_3
>3.1|2310692|36|NC_017299|PILER-CR GTAGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTA >3.2|2310757|37|NC_017299|PILER-CR TTATATAAGTGAATATAATTTAACAATTCAATGGTTA >3.3|2310823|36|NC_017299|PILER-CR CAACACGAGGTATGGGATGGAACTTATACATTAGAC >3.4|2310694|34|NC_017299|CRISPRCasFinder AGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTA >3.5|2310759|35|NC_017299|CRISPRCasFinder ATATAAGTGAATATAATTTAACAATTCAATGGTTA >3.6|2310825|34|NC_017299|CRISPRCasFinder ACACGAGGTATGGGATGGAACTTATACATTAGAC |
cmr6gr7 |
CRISPR arrays and Neighbor proteins around NC_017299_3
The CRISPR arrays of NC_017299_3 >merge|NC_017299|3|2310663-2310889|PILER-CR,CRISPRCasFinder TTTAAATACATCTCATGTTACTGTTCAACGTAGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTATTTAAATACATCTTATGTTACTGTTCAACTTATATAAGTGAATATAATTTAACAATTCAATGGTTATTTAAATACATCCTATGTTACTGTTCAACCAACACGAGGTATGGGATGGAACTTATACATTAGACTTTAAATACATCCTATGTTACTGTTCAACCA >NC_017299|3|1|2310663-2310887|PILER-CR TTTAAATACATCTCATGTTACTGTTCAAC GTAGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTA TTTAAATACATCTTATGTTACTGTTCAAC TTATATAAGTGAATATAATTTAACAATTCAATGGTTA TTTAAATACATCCTATGTTACTGTTCAAC CAACACGAGGTATGGGATGGAACTTATACATTAGAC TTTAAATACATCCTATGTTACTGTTCAAC >NC_017299|3|3|2310663-2310889|CRISPRCasFinder TTTAAATACATCTCATGTTACTGTTCAACGT AGGTGGAAAAGGTGCAAAAGGTGGAGTAAACTTA TTTAAATACATCTTATGTTACTGTTCAACTT ATATAAGTGAATATAATTTAACAATTCAATGGTTA TTTAAATACATCCTATGTTACTGTTCAACCA ACACGAGGTATGGGATGGAACTTATACATTAGAC TTTAAATACATCCTATGTTACTGTTCAACCA
>NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP >NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >NC_017299.1|WP_003358211.1|2306073_2307438_-|PTS-ascorbate-transporter-subunit-IIC MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE >NC_017299.1|WP_014521022.1|2303768_2305862_-|transcription-antiterminator MLNKRCSNILQIIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFATINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKVLKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNSSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTPTEDHKPSLKELLKPDFIKLNEEAKDWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISNVKNIKASSEIDSILYS >NC_017299.1|WP_003358205.1|2303089_2303443_-|zinc-ribbon-domain-containing-protein MIIWGWGKVTKKIIGAVFERTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK >NC_017299.1|WP_014521021.1|2301535_2302303_-|ABC-transporter-ATP-binding-protein MQNILSVEKIEKYYGNKDNVTKAIDNISFKVDEGEFVGIMGPSGSGKTTLLNCISTIDNVTTGKIMINNNDITRLKSKLLDKFRQNELGFIFQDFNLLDTLTAYENIALALTIQGEKTSKIDGKVKSVAKYLEIEKVLEKYPYQMSGGQKQRVASARAIVTNPSLILADEPTGALDSKSARLLLERFEKLNKELKATILMVTHDAFAASYAHRILFIKDGKIFNELVRGNDTRKEFFNKIIEVTSLLGGDDNNVF >NC_017299.1|WP_014521019.1|2299554_2301546_-|ABC-transporter-permease MYSKIALKNIKKSYKDYTIYFLTLILAVCIFYSFNSIDSQKALTDIKSSGGSYVSRLMEFMSAISVFVSIILGSLILYANNFLIKKRKKELGMYMILGMGKRKISKILVTETSIVGVISLIAGLIIGIGVSQGLSVFALKLFEVSINEYRFAVSTRAIGKTILYFGIMFLLVMIFNVFVISKYKIIDLLTSGRKNENIKFKNTFIYLLSFLLCAALLGFAYKSILKIGLKLREPMFKPSIAFVIVGTVLFFFSLAGVILYVVNKNKKIYFKGLNMFVVKQINSKVNTNFLSMSLICLMLFITILILSTGISFKNGFEEGVKIRAPFDASIIISNNSKKNNLEDVLDKINFKRSKDEKYATFNEYFSGVKLESLLSITDKNYKDGEVSFVKISDYNKILKLKGKKEINLNKDEILVMSTNNAVVKQANEKLKNSKKFNIKGKEYLVKNDTIIEENLATYLLADNVFTIVISDEFLYDYNKIVYSILNVMYSDKNREQNNKKYSEINKNYLDGKYKSLNISYMGAFSKDDIYSGSKGGTTSILFVGIYLGLVFLITSMAVLALQQLSEASDSIERYKVLKRIGANSKMIEKTIFLQTLIYFALPMILALIHSVIGIKVISDYIEVFTKIDISFSALITALIFSVVYAGYFYTTYIGYKNIVESNI >NC_017299.1|WP_014521018.1|2297849_2298989_-|DOIS-domain-containing-protein MYMNLAQKINDDYYHPEVKLETNLLESSPIYLGCNIWRESLLEKMMDLNTDKFFLITDDVVYNLFGKELLEYMNRKVSVKLIKLPSGEKHKNIKVFNDLMEDLFDNNVTKSSILISLGGGVVGNITGLAAALAFRGIRFFHIPTTFMSQTDSILSRKQGINSFYGKNMIGSYYTPLFNFIDTSFLTFDSERFIRGSFVETVKNGFIYNADFLNKLKSVIKNDFNVNQEGIFNLVKMSIESKLPIMKADPTEKGLAMILEYGHTVGHAIEKLSYGKLSHGESVSIGMMVAARVSEKLGYLSKQDVKEHLDILSALKTPTKIPSNIKISDIINRIKLDNKKDMNGIRFVVLENIGKCINTDGSYMIKVPFNIINEAIEETC >NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP >NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ >NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI >NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN >NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK >NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_4 | 2312860-2313087 | TypeIII |
III-B
Consensus repeat of NC_017299_4
|
3 spacers
spacers of NC_017299_4
>4.1|2312890|34|NC_017299|CRISPRCasFinder TTTATATGAAAGGAATAGATATAAGTATGCATAA >4.2|2312954|37|NC_017299|CRISPRCasFinder CTAGAACTGATTTTGACAAATATGTAGACCATGCTAT >4.3|2313021|37|NC_017299|CRISPRCasFinder ACAGAAGAAGAGCTTGAAAATGCTACTGGTAAGTTCA |
cmr6gr7,cmr5gr11,cmr4gr7 |
CRISPR arrays and Neighbor proteins around NC_017299_4
The CRISPR arrays of NC_017299_4 >merge|NC_017299|4|2312860-2313087|CRISPRCasFinder AATTAAATGCATCCTATGTTAATGTTCAACTTTATATGAAAGGAATAGATATAAGTATGCATAAATTTAAATACATCTTATGTTACTGTTCAACCTAGAACTGATTTTGACAAATATGTAGACCATGCTATATTTAAATACATCTCATGTTAATGTTCAATACAGAAGAAGAGCTTGAAAATGCTACTGGTAAGTTCAATTTAAATACATCTCATGTTAATGTTCAAT >NC_017299|4|4|2312860-2313087|CRISPRCasFinder AATTAAATGCATCCTATGTTAATGTTCAAC TTTATATGAAAGGAATAGATATAAGTATGCATAA ATTTAAATACATCTTATGTTACTGTTCAAC CTAGAACTGATTTTGACAAATATGTAGACCATGCTAT ATTTAAATACATCTCATGTTAATGTTCAAT ACAGAAGAAGAGCTTGAAAATGCTACTGGTAAGTTCA ATTTAAATACATCTCATGTTAATGTTCAAT
>NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ >NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP >NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP >NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >NC_017299.1|WP_003358211.1|2306073_2307438_-|PTS-ascorbate-transporter-subunit-IIC MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE >NC_017299.1|WP_014521022.1|2303768_2305862_-|transcription-antiterminator MLNKRCSNILQIIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFATINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKVLKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNSSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTPTEDHKPSLKELLKPDFIKLNEEAKDWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISNVKNIKASSEIDSILYS >NC_017299.1|WP_003358205.1|2303089_2303443_-|zinc-ribbon-domain-containing-protein MIIWGWGKVTKKIIGAVFERTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK >NC_017299.1|WP_014521021.1|2301535_2302303_-|ABC-transporter-ATP-binding-protein MQNILSVEKIEKYYGNKDNVTKAIDNISFKVDEGEFVGIMGPSGSGKTTLLNCISTIDNVTTGKIMINNNDITRLKSKLLDKFRQNELGFIFQDFNLLDTLTAYENIALALTIQGEKTSKIDGKVKSVAKYLEIEKVLEKYPYQMSGGQKQRVASARAIVTNPSLILADEPTGALDSKSARLLLERFEKLNKELKATILMVTHDAFAASYAHRILFIKDGKIFNELVRGNDTRKEFFNKIIEVTSLLGGDDNNVF >NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI >NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN >NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK >NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP >NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD >NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_6 | 2319824-2320039 | TypeIII |
III-B
Consensus repeat of NC_017299_6
|
3 spacers
spacers of NC_017299_6
>6.1|2319853|36|NC_017299|CRISPRCasFinder TAACTATAATGGGAGAATAACAGCAGAGCAGGCTTC >6.2|2319918|28|NC_017299|CRISPRCasFinder TATTTTCTATTCTTAACTCTTTATCTTC >6.3|2319975|36|NC_017299|CRISPRCasFinder CAGGATATTCAATAGAAGCAGGTAAGGGAGATAATG >6.4|2319855|36|NC_017299|PILER-CR TAACTATAATGGGAGAATAACAGCAGAGCAGGCTTC >6.5|2319920|36|NC_017299|PILER-CR CTTTATTTTATTTTCTATTCTTAACTCTTTATCTTC >6.6|2319985|36|NC_017299|PILER-CR CAGGATATTCAATAGAAGCAGGTAAGGGAGATAATG |
cmr6gr7,cmr5gr11,cmr4gr7,csx1,cmr3gr5,cas10,cmr1gr7 |
CRISPR arrays and Neighbor proteins around NC_017299_6
The CRISPR arrays of NC_017299_6 >merge|NC_017299|6|2319824-2320039|CRISPRCasFinder,PILER-CR GCTTAAATACATCTCATGTTAATGTTCAATAACTATAATGGGAGAATAACAGCAGAGCAGGCTTCATTTAAATACATCTTATGTTACTTTATTTTATTTTCTATTCTTAACTCTTTATCTTCATTTAAATACATCCTATGTTACTGTTCAACAGGATATTCAATAGAAGCAGGTAAGGGAGATAATGATTTAAATACATCCTATGTTAATGTTCAA >NC_017299|6|6|2319824-2320039|CRISPRCasFinder GCTTAAATACATCTCATGTTAATGTTCAA TAACTATAATGGGAGAATAACAGCAGAGCAGGCTTC ATTTAAATACATCTTATGTTACTTTATTT TATTTTCTATTCTTAACTCTTTATCTTC ATTTAAATACATCCTATGTTACTGTTCAA CAGGATATTCAATAGAAGCAGGTAAGGGAGATAATG ATTTAAATACATCCTATGTTAATGTTCAA >NC_017299|6|2|2319826-2320039|PILER-CR TTAAATACATCTCATGTTAATGTTCAATA ACTATAATGGGAGAATAACAGCAGAGCAGGCTTCAT TTAAATACATCTTATGTTACTTTATTTTA TTTTCTATTCTTAACTCTTTATCTTCATTTAAATAC ATCCTATGTTACTGTTCAACAGGATATTC AATAGAAGCAGGTAAGGGAGATAATGATTTAAATAC ATCCTATGTTAATGTTCAA
>NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN >NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI >NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ >NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP >NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP >NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK >NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP >NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD >NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE >NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG >NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3 MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE >NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN >NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1 MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_5 | 2319326-2319553 | TypeIII |
III-B
Consensus repeat of NC_017299_5
|
3 spacers
spacers of NC_017299_5
>5.1|2319355|38|NC_017299|CRISPRCasFinder CTTGAGGGACTTAAAGACAAGCTTAGGGTAAAAATAAG >5.2|2319422|36|NC_017299|CRISPRCasFinder CACTGATATGAGTGTACTTTTTATGAGTACAGTATT >5.3|2319487|37|NC_017299|CRISPRCasFinder CTAAAGGTAAGATTAATATAAAAATTAATTCGTAATT |
cmr6gr7,cmr5gr11,cmr4gr7,csx1,cmr3gr5,cas10,cmr1gr7 |
CRISPR arrays and Neighbor proteins around NC_017299_5
The CRISPR arrays of NC_017299_5 >merge|NC_017299|5|2319326-2319553|CRISPRCasFinder GCTTAAGTACATCTCATGTTATTGTTCAACTTGAGGGACTTAAAGACAAGCTTAGGGTAAAAATAAGATTTAAATACATCCTATGTTACTGTTCAACACTGATATGAGTGTACTTTTTATGAGTACAGTATTATTTAAATACATCTTATGTTACTGTTCAACTAAAGGTAAGATTAATATAAAAATTAATTCGTAATTATTTAAATACATCCTATGTTACTGTTCAAC >NC_017299|5|5|2319326-2319553|CRISPRCasFinder GCTTAAGTACATCTCATGTTATTGTTCAA CTTGAGGGACTTAAAGACAAGCTTAGGGTAAAAATAAG ATTTAAATACATCCTATGTTACTGTTCAA CACTGATATGAGTGTACTTTTTATGAGTACAGTATT ATTTAAATACATCTTATGTTACTGTTCAA CTAAAGGTAAGATTAATATAAAAATTAATTCGTAATT ATTTAAATACATCCTATGTTACTGTTCAAC
>NC_017299.1|WP_014521034.1|2318583_2319105_+|DUF4825-domain-containing-protein MKNKFKVLVPLVLILSLNLIGCGINSEKKSKENIKNTSKVETYDLIKYKGTYVGDNSSVGNIIKNLPANEYSAGFSLQTTKEPYEITVNYNINKNLGEENYNKFWKDNKVEELLEKNAVVLLSLIPNAEVIKFNVENIGEESYKYDRKNLEQKYGSLKNLFKDNDSLNKFSNN >NC_017299.1|WP_014521033.1|2317392_2318283_-|AraC-family-transcriptional-regulator MNYRKDIENCIDYIEDHIIEHLTVNQITKEIGYSSYHFCRVFSFLKGMPLMECVRKRKLSLSTLDLLEGQKIIDVAFKWGFETPSSFARAFRKEFRCSPTQYIKKMKAYYKSKGILTVGNFIIDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNMIDSRDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NC_017299.1|WP_014521032.1|2316645_2317386_-|class-I-SAM-dependent-methyltransferase MVNYYGSLCTVMYELLHPHAPEDELQFYLQYTKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLKELYKKAPKAKAFQSSIEEFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFIFAAETTANIILDREEYLENYHVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGGNLLGKEEMDFRIKLYDFGELDKLILKAGFKRRHVFSDFNRRESIDKNTETFLYECYI >NC_017299.1|WP_014521031.1|2315136_2316543_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYGKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NC_017299.1|WP_014521026.1|2312025_2312826_-|NAD-dependent-epimerase/dehydratase-family-protein MKLLIIGASGYLGNTIYKKLKECTNDDICGTCCKSSNHELLQINVLNRLDIKKLLSLKPDIIIWSIMDIKQETFLSQIGMDEIVNNISKDVRLIYISTTVGKGKDQTESVIPYRRMPDEYLSKYANGKIEGEIIVKKHPNYVIIRPGSIYVYDYDGKMDSRMKGLLEISETGKDYSRAANMYASFVNVQNLTDAIIELAYSKIMGIINISGERPVSHYDFNIYLARLMNIDESFIIPDYKEEEIYHNLNNDKRKLLLNTIVRDVEQ >NC_017299.1|WP_014521025.1|2311158_2311704_-|GNAT-family-N-acetyltransferase MKIETNHVIIRDFERKDVENLYRIIREKNIFRFMPDWAENVDSPESYWGYIDWHQTQKNSTDIYENKRYAIALPNTDEMIGMVGMGLEDTLNEVEVAYFMSEKYQRKGYTKEAVNALVDWCFSVSDIKYLILSIDCANISSCRLAEKCDFELFEKRTPIGHKQPNMESDSYFYYRKYRNLP >NC_017299.1|WP_014521024.1|2309210_2309945_-|multimodular-transpeptidase-transglycosylase MDKFRNMKKSHIALLVVMYMVLMGSLPRFTGWATIFSAIAAGSYFLKNKKDLKELTRKKKNFIFTGIIILAIIGSLNVAVGNNIQNEKLMAEKAKQEQEIKQEEQKKIEEKKLVEEQKRIQEEEAKKKAAEEKRKQEDEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKDNSNDQSNGSENVDNNQNYTVYKTKTGSKYHSSGCRYLRKSCYETTVSQARNEGLTPCSVCNP >NC_017299.1|WP_014521023.1|2308224_2308941_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTASLIKKLSEKGYHLNVTAIFTIDQVKEVAGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDILKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >NC_017299.1|WP_003485280.1|2307763_2308201_-|PTS-sugar-transporter-subunit-IIA MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDIVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >NC_017299.1|WP_003361919.1|2307450_2307735_-|PTS-sugar-transporter-subunit-IIB MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >NC_017299.1|WP_014521035.1|2320335_2322333_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKNAVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQDFATVSCAVNPACGREKEYGLKKAEQIKKVLVVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYEGILKDLDVEIKLNVDASKENIKEFEADEVLLATGSTPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLIDLIKFNKIDVKTSSYISKKTDKGLVLNTNGQESIINADSAVVAIGYLSQKDLYNEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK >NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP >NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD >NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE >NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG >NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3 MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE >NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN >NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1 MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_7 | 2333111-2333668 | TypeIII |
III-B
Consensus repeat of NC_017299_7
|
8 spacers
spacers of NC_017299_7
>7.1|2333141|36|NC_017299|CRT AACAGTTTGATATCATTCCCCTTATGGCACGTGCAA >7.2|2333207|35|NC_017299|CRT,PILER-CR,CRISPRCasFinder TAATGTACTGATTTTCAGTAGGTGGGTCCATGTAC >7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder ATTTATAGAAGATGGTACATATACAATTATTTATTG >7.4|2333338|37|NC_017299|CRT,PILER-CR,CRISPRCasFinder TTTCACTTGATTTAGATAATGGAAAGCTATTACCTTT >7.5|2333405|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder TGAAATGATAAGTAAAACACTTTCTTATTACTATAA >7.6|2333471|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder GATATAGTAATTTATATCCTGGTACAATAAATGAAT >7.7|2333537|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder TGATGGCTATATAATAAATATAGTTTCGGAAGTCAA >7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder TATATTAATATTACAAAAGAAGTTAGAAAATCATAC |
cas6,cmr1gr7,cas10,cmr3gr5,csx1,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around NC_017299_7
The CRISPR arrays of NC_017299_7 >merge|NC_017299|7|2333111-2333668|CRT,PILER-CR,CRISPRCasFinder TTTTTAATATATTATGTTATTGTGTTCAACAACAGTTTGATATCATTCCCCTTATGGCACGTGCAAATTTAAATACATCTTATGTTAATGTTCAACTAATGTACTGATTTTCAGTAGGTGGGTCCATGTACATTTAAATACATCTCATGTTAATGTTCAACATTTATAGAAGATGGTACATATACAATTATTTATTGATTTAAATACATCTCATGTTAATGTTCAACTTTCACTTGATTTAGATAATGGAAAGCTATTACCTTTATTTAAATACATCTTACGTTAATGTTCAATTGAAATGATAAGTAAAACACTTTCTTATTACTATAAATTTAAATACATCTTATGTTAATGTTCAACGATATAGTAATTTATATCCTGGTACAATAAATGAATATTTAAATACATCTTATGTTAATGTTCAACTGATGGCTATATAATAAATATAGTTTCGGAAGTCAAATTTAAATACATCTTATGTTAATGTTCAACTATATTAATATTACAAAAGAAGTTAGAAAATCATACATTTAAATACATCTTATGTTAATGTTCAAC >NC_017299|7|1|2333111-2333668|CRT TTTTTAATATATTATGTTATTGTGTTCAAC AACAGTTTGATATCATTCCCCTTATGGCACGTGCAA ATTTAAATACATCTTATGTTAATGTTCAAC TAATGTACTGATTTTCAGTAGGTGGGTCCATGTAC ATTTAAATACATCTCATGTTAATGTTCAAC ATTTATAGAAGATGGTACATATACAATTATTTATTG ATTTAAATACATCTCATGTTAATGTTCAAC TTTCACTTGATTTAGATAATGGAAAGCTATTACCTTT ATTTAAATACATCTTACGTTAATGTTCAAT TGAAATGATAAGTAAAACACTTTCTTATTACTATAA ATTTAAATACATCTTATGTTAATGTTCAAC GATATAGTAATTTATATCCTGGTACAATAAATGAAT ATTTAAATACATCTTATGTTAATGTTCAAC TGATGGCTATATAATAAATATAGTTTCGGAAGTCAA ATTTAAATACATCTTATGTTAATGTTCAAC TATATTAATATTACAAAAGAAGTTAGAAAATCATAC ATTTAAATACATCTTATGTTAATGTTCAAC >NC_017299|7|3|2333177-2333668|PILER-CR ATTTAAATACATCTTATGTTAATGTTCAAC TAATGTACTGATTTTCAGTAGGTGGGTCCATGTAC ATTTAAATACATCTCATGTTAATGTTCAAC ATTTATAGAAGATGGTACATATACAATTATTTATTG ATTTAAATACATCTCATGTTAATGTTCAAC TTTCACTTGATTTAGATAATGGAAAGCTATTACCTTT ATTTAAATACATCTTACGTTAATGTTCAAT TGAAATGATAAGTAAAACACTTTCTTATTACTATAA ATTTAAATACATCTTATGTTAATGTTCAAC GATATAGTAATTTATATCCTGGTACAATAAATGAAT ATTTAAATACATCTTATGTTAATGTTCAAC TGATGGCTATATAATAAATATAGTTTCGGAAGTCAA ATTTAAATACATCTTATGTTAATGTTCAAC TATATTAATATTACAAAAGAAGTTAGAAAATCATAC ATTTAAATACATCTTATGTTAATGTTCAAC >NC_017299|7|7|2333177-2333668|CRISPRCasFinder ATTTAAATACATCTTATGTTAATGTTCAAC TAATGTACTGATTTTCAGTAGGTGGGTCCATGTAC ATTTAAATACATCTCATGTTAATGTTCAAC ATTTATAGAAGATGGTACATATACAATTATTTATTG ATTTAAATACATCTCATGTTAATGTTCAAC TTTCACTTGATTTAGATAATGGAAAGCTATTACCTTT ATTTAAATACATCTTACGTTAATGTTCAAT TGAAATGATAAGTAAAACACTTTCTTATTACTATAA ATTTAAATACATCTTATGTTAATGTTCAAC GATATAGTAATTTATATCCTGGTACAATAAATGAAT ATTTAAATACATCTTATGTTAATGTTCAAC TGATGGCTATATAATAAATATAGTTTCGGAAGTCAA ATTTAAATACATCTTATGTTAATGTTCAAC TATATTAATATTACAAAAGAAGTTAGAAAATCATAC ATTTAAATACATCTTATGTTAATGTTCAAC
>NC_017299.1|WP_014521047.1|2332211_2332901_-|CRISPR-associated-endoribonuclease-Cas6 MELWELIATVMLKEDIYFEDCGYIIGKNINKSMLLDKDLKEVHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNEFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQVEDNEEAQKVAFLARAIGLGEKNSSIGAGFCK >NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1 MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV >NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN >NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3 MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE >NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG >NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE >NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD >NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP >NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK >NC_017299.1|WP_041926594.1|2322429_2323227_-|MerR-family-transcriptional-regulator MRYSITDLAEILGCTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEEILNEYEFAKSPEVTIMCDDECGWLSKKRSSQRIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHTKQLKSTSCIHTIVMADEDFTQQPQKVFKKASEFVIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NC_017299.1|WP_014521048.1|2333879_2335466_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRSDEEYKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKQVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSQLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGSGFAFKEVKAGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENNSKKIIQIYC >NC_017299.1|WP_014521049.1|2336437_2337286_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRIDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSQEFPMEVVSTGLPYLLVPLTSGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NC_017299.1|WP_014521050.1|2337576_2338497_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGAVQTREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGQVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYGGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NC_017299.1|WP_014521051.1|2338821_2340315_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSGFIKAGQKLPSIRSLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLGLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSKRKAELLDIARYNDILIVEDDPWNEISYKREKIKTIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKANHDLGTSVLIQKTIINFIQSNKITYYIESLNKQLVKRRDKVISLLKSHAPSGMKWTIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NC_017299.1|WP_014521052.1|2340710_2341076_-|VOC-family-protein MNFCWITLNVSNMEESLNFYHEIIGLKISERFNVGEDIEIAMLGETDCTKVELIYNKKQNVLSRSEGLSIGFEVKSLDEAMELLKNKNIPIKRGPISPLPSSRFFFIDDPNGIEIQIVQHS >NC_017299.1|WP_014521053.1|2341148_2342009_-|NmrA-family-NAD(P)-binding-protein MILITGANGQTGRAIIKALLSKGERIRAFVHTTEQIQEIKSLGEMEVVAGDMMNQRDVEEAFIGVSAVYHICSAVNPNEVEIGQMAINAARKAKVEHFVYHSVLHSVLQDMLHHQKKLKVEELLVNSAIPYTIIQPAVFMQNILESWNSLSEKGIFQQKFFTTQETRMCMVDLEDLAEAVSIILTSPGHTGATYELCGPEDLSLSDMIATMEQHIGLKIKVETPQDEMFAAQLKKLGVGDYQVNTLLKMFQHYNEHGFIGNPNVLTWILGRRPNDFSSFILRTLRS >NC_017299.1|WP_014521054.1|2342031_2342538_-|MarR-family-transcriptional-regulator MESFKFSLRDIPKREILNEYSSRFPGINVDAVESCIALLRTASDISKILDEHFSKYGISEGKFTILMLLYRQSDYQLSPISLSKKAEVTKGTMTGLIAGLENQGFIEKISNPCDKRGYLVRLSSKGLRILEEILPVHYTLIAKLMAGLEDGQLKELTTLLNLLSKNLL >NC_017299.1|WP_014521055.1|2343094_2343541_+|hypothetical-protein MNKLNTDKLSVEFRNGVTSTEPTLGRRYTLTHSDITAELFLTIGSAYAYDKINATRDEVLGEWIGKQKNYLFHVYLHIDGNNPIVTGVRNHIFRLELPLALKAIRYVDRKLFSAHSKLDNSPIIVHFMSSYPSFNRTEKWGTFSDYKT >NC_017299.1|WP_033065806.1|2343772_2344804_-|alpha/beta-hydrolase MKKVIKIVSVILVILVISGFFIIKNLTETKDGKLNMYVAANLQLYKILNLKSINSKSIEEIRGNLNKQSTKWSNKPILFSNIKNLDIKMNNEKIPVRIYTPENGSNFPIIIYSHGGFWIGGNVDTSDRVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNAKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPPIICQVLIYPSTNIFELNSKSWSYFSNSVNVSREDMEKYISIYAPKKEDRKNPYASPLLSKDFRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKVDVARYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NC_017299.1|WP_014521058.1|2345237_2346137_+|hypothetical-protein MSNKRNLQSLRSFYICILIFNMVSNSIFHLNNNGFNIELFKNFTIRSVILLDLNILLFLIIVIAFEKKINIDEEVNTQLNTRIRPLYLVNIFFIAYILVCIFLLKDIDVILSSFIMEIIYIGIIILSKKIITLELTNRQLQWQKACGYIDEDCEESSFLWRFKLWWSPHVNVPFKNRWKGPSRLLYDLALVYGIIISKGNLFPLILLILLLPDVISWLEGLLGLQTSLTGICTGITEHHSKNSHVLYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_8 | 2335819-2336173 | TypeIII |
III-B
Consensus repeat of NC_017299_8
|
5 spacers
spacers of NC_017299_8
>8.1|2335847|38|NC_017299|CRISPRCasFinder TTTTTAAATAATTATCTTTTAGGAAGTTTTCATCTTAT >8.2|2335913|37|NC_017299|CRISPRCasFinder ATTTCATTATTCTTTTGTAATTTCGTATACACCGCAT >8.3|2335978|38|NC_017299|CRISPRCasFinder AGCATATGGGAATATGGATAATGCTATAAAAACTGCAT >8.4|2336044|36|NC_017299|CRISPRCasFinder TAGGTACATCAAATGGAGTTGTACTTACTACAGGAT >8.5|2336108|38|NC_017299|CRISPRCasFinder ACCAGAAAAAAGCATAGCTGCTGCTATGGGAAACATAT |
cas6,cmr1gr7,cas10,cmr3gr5,csx1,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around NC_017299_8
The CRISPR arrays of NC_017299_8 >merge|NC_017299|8|2335819-2336173|CRISPRCasFinder TTAAATACATCCTATGTTAATGTTCAACTTTTTAAATAATTATCTTTTAGGAAGTTTTCATCTTATTTAAATACATCTTATGTTAATGTTCAACATTTCATTATTCTTTTGTAATTTCGTATACACCGCATTTAAATACATCTTATGTTAATGTTCAACAGCATATGGGAATATGGATAATGCTATAAAAACTGCATTTAAATACATCTTATGTTGATGTTCAACTAGGTACATCAAATGGAGTTGTACTTACTACAGGATTTAAATACATCCTATGTTAATGTTCAACACCAGAAAAAAGCATAGCTGCTGCTATGGGAAACATATTTAAATACATCCTATGTTAATGTTCAAC >NC_017299|8|8|2335819-2336173|CRISPRCasFinder TTAAATACATCCTATGTTAATGTTCAAC TTTTTAAATAATTATCTTTTAGGAAGTTTTCATCTTAT TTAAATACATCTTATGTTAATGTTCAAC ATTTCATTATTCTTTTGTAATTTCGTATACACCGCAT TTAAATACATCTTATGTTAATGTTCAAC AGCATATGGGAATATGGATAATGCTATAAAAACTGCAT TTAAATACATCTTATGTTGATGTTCAAC TAGGTACATCAAATGGAGTTGTACTTACTACAGGAT TTAAATACATCCTATGTTAATGTTCAAC ACCAGAAAAAAGCATAGCTGCTGCTATGGGAAACATAT TTAAATACATCCTATGTTAATGTTCAAC
>NC_017299.1|WP_014521048.1|2333879_2335466_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRNEGKDYTFHSVILAGVHDVKTLKLKIRSDEEYKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKQVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSQLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGSGFAFKEVKAGEEKRFDIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENNSKKIIQIYC >NC_017299.1|WP_014521047.1|2332211_2332901_-|CRISPR-associated-endoribonuclease-Cas6 MELWELIATVMLKEDIYFEDCGYIIGKNINKSMLLDKDLKEVHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNEFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQVEDNEEAQKVAFLARAIGLGEKNSSIGAGFCK >NC_017299.1|WP_041926596.1|2330975_2332166_-|type-III-B-CRISPR-module-RAMP-protein-Cmr1 MKKVKVTLEVVTPMFSTGSNINKEAEFRITELKALIRSIFREFYNYDSEDDLKKKEEILFGSTNKKSPVSIRFGYNKKNIFTGKKNLVLHKEVLVEAIPIGTTINIIFQGRNEKILKVYSNILKLASIVGGLGKRSRKGMGSFKIKDIVSETNDINNRFENLLNECNELEIEGKKYVIETRNFLIDENEDDYIRYKIEYDNNIPNIHYAKYIHKIFIGNSINEKDQREKIKNIFKKISELTHKRLIKAKDFLSEDSVNEIKKLTNKDICDEEVLELVLNKDILGNYNYNNKDSCKRGLSYKSDLTRFASPIYVTVYQQVQGKSIKNYIIIKELNYNYIYNEIINIRRNKKEKELKNKNKENIAKEINKEVEEFKPMDEEYIKSYINEIKKCCKEEV >NC_017299.1|WP_014521045.1|2329230_2330976_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MSYLLGVTVGPIQINIQKSRKLRELYNSSKIVSDMMKKVIEYLKIRDETLKIIYPSIKDVNDTKTDITNYLICEINNIDDLKDMRERVFDELKISVLEEIYFMFWTVEPLEEYSKTYKKLTKKLRSIKNTYEFKNYEKDVRIKKKCSLCGERITEDASKLCEVCNCKRNYNQTSNWKNNNKGEKYKSVYDISIDVWKEKYNEDLLSLNKNLEDLFNNTSRYYSLDTVSNIIKCLKIDPKKVRKEKEIDEDLENPKMESIELIAELKNIRCELESIYLRGEKPVSKPHYKYCFIQIDVDDLGKWISGEYNYEEEDLKESQIQISKALCSFAYKLKEEFKNSKTKVIYAGGDDFLAVLPVECLLNTLKIIEEIFKSTVQNDIDNSLNYSQKISYSASVTIANCKDEMALALRKNREALEKVKNRYYSKNGICINYIINTSKIIDMFLSKDYFNEYVDNLRYFKKVEKYISFTYVDAIENEFNKMKFEDLKTDDFLNIKDMLLLEFERHLNLNKNKVPKDNKEGNENFLEYFKIHTRLFENIINDNEIDEKIDFINIINCFRIYKKLTDFQFKEEAKWDEVSKN >NC_017299.1|WP_014521044.1|2328146_2329250_-|CRISPR-associated-protein-Cmr3 MKFLKIKPYDNTFFRLGNNFEFKISNVIQTKNVAYPSTFFGAIFTAILANNDEFRESFLNIPGNTDHLEILNIKQIYLYDEKQGMIYIKAPKDIFVNNNEVKFGNFKEMKDGESSIKYDYYLEEPDGSELERADNYFISIKEFYGKYRYKVLDNIDLKQEDEIFAKNIKTGIALDKSTGIVKESFLYTIEQTEFKNITEDYYGNDWSFVVEYTIDNDFLKKQGYPKVKNLDKGELKLGGETKVCTYEIIENSDINEFKLKTSQGFLKPGEKLKVILTSDSYFTESFAKLFNDKMKILALVNDKPIYIGGFDVAKNEEKAMYKGYSAGTVLLLQNDSGKDINLQEYLDMKLRNELKNGFNEYICVKGE >NC_017299.1|WP_014521043.1|2326794_2328144_-|hypothetical-protein MEHKNVEHLVIFSTLNQITNYIAIKNLNPKNIYNITFDQGFADTLKQGIDPKKWDDNLKRVLTDEKIESEIKLITINQAMYQNLEQFKIEIKENIESIDKNTPIYWHITGGQRIFAIAIHDIVKERPNDLILYFEGNSEKVICIGKDKYGFQSQLEYELKDLDFCTVFKLMGYDANDLDSTRILKGKIDKNDKNEKLKYDKNEMKFYDKLYDWIIKEGEKSESHIKFEIQGKQFEGTFKKLLLETNSTKKFISKKQLENGNREDKNNKDLKGKIERQDFLKKLFEEVENKCPDLKNTGYDFIKSDEIKMGFPAGYIFEKLTGYQIYKVVKDNSKVLSMAMSLKVFKDKETKITDEIDIALLINTGRIINFECKSGSLKGDNAKSHNFTTYFLSGVFGSPIFLTPLTHKGEKLEKELDKKLKSACNAAEKANLQTIYLEDIKEKVGNLIG >NC_017299.1|WP_014521041.1|2325878_2326781_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MYKNKETIYIKGISPIHAGNGQSLTSVDMPIQRESHSNIPKIEGSSLKGSIKHNVYHKLGFNEDNKKVEKEKEGKKEEYKLFEKIFGPDNGNDYASAISITDAKLLLFPMRSATDIYKLITCPYVLRRWKEEINQSFEDSFLEDIEDGHCVVNNESQLLSEDKVMLEEYIFEANRKEDLSSLFNESLEELQVNKVVILSDSDFIDMVTMYTEVITRNKIDVETGTAQGTGLFSEEYLPAETVMYFSVLESAFYKGGEKEVLKYFNKELGKIFQVGGNETIGKGIVKILNYDLLEGVQNNE >NC_017299.1|WP_014521040.1|2325418_2325886_-|type-III-B-CRISPR-module-associated-protein-Cmr5 MSNLKNVNLQVAQFALKKVKQILEYEEIEKEKEKKKQELAVDKYKTLSKKMTVLIQKNGLIGTLVFVLSKIKKEKANEFVLNHIVKWCEEDYKLGFLREELRVGEGNANSNEVFIEKITKLSNQEYRLVTKEIMNLFGWIKRFTDGMIEGEVQDD >NC_017299.1|WP_041926595.1|2324121_2325426_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIKLLKIKNVSKKRGVEFENNETFKNLKQEFYKNPKSGDYVFCSVEQDKLRGLEWTLYQDINDTNVYEQWQKWQKDSCHYGLKLDKFTNIFNGREENLNKKVDQTIHLNIDDYLNEDKDLYENIDFNVKLSDKLVVGLGEHSVFETDIKLHHTYGVPYIPASAVKGCFRSHIIQKYFQSKEKKAEEDKNFEEDKNFIEIFGGEYKDKTYNGNVIFIDLFPKSSFQIKKDVMTPHYQNGYTDDGNITPIEFLTVENTLFRFILRIRNKCLLQDNNSKIKLKENQDVRDFIVEELVEMIATHGIGAKTSVGYGYFEEVTKEEGLEQTENNEKRREEEILEAKEKKKLMKMNDSEKKLYSVEKISGCEKRKEELRKLFTNRKQEKLEQMEIEKLAKLIKRDLEDSGKWRYKVGKKGKKNKELERIEKICEILNIDLP >NC_017299.1|WP_041926685.1|2323789_2324098_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYRIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPQISKNNPCNFTTIGGLLVKVQLAEYTMGK >NC_017299.1|WP_014521049.1|2336437_2337286_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRIDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSQEFPMEVVSTGLPYLLVPLTSGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NC_017299.1|WP_014521050.1|2337576_2338497_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGAVQTREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGQVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYGGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NC_017299.1|WP_014521051.1|2338821_2340315_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSGFIKAGQKLPSIRSLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLGLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSKRKAELLDIARYNDILIVEDDPWNEISYKREKIKTIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKANHDLGTSVLIQKTIINFIQSNKITYYIESLNKQLVKRRDKVISLLKSHAPSGMKWTIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NC_017299.1|WP_014521052.1|2340710_2341076_-|VOC-family-protein MNFCWITLNVSNMEESLNFYHEIIGLKISERFNVGEDIEIAMLGETDCTKVELIYNKKQNVLSRSEGLSIGFEVKSLDEAMELLKNKNIPIKRGPISPLPSSRFFFIDDPNGIEIQIVQHS >NC_017299.1|WP_014521053.1|2341148_2342009_-|NmrA-family-NAD(P)-binding-protein MILITGANGQTGRAIIKALLSKGERIRAFVHTTEQIQEIKSLGEMEVVAGDMMNQRDVEEAFIGVSAVYHICSAVNPNEVEIGQMAINAARKAKVEHFVYHSVLHSVLQDMLHHQKKLKVEELLVNSAIPYTIIQPAVFMQNILESWNSLSEKGIFQQKFFTTQETRMCMVDLEDLAEAVSIILTSPGHTGATYELCGPEDLSLSDMIATMEQHIGLKIKVETPQDEMFAAQLKKLGVGDYQVNTLLKMFQHYNEHGFIGNPNVLTWILGRRPNDFSSFILRTLRS >NC_017299.1|WP_014521054.1|2342031_2342538_-|MarR-family-transcriptional-regulator MESFKFSLRDIPKREILNEYSSRFPGINVDAVESCIALLRTASDISKILDEHFSKYGISEGKFTILMLLYRQSDYQLSPISLSKKAEVTKGTMTGLIAGLENQGFIEKISNPCDKRGYLVRLSSKGLRILEEILPVHYTLIAKLMAGLEDGQLKELTTLLNLLSKNLL >NC_017299.1|WP_014521055.1|2343094_2343541_+|hypothetical-protein MNKLNTDKLSVEFRNGVTSTEPTLGRRYTLTHSDITAELFLTIGSAYAYDKINATRDEVLGEWIGKQKNYLFHVYLHIDGNNPIVTGVRNHIFRLELPLALKAIRYVDRKLFSAHSKLDNSPIIVHFMSSYPSFNRTEKWGTFSDYKT >NC_017299.1|WP_033065806.1|2343772_2344804_-|alpha/beta-hydrolase MKKVIKIVSVILVILVISGFFIIKNLTETKDGKLNMYVAANLQLYKILNLKSINSKSIEEIRGNLNKQSTKWSNKPILFSNIKNLDIKMNNEKIPVRIYTPENGSNFPIIIYSHGGFWIGGNVDTSDRVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNAKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPPIICQVLIYPSTNIFELNSKSWSYFSNSVNVSREDMEKYISIYAPKKEDRKNPYASPLLSKDFRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKVDVARYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NC_017299.1|WP_014521058.1|2345237_2346137_+|hypothetical-protein MSNKRNLQSLRSFYICILIFNMVSNSIFHLNNNGFNIELFKNFTIRSVILLDLNILLFLIIVIAFEKKINIDEEVNTQLNTRIRPLYLVNIFFIAYILVCIFLLKDIDVILSSFIMEIIYIGIIILSKKIITLELTNRQLQWQKACGYIDEDCEESSFLWRFKLWWSPHVNVPFKNRWKGPSRLLYDLALVYGIIISKGNLFPLILLILLLPDVISWLEGLLGLQTSLTGICTGITEHHSKNSHVLYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR >NC_017299.1|WP_003398566.1|2346477_2347800_+|APC-family-permease MLEKKYGLWTTVSMVIGIVIGSGVFFKADNILMASGGNVKTALLAWLVGAISMIFGALVFAECANRFERSNGIVDYAEGMLSEKFAYLIGWFNGIIYYPAIAAVLAWAAGNYTAILFNKDGNFVWIMAAIYMIGIYILNYISPILSGKFQIASTAIKLVPLMIIAIFGIFQGLNNGILIENFSKVSIISDSGSGFAAAVLGAAFAYEGWIIATTINGEIKDAKNTLPKALVFGSLVIVIIYILYFLGIVGMIPTETILKQGDNTVNVAARTVFGNFGASILTIFIIVSCLGTLNGLILGGSRSFYSLAIRGQGIKPEAFSKLNSKTNIPTNSTIANFILICIYLVVWYMNFKGLFPNKLFIDISELPIALIYGIYIIIYIAYMMKMKDLSFIKRFVIPSLALMGALIVVYGGLSKTSVIIDLGISVFVFLSGLLFYNKKK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_017299_9 | 2446898-2447047 | Orphan |
NA
Consensus repeat of NC_017299_9
|
3 spacers
spacers of NC_017299_9
>9.1|2446916|30|NC_017299|CRT TGGTTTATCCTCTGGTTTATCCTCTGGCTT >9.2|2446964|18|NC_017299|CRT TGGTTTATCCTCTGGTTT >9.3|2447000|30|NC_017299|CRT TGGTTTATCTTCTGGTTTATCCTCTGGTTT |
CRISPR arrays and Neighbor proteins around NC_017299_9
The CRISPR arrays of NC_017299_9 >merge|NC_017299|9|2446898-2447047|CRT ATTCTCTGGTTTATCTTCTGGTTTATCCTCTGGTTTATCCTCTGGCTTATTCTCTGGTTTATCTTCTGGTTTATCCTCTGGTTTATTCTCTGGTTTATCTTCTGGTTTATCTTCTGGTTTATCCTCTGGTTTATTCTCTGTTTTATCCTC >NC_017299|9|2|2446898-2447047|CRT ATTCTCTGGTTTATCTTC TGGTTTATCCTCTGGTTTATCCTCTGGCTT ATTCTCTGGTTTATCTTC TGGTTTATCCTCTGGTTT ATTCTCTGGTTTATCTTC TGGTTTATCTTCTGGTTTATCCTCTGGTTT ATTCTCTGTTTTATCCTC
>NC_017299.1|WP_014521131.1|2444682_2444913_-|hypothetical-protein MKKIVIGLLTALILGVNVSSAYAAESCPRCGATVGRGENHKCCDYLGHDFKPLHDFHGKLVCMACRNCGYTIPYNN >NC_017299.1|WP_014521130.1|2443784_2444348_+|hypothetical-protein MINSISNSQPYLNIKGSTKKNDIEQNNQTEDNKFKKYLSDYVPKYTGDEGMPKKCDYKEMTVFEKRIFDDYMQTDFLYGVSYEDFKKTLCGFPPVDAPKSIIEAYQNTISKYPENQRKKIMGELSYLESPNDNLDMGTIIRNAVDHCKLVEIITGQSQRHRENLYEDFLNEFNKVNTIDDSHRKTTL >NC_017299.1|WP_014521129.1|2442894_2443770_+|Ig-like-domain-containing-protein MKKSKKLFITTSASFLFILSFFLFFTKSNVQASSSPVISNVDIVGYSYDSIYPTFKSTTPRKDSYDVFYNPSKSKSGNVYIRVIQTGSGGTRNIVVDNDDNNFVNAKFSDISTDLLTSGGILTGYDEKFEITDLKKGYHNIKRLGFNNNTLGKPMVQDIIRVRVCEHNEFPAISNVPVNKTFTINFNRAVKIDSSTKNFVKVLDSNNREVPISIGLGSNPNYLEIYAPSNNYLPNSNYTLQVLPGLKSTDGKELFTSTTMNFSTSSSSRSLLSRSIHTFGTTTPDLTLNFD >NC_017299.1|WP_041926688.1|2442237_2442405_-|helix-turn-helix-domain-containing-protein MREYLMEPQEFAKLIDVNYKTYYSWERGVAGPSLETALNIAKRLNKKVEDVWYLD >NC_017299.1|WP_170876226.1|2441900_2442056_-|hypothetical-protein MADRLRVVLEFRKTDIKELQLYGKLLKFSNPAAVVKDILKGTLPIEILEED >NC_017299.1|WP_041926602.1|2441653_2441899_-|hypothetical-protein MNLETRLKKCCCKNISVTYKQNEWYKVELFYNNRYYRFFDVSLKEVERKSLNYMRKLNRRLKVKMMARGEVTWFQKHRAML >NC_017299.1|WP_014521126.1|2440901_2441327_-|hypothetical-protein MFFNKEKVYSFEEGLKVLNKTKTEKVSLKMLQELNDEGIYLREGNKLYNTLACTLGILMYAEKVIAVPKTGVPKLDQGGWKMVGVAQSVIFWASMIYAFKALLELAVKGEGTWKKVGTGFLICAMNYLIPWGFELIKGIFM >NC_017299.1|WP_014521125.1|2440552_2440891_-|hypothetical-protein MSIQEFLQNKQCYAFLNPFDVSNLEIVKSINEFNYNTKAFFESITRFIYYMKHPKELSWLIWLGVVENSFWICIFICLFSIIAYIIGWKKGKLWAKGSVLAYIIIMMFNSAL >NC_017299.1|WP_014521124.1|2438157_2440542_-|hypothetical-protein MFNFLKREKSIKISDYFEIIHPKYSVLQITPNTGNRNYDTELIAKTIANMYRMPYQRIMKEIKNKGFKIVYELPVKTMFEISITKDDCTFHITVPRLYKNLFVEKCTEVWKRITVKEVATIPINEDELQEALKYELHYEKEDPLSLKVNKKTNDPLNNILNVMDVMENNDKIDILYNFIPINQGRWKGNYKETMKKIKAGLPIDKEKLNPGVILKYLGIGTIKAIDFVFNVLNDVVSDGKPRSHSEVAVTMIDKFSNLSAITRKKENTVVIDTQLIVVSRSKEKIRQQNNAYAVLESYKSLAQDNSLKYKKLNNKIKINPYDYKIKGVDTNRMSTLECNNFIQIPGRELLQRFRINTKVDVLENPIPEELQKGYVYLGPSNYKGKEYKAYMRNKYNFGNLALLLLSPQGGGKTTFIANMSKNNNDKHESVIILDYIKNCELANTVKKVVNKDDVIDLDLSKKECFQGLGFNEVKCEGKDEFEMFKMSNMKAEQTMSFIDAINTDGLPLTSKMRRYLSAAANLVYIHDDTSIGDVIKCLQDFRKRNYYISYIDKLSEDGKNYFYDMITTLKELNEIKEEKDKKTKEVIRREIVGTKESKIDGILDRVNLIQENIYLKYMFNMKCDNNVDFIKAMDEGKVILIKMPEDSFNNQMVKNVLVTFFTSKIVLATKLRGSLHEKPSRCNVFYDELYQAPTAENVICSVLSQLRKFGTKIIISAHYMNQLIPQLKNEIKASGASYMLLQGADKKNFEELREEMKPYELEDLLNLKQFHSLNLIKYEKGYAKFITKLPKPLN >NC_017299.1|WP_014521123.1|2437996_2438149_-|hypothetical-protein MVKYIIMSCIMGFAGNKLFNKKDKSSKNSIKWGCISGSLLIIIYVIVLKL >NC_017299.1|WP_014521135.1|2448135_2449158_-|peptidoglycan-binding-protein MAKGIDISMHNGTVNFGAVKASGCNIVIIKATEGVQYVDPYLNQHYNGAKAVGMNIGFYHFMSEKTDPSQQAVDFWNSIKGKQFNISPTLDIETNNQGRSQSQISDRCIEFLQKFKALSGYNCLIYTGGYFGRDNLDSRVKQYKGWIAHYNVNTPMATGFNAVGHQYTEDGHINGVSTRVDMNNFTDGIFIGKATKPIETKEMQIQKMLVTIGYPIGNSGIDGIIGNGTITAIKAFQKDCNLTVTGNVDTKTWNKLEQEYNKKLGIKPNNKEEFDMDKVVLYFGPLDALSAVLVSQKHQCPMMLKKDFEDKKLKAKEIIIIGGKPGTDRYDSFKDAAKLL >NC_017299.1|WP_014521136.1|2449193_2449367_-|hypothetical-protein MNRVLTKITSARWLIAVIMTIVFAILAIKNTLNTEFITIYTMVVAFYFSKDRKEQDK >NC_017299.1|WP_014521137.1|2449379_2449604_-|hemolysin-XhlA-family-protein MDSNIQQEILERIVRIETKIDGYNSTREKADVAYNKACQNEKDITEMKDNQKWLWRTIAGAIILGILGAVIKFN >NC_017299.1|WP_014521138.1|2449811_2450975_-|MerR-family-transcriptional-regulator MRTVKQVSDLTGISVRTLHYYDEIGLLKPSEITEAGYRFYDDEALKTLQQILFFKELDIPLKDVKEIMSSPYFDKMQALKNQKKLLLLKRKRLDGLIKLINKTLKGESTMNFKEFDMSEYFNVLEEFKTEHEDKVIRIYGSVDKYNECIEKCKSKEDEIAKMAMKKYGSIEKYAKALKKNLNSDILTLAEKYDVFKKDFLEDKHPKLRELYKKLVSDLSKDPSSKKIQQIAEEITNTAKKDYEIFKMDNGDDHWYYMVQMYLVYPGWIEVVDKKYGNGASKFIGEALKNYSGDKHPKVEELYEKLTSDLSKAPFSKEIQQIIEEISDESKKSQKLYKVDEGENHWGYMAELYLSDSMLQEVTDEKYGNGASKFIGEALKFYSENSKS >NC_017299.1|WP_003360655.1|2451192_2451315_-|XkdX-family-protein MLSYIKEYFLMGLYVEEDLDIFVQAKWITIEEKENIIKTQ >NC_017299.1|WP_014521139.1|2451307_2451700_-|hypothetical-protein MIFLGELKKIEENKIKAKFIHYIPFDNVYGLHKTKEELEQEGILIENIPEPKYIENKQAIMYWNPEDKQIFYEYEDVLKSDEELEQQKQQSLNAKLLKDNAEIQIELNKQKELNADLLLKIAQLGGNANA >NC_017299.1|WP_041926603.1|2451732_2453448_-|phage-tail-protein MGKAKIANSAGFGSKINFVKMKVGDGGGSYYNPREDQEDLINTVWEGNITHVAIDEKNPNWINVEMMIPANVGGFMIREYGVFDEDNNMLAIAKCAESYKPLAEDGSTKELIMKMVLTVSNTENITLKIDPTIIFAKKSEIEILENKIKNIKIPVTSVNSKTGAIELKASDIKTEDGKTIESQLADITTEIGTEELKTNAKDIKSSINELFISASNGKTKVATAITGKGIPASGSDSYDTLSNKIKNIKTGYTQNDLINIENVEFSIKNIFSKNMDSGMLFFIKDYIYVINWKDSIKKYSLDGNLILSKKIEHNGFSSGSYTYFDDIYKIFFHNNSFYIFNKGLKHSGKYYYRVYAETCDIERISTYGFGGQGAYSYYGYGGVAINNNGICCGYNEYSGEVFLFSLSYADVIWSKCLFGWNTKYDFSNIFSDGTDFYISSNYSSGSYYKINVNGDITELEKKSLPYESNSVMLGEYVYCYDSNKKIWRYNIKTNKTEQIGSNCKYIELDFLRKYLYIYTGSILHKIDKNGNIICSYNCTDDHFLGSDKDACIYFYNNNVINKIKLAYKVLV >NC_017299.1|WP_012705217.1|2453484_2454120_-|YmfQ-family-protein MIKSKKGKEMITYVSPIYEQSKVIQSIFEAIGYEWDTAGLLANDILKQFFPQTATWGLIYWEEAVNVVNNPTEEIERRRRKVIAKLQSRYAINPKRMALILKNYTGADILITEDIAPYTFEVKLTGREGFPKSLEDLYKEVKKIKPSHLSVKYKLISLTESNLYIGATSFSGETITVYPWTPNNIETTGNIEIALAQNAGLETITTYPKEG >NC_017299.1|WP_014521141.1|2454116_2455247_-|baseplate-J/gp47-family-protein MERDLLIPEFLQEDADTIHERMLEKAPPNVSTIEGDFYWDNTRPTAEEKASLMQVQLQNMLRLAFPQTSYGVWLEYLGECKGVFKNLPTKSIGVIKVIGRKGTNIYKDKLIGTVATDDSESVVFKFTENKVIDETGVAYVKAECTKAGTIGNVLKNTITILMDRINGIESITNEEEFTGGTDLEDEEHYRERVLEEYKNEATSGNNEHYKKWAKEVDGVGYAYVIDEWNGPGTVKVLILDKNNKPATRELIDKVQNYIYEIVPREENRGGKAPIGAIATIDTPITLVIDIKANFKFKEDFNSEIVLNSLKENLSKYLSGISIGGTILYTAIHTIVGSMILTGEGIEDFKNLTVNGITENIKLIDQVAVIGEVTNIQ >NC_017299.1|WP_003385468.1|2455252_2455705_-|DUF2634-domain-containing-protein MPNLFPDNLEENNIEELEETIIDFKGSYLFDFKTGEFVTNPDGTIAKANDLEAYVQWCYKAMATPRYKLAYSDLYGQEFKNIIGQDISKDAMELEIKRMTEETLMVHPRTKDVDNFIFKWSENKEEVYYEFEIITIDEEKFMLHSELKVW |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|
NC_017299_9 | 9.2|2446964|18|NC_017299|CRT | 2446964-2446981 | 18 | NC_017299.1 | 2446880-2446897 | 1 | 0.944 |
NC_017299_9 | 9.2|2446964|18|NC_017299|CRT | 2446964-2446981 | 18 | NC_017299.1 | 2446892-2446909 | 1 | 0.944 |
NC_017299_9 | 9.2|2446964|18|NC_017299|CRT | 2446964-2446981 | 18 | NC_017299.1 | 2447036-2447053 | 1 | 0.944 |
1. spacer 9.2|2446964|18|NC_017299|CRT matches to position: 2446880-2446897, mismatch: 1, identity: 0.944
tggtttatcctctggttt CRISPR spacer tggcttatcctctggttt Protospacer ***.**************
2. spacer 9.2|2446964|18|NC_017299|CRT matches to position: 2446892-2446909, mismatch: 1, identity: 0.944
tggtttatcctctggttt CRISPR spacer tggtttattctctggttt Protospacer ********.*********
3. spacer 9.2|2446964|18|NC_017299|CRT matches to position: 2447036-2447053, mismatch: 1, identity: 0.944
tggtttatcctctggttt CRISPR spacer tgttttatcctctggttt Protospacer ** ***************
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NZ_CP014152 | Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence | 162522-162557 | 0 | 1.0 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NZ_CP013684 | Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence | 136408-136443 | 0 | 1.0 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NZ_CP013710 | Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence | 116828-116863 | 0 | 1.0 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NC_025146 | Clostridium botulinum plasmid pCB111 DNA, complete sequence, strain: 111 | 110843-110878 | 0 | 1.0 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NC_012654 | Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence | 250707-250742 | 1 | 0.972 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NZ_CP031095 | Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence | 131441-131476 | 1 | 0.972 |
NC_017299_3 | 3.1|2310692|36|NC_017299|PILER-CR | 2310692-2310727 | 36 | NZ_CP013709 | Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence | 120963-120998 | 2 | 0.944 |
NC_017299_3 | 3.1|2310692|36|NC_017299|PILER-CR | 2310692-2310727 | 36 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 166400-166435 | 2 | 0.944 |
NC_017299_3 | 3.4|2310694|34|NC_017299|CRISPRCasFinder | 2310694-2310727 | 34 | NZ_CP013709 | Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence | 120963-120996 | 2 | 0.941 |
NC_017299_3 | 3.4|2310694|34|NC_017299|CRISPRCasFinder | 2310694-2310727 | 34 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 166400-166433 | 2 | 0.941 |
NC_017299_6 | 6.3|2319975|36|NC_017299|CRISPRCasFinder | 2319975-2320010 | 36 | NZ_CP006909 | Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence | 133437-133472 | 2 | 0.944 |
NC_017299_6 | 6.3|2319975|36|NC_017299|CRISPRCasFinder | 2319975-2320010 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 156920-156955 | 2 | 0.944 |
NC_017299_6 | 6.6|2319985|36|NC_017299|PILER-CR | 2319985-2320020 | 36 | NZ_CP006909 | Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence | 133437-133472 | 2 | 0.944 |
NC_017299_6 | 6.6|2319985|36|NC_017299|PILER-CR | 2319985-2320020 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 156920-156955 | 2 | 0.944 |
NC_017299_7 | 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333272-2333307 | 36 | NZ_CP013709 | Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence | 100389-100424 | 2 | 0.944 |
NC_017299_7 | 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333272-2333307 | 36 | NZ_CP013682 | Clostridium botulinum strain 1169 plasmid pRSJ8_1, complete sequence | 102721-102756 | 2 | 0.944 |
NC_017299_7 | 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333272-2333307 | 36 | NZ_CP013295 | Clostridium botulinum strain CDC_54064 plasmid pNPD1_1, complete sequence | 113437-113472 | 2 | 0.944 |
NC_017299_7 | 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333272-2333307 | 36 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 145826-145861 | 2 | 0.944 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NZ_CP006909 | Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence | 263676-263711 | 2 | 0.944 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 22954-22989 | 2 | 0.944 |
NC_017299_7 | 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder | 2333603-2333638 | 36 | NZ_CP013700 | Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence | 32871-32906 | 2 | 0.944 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP045607 | Bacillus cereus strain SB1 plasmid p1, complete sequence | 487812-487841 | 2 | 0.933 |
NC_017299_6 | 6.3|2319975|36|NC_017299|CRISPRCasFinder | 2319975-2320010 | 36 | NZ_CP031095 | Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence | 1711-1746 | 3 | 0.917 |
NC_017299_6 | 6.3|2319975|36|NC_017299|CRISPRCasFinder | 2319975-2320010 | 36 | NZ_CP013700 | Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence | 156752-156787 | 3 | 0.917 |
NC_017299_6 | 6.3|2319975|36|NC_017299|CRISPRCasFinder | 2319975-2320010 | 36 | NC_012654 | Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence | 110413-110448 | 3 | 0.917 |
NC_017299_6 | 6.3|2319975|36|NC_017299|CRISPRCasFinder | 2319975-2320010 | 36 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 23508-23543 | 3 | 0.917 |
NC_017299_6 | 6.6|2319985|36|NC_017299|PILER-CR | 2319985-2320020 | 36 | NZ_CP031095 | Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence | 1711-1746 | 3 | 0.917 |
NC_017299_6 | 6.6|2319985|36|NC_017299|PILER-CR | 2319985-2320020 | 36 | NZ_CP013700 | Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence | 156752-156787 | 3 | 0.917 |
NC_017299_6 | 6.6|2319985|36|NC_017299|PILER-CR | 2319985-2320020 | 36 | NC_012654 | Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence | 110413-110448 | 3 | 0.917 |
NC_017299_6 | 6.6|2319985|36|NC_017299|PILER-CR | 2319985-2320020 | 36 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 23508-23543 | 3 | 0.917 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | NZ_CP023496 | Staphylococcus simulans strain FDAARGOS_383 plasmid unnamed, complete sequence | 119840-119867 | 4 | 0.857 |
NC_017299_4 | 4.2|2312954|37|NC_017299|CRISPRCasFinder | 2312954-2312990 | 37 | NZ_CP020425 | Clostridioides difficile strain FDAARGOS_267 plasmid unnamed1, complete sequence | 44200-44236 | 5 | 0.865 |
NC_017299_4 | 4.2|2312954|37|NC_017299|CRISPRCasFinder | 2312954-2312990 | 37 | FN668942 | Clostridium difficile BI1 plasmid pCDBI1, complete sequence | 42934-42970 | 5 | 0.865 |
NC_017299_4 | 4.2|2312954|37|NC_017299|CRISPRCasFinder | 2312954-2312990 | 37 | NZ_CP011969 | Clostridioides difficile ATCC 9689 = DSM 1296 plasmid unnamed, complete sequence | 39522-39558 | 5 | 0.865 |
NC_017299_4 | 4.2|2312954|37|NC_017299|CRISPRCasFinder | 2312954-2312990 | 37 | NZ_CP029156 | Clostridioides difficile strain CD161 plasmid unnamed2, complete sequence | 3-39 | 5 | 0.865 |
NC_017299_4 | 4.2|2312954|37|NC_017299|CRISPRCasFinder | 2312954-2312990 | 37 | NZ_CP029153 | Clostridioides difficile strain CDT4 plasmid unnamed1, complete sequence | 42640-42676 | 5 | 0.865 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP011350 | Bacillus thuringiensis strain YC-10 plasmid pYC1, complete sequence | 34022-34051 | 5 | 0.833 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP004877 | Bacillus thuringiensis serovar kurstaki str. HD-1 plasmid pBMB431, complete sequence | 373788-373817 | 5 | 0.833 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP004860 | Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB422, complete sequence | 385449-385478 | 5 | 0.833 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP053953 | Bacillus cereus strain FDAARGOS_798 plasmid unnamed2, complete sequence | 257625-257654 | 5 | 0.833 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP010090 | Bacillus thuringiensis serovar galleriae strain 4G5 plasmid pBMB426, complete sequence | 387720-387749 | 5 | 0.833 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP053950 | Bacillus cereus strain FDAARGOS_799 plasmid unnamed2, complete sequence | 151872-151901 | 5 | 0.833 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_CP007616 | Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB400, complete sequence | 409186-409215 | 5 | 0.833 |
NC_017299_3 | 3.4|2310694|34|NC_017299|CRISPRCasFinder | 2310694-2310727 | 34 | NC_021292 | Vibrio parahaemolyticus strain v110 plasmid, complete sequence | 3251-3284 | 6 | 0.824 |
NC_017299_3 | 3.4|2310694|34|NC_017299|CRISPRCasFinder | 2310694-2310727 | 34 | NC_011797 | Vibrio fluvialis strain BD146 plasmid pBD146, complete sequence | 6811-6844 | 6 | 0.824 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | LC168164 | Tenacibaculum phage pT24 DNA, complete genome | 36142-36169 | 6 | 0.786 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | NZ_CP013700 | Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence | 218170-218197 | 6 | 0.786 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | NZ_CP045269 | Bacillus megaterium strain FDU301 plasmid pFDU301G, complete sequence | 18092-18119 | 6 | 0.786 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | NZ_CP013684 | Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence | 219024-219051 | 6 | 0.786 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | MN694464 | Marine virus AFVG_250M526, complete genome | 21991-22018 | 6 | 0.786 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | MN694042 | Marine virus AFVG_250M538, complete genome | 31267-31294 | 6 | 0.786 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MG264739 | UNVERIFIED: Enterococcus phage phiNASRA1, complete genome | 23423-23452 | 6 | 0.8 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MG264739 | UNVERIFIED: Enterococcus phage phiNASRA1, complete genome | 23399-23428 | 6 | 0.8 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MN855763 | Myoviridae sp. isolate 210, complete genome | 165195-165224 | 6 | 0.8 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MG264739 | UNVERIFIED: Enterococcus phage phiNASRA1, complete genome | 23399-23428 | 6 | 0.8 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NC_042040 | Rhodococcus phage Trina, complete genome | 128989-129018 | 6 | 0.8 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MN855763 | Myoviridae sp. isolate 210, complete genome | 165195-165224 | 6 | 0.8 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MT778839 | Rhizobium phage P9VFCI, complete genome | 101804-101833 | 6 | 0.8 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | NZ_CP041977 | Bacillus pacificus strain NCCP 15909 plasmid unnamed2, complete sequence | 6280-6307 | 7 | 0.75 |
NC_017299_6 | 6.2|2319918|28|NC_017299|CRISPRCasFinder | 2319918-2319945 | 28 | NC_018499 | Bacillus cereus FRI-35 plasmid p03, complete sequence | 13127-13154 | 7 | 0.75 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MK605246 | Nodularia phage vB_NspS-kac68v162, complete genome | 17947-17976 | 7 | 0.767 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MK605244 | Nodularia phage vB_NspS-kac65v162, complete genome | 16693-16722 | 7 | 0.767 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | KU230356 | Bacteriophage vB_NpeS-2AV2, complete genome | 16530-16559 | 7 | 0.767 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MK605242 | Nodularia phage vB_NspS-kac65v151, complete genome | 16694-16723 | 7 | 0.767 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | NC_048757 | Nodularia phage vB_NspS-kac68v161, complete genome | 17848-17877 | 7 | 0.767 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MK605243 | Nodularia phage vB_NspS-kac65v161, complete genome | 16694-16723 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_KY303941 | Enterococcus faecalis strain 3 plasmid pGTC3, complete sequence | 22282-22311 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NZ_AP018540 | Enterococcus faecalis strain KUB3006 plasmid pKUB3006-2, complete sequence | 24475-24504 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MT074461 | Salmonella phage smaug, complete genome | 104173-104202 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MT074447 | Salmonella phage phagemcphageface, complete genome | 95963-95992 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NC_010856 | Candidatus Phytoplasma australiense plasmid pPASb11, complete sequence | 1277-1306 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | CP019598 | Staphylococcus cohnii strain SNUDS-2 plasmid pSC-SNUDS-2-1, complete sequence | 29193-29222 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MH707430 | Bacillus phage BSP7, complete genome | 30322-30351 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NC_009130 | Staphylococcus sp. 693-2 plasmid pLEW6932, complete sequence | 45009-45038 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MT778837 | Rhizobium phage AF3, complete genome | 83564-83593 | 7 | 0.767 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NC_025429 | Rhizobium phage vB_RleM_P10VF, complete genome | 70566-70595 | 7 | 0.767 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | MH884508 | Bacillus phage vB_BcoS-136, complete genome | 8277-8306 | 8 | 0.733 |
NC_017299_9 | 9.1|2446916|30|NC_017299|CRT | 2446916-2446945 | 30 | KP942676 | Pectobacterium carotovorum plasmid Drgb1, complete sequence | 100833-100862 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MT119359 | Enterococcus phage heks, complete genome | 10737-10766 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MK125140 | Enterococcus phage Nonaheksakonda, complete genome | 6254-6283 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MT774409 | CrAssphage cr131_1, complete genome | 26293-26322 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MN549360 | Rhizobium phage RL38J1, complete genome | 18881-18910 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NC_019775 | Anabaena cylindrica PCC 7122 plasmid pANACY.06, complete sequence | 19857-19886 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MK605246 | Nodularia phage vB_NspS-kac68v162, complete genome | 95907-95936 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MK605244 | Nodularia phage vB_NspS-kac65v162, complete genome | 94581-94610 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | KU230356 | Bacteriophage vB_NpeS-2AV2, complete genome | 91288-91317 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MK605242 | Nodularia phage vB_NspS-kac65v151, complete genome | 94258-94287 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | NC_048757 | Nodularia phage vB_NspS-kac68v161, complete genome | 97300-97329 | 8 | 0.733 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MK605243 | Nodularia phage vB_NspS-kac65v161, complete genome | 94292-94321 | 8 | 0.733 |
NC_017299_4 | 4.1|2312890|34|NC_017299|CRISPRCasFinder | 2312890-2312923 | 34 | NZ_CP029455 | Bacillus cereus strain FORC087 plasmid pFORC087.1, complete sequence | 437444-437477 | 9 | 0.735 |
NC_017299_4 | 4.1|2312890|34|NC_017299|CRISPRCasFinder | 2312890-2312923 | 34 | NZ_CP016590 | Bacillus thuringiensis strain KNU-07 plasmid pBTKNU07-02, complete sequence | 113232-113265 | 9 | 0.735 |
NC_017299_9 | 9.3|2447000|30|NC_017299|CRT | 2447000-2447029 | 30 | MK047642 | Phage NG55, complete genome | 25164-25193 | 9 | 0.7 |
NC_017299_1 | 1.1|848655|43|NC_017299|CRISPRCasFinder | 848655-848697 | 43 | KM983327 | Clostridium phage phiCT453A, complete genome | 6301-6343 | 12 | 0.721 |
1. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 0, identity: 1.0
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatattacaaaagaagttagaaaatcatac Protospacer ************************************
2. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 0, identity: 1.0
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatattacaaaagaagttagaaaatcatac Protospacer ************************************
3. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 0, identity: 1.0
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatattacaaaagaagttagaaaatcatac Protospacer ************************************
4. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NC_025146 (Clostridium botulinum plasmid pCB111 DNA, complete sequence, strain: 111) position: , mismatch: 0, identity: 1.0
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatattacaaaagaagttagaaaatcatac Protospacer ************************************
5. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 1, identity: 0.972
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatattacaaaagaagttagaaaatcataa Protospacer ***********************************
6. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 1, identity: 0.972
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatattacaaaagaagttagaaaatcataa Protospacer ***********************************
7. spacer 3.1|2310692|36|NC_017299|PILER-CR matches to NZ_CP013709 (Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence) position: , mismatch: 2, identity: 0.944
gtaggtggaaaaggtgcaaaaggtggagtaaactta CRISPR spacer gtaggtggcaaaggtgcaaaaggtggagtaaacttt Protospacer ******** **************************
8. spacer 3.1|2310692|36|NC_017299|PILER-CR matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 2, identity: 0.944
gtaggtggaaaaggtgcaaaaggtggagtaaactta CRISPR spacer gtaggtggcaaaggtgcaaaaggtggagtaaacttt Protospacer ******** **************************
9. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NZ_CP013709 (Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence) position: , mismatch: 2, identity: 0.941
aggtggaaaaggtgcaaaaggtggagtaaactta CRISPR spacer aggtggcaaaggtgcaaaaggtggagtaaacttt Protospacer ****** **************************
10. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 2, identity: 0.941
aggtggaaaaggtgcaaaaggtggagtaaactta CRISPR spacer aggtggcaaaggtgcaaaaggtggagtaaacttt Protospacer ****** **************************
11. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 2, identity: 0.944
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaagggagataatc Protospacer **********************************
12. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 2, identity: 0.944
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaagggagacaatg Protospacer ******************************.****
13. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 2, identity: 0.944
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaagggagataatc Protospacer **********************************
14. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 2, identity: 0.944
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaagggagacaatg Protospacer ******************************.****
15. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013709 (Clostridium botulinum strain F634 plasmid pRSJ2_2, complete sequence) position: , mismatch: 2, identity: 0.944
atttatagaagatggtacatatacaattatttattg CRISPR spacer atttatagaggatggtacatatacaattatctattg Protospacer *********.********************.*****
16. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013682 (Clostridium botulinum strain 1169 plasmid pRSJ8_1, complete sequence) position: , mismatch: 2, identity: 0.944
atttatagaagatggtacatatacaattatttattg CRISPR spacer atttatagaggatggtacatatacaattatctattg Protospacer *********.********************.*****
17. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013295 (Clostridium botulinum strain CDC_54064 plasmid pNPD1_1, complete sequence) position: , mismatch: 2, identity: 0.944
atttatagaagatggtacatatacaattatttattg CRISPR spacer atttatagaggatggtacatatacaattatctattg Protospacer *********.********************.*****
18. spacer 7.3|2333272|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 2, identity: 0.944
atttatagaagatggtacatatacaattatttattg CRISPR spacer atttatagaggatggtacatatacaattatctattg Protospacer *********.********************.*****
19. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 2, identity: 0.944
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatactacaaaagaagttagaaaataatac Protospacer **********.******************** ****
20. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 2, identity: 0.944
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatactacaaaaaaagttagaaaatcatac Protospacer **********.*******.*****************
21. spacer 7.8|2333603|36|NC_017299|CRT,PILER-CR,CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 2, identity: 0.944
tatattaatattacaaaagaagttagaaaatcatac CRISPR spacer tatattaatactacaaaagaagttagaaaataatac Protospacer **********.******************** ****
22. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP045607 (Bacillus cereus strain SB1 plasmid p1, complete sequence) position: , mismatch: 2, identity: 0.933
tggtttatcttctggtttatcctctggttt CRISPR spacer tggtttttcttctggtttttcctctggttt Protospacer ****** *********** ***********
23. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaaggtagataatc Protospacer ************************** *******
24. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaggcaggtaagggagataata Protospacer ***************.******************.
25. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaaggtagataatc Protospacer ************************** *******
26. spacer 6.3|2319975|36|NC_017299|CRISPRCasFinder matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggcaagggagacaatg Protospacer *********************.********.****
27. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaaggtagataatc Protospacer ************************** *******
28. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaggcaggtaagggagataata Protospacer ***************.******************.
29. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggtaaggtagataatc Protospacer ************************** *******
30. spacer 6.6|2319985|36|NC_017299|PILER-CR matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.917
caggatattcaatagaagcaggtaagggagataatg CRISPR spacer aaggatattcaatagaagcaggcaagggagacaatg Protospacer *********************.********.****
31. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP023496 (Staphylococcus simulans strain FDAARGOS_383 plasmid unnamed, complete sequence) position: , mismatch: 4, identity: 0.857
tattttctattcttaactctttatcttc CRISPR spacer tattttcttttcttaactcattatcatt Protospacer ******** ********** ***** *.
32. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP020425 (Clostridioides difficile strain FDAARGOS_267 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.865
ctagaactgattttgacaaatatgtagaccatgctat CRISPR spacer ctagaactgattttgataaatatatagaccatatgat Protospacer ****************.******.********.. **
33. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to FN668942 (Clostridium difficile BI1 plasmid pCDBI1, complete sequence) position: , mismatch: 5, identity: 0.865
ctagaactgattttgacaaatatgtagaccatgctat CRISPR spacer ctagaactgattttgataaatatatagaccatatgat Protospacer ****************.******.********.. **
34. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP011969 (Clostridioides difficile ATCC 9689 = DSM 1296 plasmid unnamed, complete sequence) position: , mismatch: 5, identity: 0.865
ctagaactgattttgacaaatatgtagaccatgctat CRISPR spacer ctagaactgattttgataaatatatagaccatatgat Protospacer ****************.******.********.. **
35. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP029156 (Clostridioides difficile strain CD161 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.865
ctagaactgattttgacaaatatgtagaccatgctat CRISPR spacer ctagaactgattttgataaatatatagaccatatgat Protospacer ****************.******.********.. **
36. spacer 4.2|2312954|37|NC_017299|CRISPRCasFinder matches to NZ_CP029153 (Clostridioides difficile strain CDT4 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.865
ctagaactgattttgacaaatatgtagaccatgctat CRISPR spacer ctagaactgattttgataaatatatagaccatatgat Protospacer ****************.******.********.. **
37. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP011350 (Bacillus thuringiensis strain YC-10 plasmid pYC1, complete sequence) position: , mismatch: 5, identity: 0.833
tggttta---tcttctggtttatcctctggttt CRISPR spacer ---tttaggctgttctggtttttcctctggttt Protospacer **** * ********* ***********
38. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP004877 (Bacillus thuringiensis serovar kurstaki str. HD-1 plasmid pBMB431, complete sequence) position: , mismatch: 5, identity: 0.833
tggttta---tcttctggtttatcctctggttt CRISPR spacer ---tttaggctgttctggtttttcctctggttt Protospacer **** * ********* ***********
39. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP004860 (Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB422, complete sequence) position: , mismatch: 5, identity: 0.833
tggttta---tcttctggtttatcctctggttt CRISPR spacer ---tttaggctgttctggtttttcctctggttt Protospacer **** * ********* ***********
40. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP053953 (Bacillus cereus strain FDAARGOS_798 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.833
tggttta---tcttctggtttatcctctggttt CRISPR spacer ---tttaggctgttctggtttttcctctggttt Protospacer **** * ********* ***********
41. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP010090 (Bacillus thuringiensis serovar galleriae strain 4G5 plasmid pBMB426, complete sequence) position: , mismatch: 5, identity: 0.833
tggttta---tcttctggtttatcctctggttt CRISPR spacer ---tttaggctgttctggtttttcctctggttt Protospacer **** * ********* ***********
42. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP053950 (Bacillus cereus strain FDAARGOS_799 plasmid unnamed2, complete sequence) position: , mismatch: 5, identity: 0.833
tggttta---tcttctggtttatcctctggttt CRISPR spacer ---tttaggctgttctggtttttcctctggttt Protospacer **** * ********* ***********
43. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_CP007616 (Bacillus thuringiensis serovar kurstaki str. YBT-1520 plasmid pBMB400, complete sequence) position: , mismatch: 5, identity: 0.833
tggttta---tcttctggtttatcctctggttt CRISPR spacer ---tttaggctgttctggtttttcctctggttt Protospacer **** * ********* ***********
44. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NC_021292 (Vibrio parahaemolyticus strain v110 plasmid, complete sequence) position: , mismatch: 6, identity: 0.824
aggtggaaaaggtgcaaaaggtgga-gtaaactta CRISPR spacer gggtggaaaagtttcaaaaggtggaggtagacct- Protospacer .********** * *********** ***.**.*
45. spacer 3.4|2310694|34|NC_017299|CRISPRCasFinder matches to NC_011797 (Vibrio fluvialis strain BD146 plasmid pBD146, complete sequence) position: , mismatch: 6, identity: 0.824
aggtggaaaaggtgcaaaaggtgga-gtaaactta CRISPR spacer gggtggaaaagtttcaaaaggtggaggtagacct- Protospacer .********** * *********** ***.**.*
46. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to LC168164 (Tenacibaculum phage pT24 DNA, complete genome) position: , mismatch: 6, identity: 0.786
tattttctattcttaactctttatcttc CRISPR spacer tattttctattctttattctttattagt Protospacer ************** *.*******. .
47. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 6, identity: 0.786
tattttctattcttaactctttatcttc CRISPR spacer ctttttctattgttaactctttaatatc Protospacer . ********* *********** . **
48. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP045269 (Bacillus megaterium strain FDU301 plasmid pFDU301G, complete sequence) position: , mismatch: 6, identity: 0.786
tattttctattcttaactctttatcttc CRISPR spacer gattttctcttcttaactctttggtatc Protospacer ******* *************. . **
49. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 6, identity: 0.786
tattttctattcttaactctttatcttc CRISPR spacer ctttttctattgttaactctttaatatc Protospacer . ********* *********** . **
50. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to MN694464 (Marine virus AFVG_250M526, complete genome) position: , mismatch: 6, identity: 0.786
tattttctattcttaactctttatcttc CRISPR spacer gggtttcgattcttaactctctatctac Protospacer . **** ************.***** *
51. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to MN694042 (Marine virus AFVG_250M538, complete genome) position: , mismatch: 6, identity: 0.786
tattttctattcttaactctttatcttc CRISPR spacer ttctttcttttcttaactctttaactat Protospacer * .***** ************** ** .
52. spacer 9.1|2446916|30|NC_017299|CRT matches to MG264739 (UNVERIFIED: Enterococcus phage phiNASRA1, complete genome) position: , mismatch: 6, identity: 0.8
tggtttatcctctggtttatcctctggctt CRISPR spacer tggtttctcctctggtttctcctcatcttt Protospacer ****** *********** ***** .**
53. spacer 9.1|2446916|30|NC_017299|CRT matches to MG264739 (UNVERIFIED: Enterococcus phage phiNASRA1, complete genome) position: , mismatch: 6, identity: 0.8
tggtttatcctctggtttatcctctggctt CRISPR spacer aggctcttcctctggtttctcctctggttt Protospacer **.*. *********** ********.**
54. spacer 9.1|2446916|30|NC_017299|CRT matches to MN855763 (Myoviridae sp. isolate 210, complete genome) position: , mismatch: 6, identity: 0.8
tggtttatcctctggtttatcctctggctt CRISPR spacer tttcttatcttctggtttatcttctggctc Protospacer * .*****.***********.*******.
55. spacer 9.3|2447000|30|NC_017299|CRT matches to MG264739 (UNVERIFIED: Enterococcus phage phiNASRA1, complete genome) position: , mismatch: 6, identity: 0.8
tggtttatcttctggtttatcctctggttt CRISPR spacer aggctcttcctctggtttctcctctggttt Protospacer **.*. **.******** ***********
56. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_042040 (Rhodococcus phage Trina, complete genome) position: , mismatch: 6, identity: 0.8
tggtttatcttctggtttatcctctggttt CRISPR spacer ctttctatcttctggtttatcccctggtat Protospacer . *.*****************.***** *
57. spacer 9.3|2447000|30|NC_017299|CRT matches to MN855763 (Myoviridae sp. isolate 210, complete genome) position: , mismatch: 6, identity: 0.8
tggtttatcttctggtttatcctctggttt CRISPR spacer tttcttatcttctggtttatcttctggctc Protospacer * .*****************.*****.*.
58. spacer 9.3|2447000|30|NC_017299|CRT matches to MT778839 (Rhizobium phage P9VFCI, complete genome) position: , mismatch: 6, identity: 0.8
--tggtttatcttctggtttatcctctggttt CRISPR spacer atcgg--aatcttctggtttatccactggttc Protospacer .** **************** ******.
59. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NZ_CP041977 (Bacillus pacificus strain NCCP 15909 plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.75
tattttctattcttaactctttatcttc CRISPR spacer gattttctatttttaactttttatacaa Protospacer **********.******.***** .
60. spacer 6.2|2319918|28|NC_017299|CRISPRCasFinder matches to NC_018499 (Bacillus cereus FRI-35 plasmid p03, complete sequence) position: , mismatch: 7, identity: 0.75
tattttctattcttaactctttatcttc CRISPR spacer gattttctatttttaactttttatacaa Protospacer **********.******.***** .
61. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605246 (Nodularia phage vB_NspS-kac68v162, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcctctggtttatcctctggctt CRISPR spacer cagtttatcctctagtttatccttttcttt Protospacer ..***********.*********.* .**
62. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605244 (Nodularia phage vB_NspS-kac65v162, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcctctggtttatcctctggctt CRISPR spacer cagtttatcctctagtttatccttttcttt Protospacer ..***********.*********.* .**
63. spacer 9.1|2446916|30|NC_017299|CRT matches to KU230356 (Bacteriophage vB_NpeS-2AV2, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcctctggtttatcctctggctt CRISPR spacer cagtttatcctctagtttatccttttcttt Protospacer ..***********.*********.* .**
64. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605242 (Nodularia phage vB_NspS-kac65v151, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcctctggtttatcctctggctt CRISPR spacer cagtttatcctctagtttatccttttcttt Protospacer ..***********.*********.* .**
65. spacer 9.1|2446916|30|NC_017299|CRT matches to NC_048757 (Nodularia phage vB_NspS-kac68v161, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcctctggtttatcctctggctt CRISPR spacer cagtttatcctctagtttatccttttcttt Protospacer ..***********.*********.* .**
66. spacer 9.1|2446916|30|NC_017299|CRT matches to MK605243 (Nodularia phage vB_NspS-kac65v161, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcctctggtttatcctctggctt CRISPR spacer cagtttatcctctagtttatccttttcttt Protospacer ..***********.*********.* .**
67. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_KY303941 (Enterococcus faecalis strain 3 plasmid pGTC3, complete sequence) position: , mismatch: 7, identity: 0.767
tggtt--tatcttctggtttatcctctggttt CRISPR spacer --attagaatcttctggttcatcctctggtgg Protospacer .** ***********.**********
68. spacer 9.3|2447000|30|NC_017299|CRT matches to NZ_AP018540 (Enterococcus faecalis strain KUB3006 plasmid pKUB3006-2, complete sequence) position: , mismatch: 7, identity: 0.767
tggtt--tatcttctggtttatcctctggttt CRISPR spacer --attagaatcttcttgtttatcctctggtgg Protospacer .** ******* **************
69. spacer 9.3|2447000|30|NC_017299|CRT matches to MT074461 (Salmonella phage smaug, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcttctggtttatcctctggttt CRISPR spacer tgcttaatcttctggtttatcctccaggaa Protospacer ** ** ******************..*
70. spacer 9.3|2447000|30|NC_017299|CRT matches to MT074447 (Salmonella phage phagemcphageface, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcttctggtttatcctctggttt CRISPR spacer tgcttaatcttctggtttatcctccaggaa Protospacer ** ** ******************..*
71. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_010856 (Candidatus Phytoplasma australiense plasmid pPASb11, complete sequence) position: , mismatch: 7, identity: 0.767
tggtttatcttctggtttatcctctggttt CRISPR spacer ttgtttatcttctgttttatcttcttttgg Protospacer * ************ ******.*** *
72. spacer 9.3|2447000|30|NC_017299|CRT matches to CP019598 (Staphylococcus cohnii strain SNUDS-2 plasmid pSC-SNUDS-2-1, complete sequence) position: , mismatch: 7, identity: 0.767
tggtttatcttctggtttatcctctggttt--- CRISPR spacer gggtttatcttctggtttaccc---aattttaa Protospacer ******************.** ..***
73. spacer 9.3|2447000|30|NC_017299|CRT matches to MH707430 (Bacillus phage BSP7, complete genome) position: , mismatch: 7, identity: 0.767
tggtttatcttctggtttatcctctggttt CRISPR spacer agctgcttcttcttgtttagcctctggttt Protospacer * * . ****** ***** **********
74. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_009130 (Staphylococcus sp. 693-2 plasmid pLEW6932, complete sequence) position: , mismatch: 7, identity: 0.767
tggtttatcttctggtttatcctctggttt--- CRISPR spacer gggtttatcttctggtttaccc---aattttaa Protospacer ******************.** ..***
75. spacer 9.3|2447000|30|NC_017299|CRT matches to MT778837 (Rhizobium phage AF3, complete genome) position: , mismatch: 7, identity: 0.767
--tggtttatcttctggtttatcctctggttt CRISPR spacer atcgg--aatcttctggttcatccactggttc Protospacer .** ***********.**** ******.
76. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_025429 (Rhizobium phage vB_RleM_P10VF, complete genome) position: , mismatch: 7, identity: 0.767
--tggtttatcttctggtttatcctctggttt CRISPR spacer atcgg--aatcttctggttcatccactggttc Protospacer .** ***********.**** ******.
77. spacer 9.1|2446916|30|NC_017299|CRT matches to MH884508 (Bacillus phage vB_BcoS-136, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcctctggtttatcctctggctt CRISPR spacer ctatttatcctctggtttatactctaattc Protospacer . .***************** ****...*.
78. spacer 9.1|2446916|30|NC_017299|CRT matches to KP942676 (Pectobacterium carotovorum plasmid Drgb1, complete sequence) position: , mismatch: 8, identity: 0.733
tggtttatcctctggtttatcctctggctt CRISPR spacer cattcactactctggtttatcttctggctt Protospacer .. *. * ************.********
79. spacer 9.3|2447000|30|NC_017299|CRT matches to MT119359 (Enterococcus phage heks, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctctccatcttttggtttatcctctgtttg Protospacer . *..*****.************** **
80. spacer 9.3|2447000|30|NC_017299|CRT matches to MK125140 (Enterococcus phage Nonaheksakonda, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctctccatcttttggtttatcctctgtttg Protospacer . *..*****.************** **
81. spacer 9.3|2447000|30|NC_017299|CRT matches to MT774409 (CrAssphage cr131_1, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer aggtttatctgctggtttatcatcatcctc Protospacer ********* ********** ** .*.
82. spacer 9.3|2447000|30|NC_017299|CRT matches to MN549360 (Rhizobium phage RL38J1, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer atcgtgatcttctggttcatccactggttc Protospacer * ***********.**** ******.
83. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_019775 (Anabaena cylindrica PCC 7122 plasmid pANACY.06, complete sequence) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer cttatcatcttctggtttatcgtctgggta Protospacer . *.*************** ***** *
84. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605246 (Nodularia phage vB_NspS-kac68v162, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctcctcttcttcagttttatcctctggttt Protospacer . .*. ***** * ***************
85. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605244 (Nodularia phage vB_NspS-kac65v162, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctcctcttcttcagttttatcctctggttt Protospacer . .*. ***** * ***************
86. spacer 9.3|2447000|30|NC_017299|CRT matches to KU230356 (Bacteriophage vB_NpeS-2AV2, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctcctcttcttcagttttatcctctggttt Protospacer . .*. ***** * ***************
87. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605242 (Nodularia phage vB_NspS-kac65v151, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctcctcttcttcagttttatcctctggttt Protospacer . .*. ***** * ***************
88. spacer 9.3|2447000|30|NC_017299|CRT matches to NC_048757 (Nodularia phage vB_NspS-kac68v161, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctcctcttcttcagttttatcctctggttt Protospacer . .*. ***** * ***************
89. spacer 9.3|2447000|30|NC_017299|CRT matches to MK605243 (Nodularia phage vB_NspS-kac65v161, complete genome) position: , mismatch: 8, identity: 0.733
tggtttatcttctggtttatcctctggttt CRISPR spacer ctcctcttcttcagttttatcctctggttt Protospacer . .*. ***** * ***************
90. spacer 4.1|2312890|34|NC_017299|CRISPRCasFinder matches to NZ_CP029455 (Bacillus cereus strain FORC087 plasmid pFORC087.1, complete sequence) position: , mismatch: 9, identity: 0.735
tttatatgaaaggaatagatataagtatgcataa CRISPR spacer ttaatataaaaggaatagatataatattttttag Protospacer ** ****.**************** * . **.
91. spacer 4.1|2312890|34|NC_017299|CRISPRCasFinder matches to NZ_CP016590 (Bacillus thuringiensis strain KNU-07 plasmid pBTKNU07-02, complete sequence) position: , mismatch: 9, identity: 0.735
tttatatgaaaggaatagatataagtatgcataa CRISPR spacer ttaatataaaaggaatagatataatattttttag Protospacer ** ****.**************** * . **.
92. spacer 9.3|2447000|30|NC_017299|CRT matches to MK047642 (Phage NG55, complete genome) position: , mismatch: 9, identity: 0.7
tggtttatcttctggtttatcctctggttt CRISPR spacer atctttatcttctggttcatcatctgtcgc Protospacer **************.*** **** . .
93. spacer 1.1|848655|43|NC_017299|CRISPRCasFinder matches to KM983327 (Clostridium phage phiCT453A, complete genome) position: , mismatch: 12, identity: 0.721
tttaaattttgaattaaattctgctgtaattttcataattttt CRISPR spacer ctcctcactactattaaattctgctgtaattttcatatttatt Protospacer .*. .* ************************* ** **
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
188147 : 197750
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NC_017299|188147:197750|DBSCAN-SWA CATGAGAAGATTAAATAGGTATACTAATATTAATAAGTTAGTTATAACAATTATAAGTACTGTGTTTATTATGTTAATTTTAAGTTTTGCTTTATCCTTTAGTGAAAACAAAGAGCAAAAAGTTAAGGAAACTATAAGTAAGGTTAAGTTAGATCAGAAAAGACAAGAAGAAAAGATTGATATAAATAAAAAATATAAAGTAAAATCAGAACCACAAGTTAGGGTTTACTTTGTTAATGAAAAAGTGGTAAGATCAATACCCTTAGAGGAATATGTAAAGGGCGTTGTTTCAGCTGAAATGCCAGCGGAGTTTCATATAGAAGCATTGAAAGCTCAAGCAGTAGCGGCTAGAACTTATGCTTTAGCTCATATGAAAGGGTTCGGCGAAAATCAATATAATAAAAGAATAAATGCAGACGTGTGTGATAGTGTTCAATCTCAAGTTTTTATGCCTAAGGATAAAAGAATAAAATCTTGGCCAAAGGAAAAGAGAAATGAATATTGGAACAAAATAGAAGAAAGTGTTAATAGCACTAAGGGGAATGTACTTGTATATAACAATGAAATAGTTATGGCTCCATATTATTTTGCTACTAGTAATGGAAAAACAGAAGATAGTGAAAATGTATTTAATAGTGAAGTTCCTTATTTAAAAAGTGTAAAAAGTCCAGGAGAAGAGAAGGCTCCTAAATTTAAGAGTAGCAAAAAAATTTCTTATGATCAATTTATAAAAATTATAAAAACTCAATATCCTAAGTGTACTATAAATAAAAAAGATATAAATAAAAAAATAATAATAAAGGATAAAACAGAAAGTGGTAGTATTAGAAAAATTAAAATAGATAATATAGAAATTAAAGGTACAGAATTTAGAAAAATATTAGGTCTAAATTCATCTAAATTTTCATTAGAATTTAAAGATAACTATCTTATAGTAAATTGTAATGGGTATGGTCATAATGTTGGAATGAGTCAATGGGGAGCAAATAGTATGGGTAAATCAGGGAAAAAATATGATTATATACTTAAACATTACTATAAAGGAGTAAATATGGAAATTCTCAAATATAGTGATTAGTATTAATAAATTTATGGATTAACATCTATAGCTATAAGTTTTTTATATAACATAGAACTATAAACAGAGTTCTTGGCTTTAGAGGGAGTCTTTACTCCCATTAAAGCTTATTAACAGACTTCTTAGGAGTTTTACTCCTTAGAAGTCGTTATCATTTAGGGGAAATCGTTATCCAGAGACGTAGCCGCTCTTTATTCCCACTTTGAAGAAGATGAGAGTATTAGAGTGGTAGTCATCGGATAAAATTTATTTATAAATATATAAAAGTATATGTCTAGTCTAAGAATAGATTTAATTTTAATATAACAAAAATAAAAAATATACAGGATAGAGCTAATAACAAGCTTTATGTAAAGTGTATTTTTTTATCTTTGTAGTGTCAAAATTAAATCTATTTTATTTTGAGACATCTTTTTTTATTTTTTGATTATTTAAGTTACAATTTAAAAATTTACAAGCACCAACAATTAGATATCAAATATAACAAAAGTAATGTTGAATTTTAGGGAAAAAAAGGGAAAATTTCTTAATAAAATATGTATTTTTTGCTATCTACTGGACAAACTAAAAAAAGGAGGTGTTGATATGGAAAAAAAACCATCAAATAAAAAATCAAACTTTTTTAAGAAGGAGGGGTTTTATGTAGTTTTATTCCTTTGTCTTTGCATAGTAGCTGCTATAGCAGCAATTTCAGTGAAGAGTAATTCACATGTAAAGAAAGAACCTATTGAAAATAAAGTGGTTGAAAATAAAAAAGAAAAAGATTCGGCAAAGGCTATAGAAGGGAATTCTAAAAGTTATAATAATGCCCTTGAAGTAAAAAAAGAAGAAAACAAAGAAAATGAAAAGAGCAAACAAAATGAAAAGGAAACAGCTCAAGTTTCAAAAGCTGAAAGTAACAGTTTTATAAAACCAGTAGAAGGAACTTTAGCAAGAGTATATTCAGAAGATCCAGTATTTTGGAGTTCAACCTCAAGTTATAGAGCTAATTTAGGATTAGATATAAAAGCTAAACTAAATTCACCTGTTTGTTCTATTGCAGATGGAAAGGTTGAAGATATAGTTACTTCAAGTCAAGATGGTGTAAAGGTAACTGTTAATCATCAAAATGGAATAAAGAGTGTATATGCTAATTTAGATCCTAAAGTTAAAGTTACTAAAGACCAGCAAATAAAGCAAGGTTGTTTAATAGGTAATGTAGGAAAGACTACATTAAGAGCAGCATATGAAAAATATGGAGATCACTTGCATTTTGCCATGATGAAGGGAAATAAATACATAAATCCTTCAAAACATATTAAATATTAATAAGGATGCCATTTTCCGCTTTTATGCGGAAAGTGGCTAAATATAAATGAATTTAATCCTTTATATAAGCATATTTATAACTATAAAGGGATTAAGGAGGTAGCACTTTGAAAGATTACATTGAAGAAAGAGTTCTTGAAGTGGCACACTATATTATAGATTCTAAAGCTACTATAAGAAAAACAGCCAAAGTTTTTGGAGTGAGTAAAAGTACAATACACAAAGATATGACGGAAAGGTTACCTAAAATAAACCCTCAAATCGCTGAAGAAGCAAAAGAAATATTAGATTATAATAAGGCAGAGAGGCATATAAGAGGTGGAAAAGCTACAAAGATGAAATATAAAGCTATTGAAGGTTAATTACATTCCTATTATAATGAGAATAGATAGTTATGAGAAAAATGTGAAATACTCTCATAATTTATATATAACTACAATAGAGTAGGAGTGGATACGGGAATGTTTTTTAGTGTAGGAACAGATATGGGAATTGATTTAGGGACAGCTACAGTACTTGTATATATGAAGGGAAAAGGTGTAATTTTAAATGAACCTTCAGTAGTGGCTATAGACAGAAACAAAAATAAGGTTTTAGCTGTTGGACAAGAAGCTAGAGAGATGATTGGTAGAACCCCAGGTAATATAGTAGCCATAAGGCCTATGAGGGATGGAGTAATATCAGATTATGATATTACTGAGAAAATGTTAAAGTATTTTATTGGAAAAGCTTGTGGAAAGAAAAAAATATCTGCACCAAGGGTAGTGATATGTATTCCATCAGAAGCTACAGAAGTTGAAAAAAGAGCTGTTATGGATGCGGCTAGAAATGCTGGAGCTAAGAAGGTATTTTTAATAGAAGAGCCTTTAGCAGCAGCTATTGGTGCAGATTTAGATATAACTAAGGCTAGCGGAAGTATGATTATAGATATTGGAGGAGGTACTACAGATATAGCGGTTATTTCTCTTGGGGGCATAGTAGTAAGATCGTCTATAAAAATAGCAGGGGACAAGTTTGACGATGCTGTAATAAAATATATAAGAAAAAAACACAAGCTTATGATAGGAGAAAGAACAGCTGAGGACTTAAAGATAAAAATAGGTTCTGCTTTCCGCAAAGGCGAGAATACATCAATGGATATAAGAGGAAGAGATTTAGTTACAGGATTACCCAAAAATTTAACTGTAACCTCAGATGAAATGAGAGAAGCCTTACAGGACACTGTAAATGCAATAGCAGAACTTACTCATTCAGTATTAGAAAAGACCCCACCTGAGCTATCAGCTGATATAGCAGATAAAGGTATAATAATGACAGGTGGAGGTGCACTGCTTAGTGGGCTTAGTGATTTAATAGAAAGTGTTAATAAAGTACCTGTACATATAGCAGAGAATCCGGTATCTTGTGTTGCAGAAGGAACTGGAAAAATGTTAGAGTATCTAGATAAGATGGGAATATCAGAATCCGGTGATGGATTGAATTTATTATAATATAACATAATAAATATAAATGACTACATATAAAATTAAAGCTCTTGAGTAATACTCATGAGCTTTAATTTTTATATTAATGCAAAATAATTAATAAACTATATCTGGTTATAATGGTATTTTTTTAAATATCTAATACATAACAGCATTGTAAAATTGAATTGGCAATAACTTTAGCTATATTTAATATTAAACTTAATCTAGTGTTAGCAGAAGTAAATATATCACAGTTTTCATTTGAATCTACGATACCAACAATGGAACAATCCCCAACTTTAGGAAGTGTTTTCCCAACGCCTTTTCCAGGCTGTATAGGAAAGTTTCTTACTTGGATTTGACCTATATTATCTTTATCACCAAGGCAAGCATCTATACCTATTATAGAACTATTAGGGTAGGAGTTTTTAATATTTTTTATAGTTTTCTCTATATTTAAAGCGTGTATAGGTTCATCTAAAGTTCCATATAATTTTAAAGGTATATTTTTATATCTTAATATGGTTCCAACTAAAGGTCCAAGGCAATCCCCTATACATCTATCTGTACCTATGCATATTATTATCGTATCTTTATTTAAATAATTTTTAAGAGTATTTGCTATTTTATAATAAGATAATGATTCCATATAATGAGTTTTCTCTATATTCAAAACACACCCCTCCTTATATTAATATATATGAATATAAGGAGGTAAATATTATTGGATTTTATCTTTGTCCCATAGGTTTATTTGATTAATATTGGTTAAGCAGCCAAGTAGTCTGTCTTTAACTTTAGGAATATCTTTTTCTAAAGTATAGGTAAGTTCTTTCATATATTGCCTTTTAGTGTTACCATTAGCCGGACAAGGATTTTTAATTATAGGTAAATCATATCTTTTAATCATACTTTTAATTGCTATTTCATCTATATATATCATAGACCTAATTATTGTTATGTTGGCTTTATTTAAATAAGTCTTTGGGGAAAAGCAACTTACCCTTCCTTCATATAACATAGACATTAATAAAGTTTCTATAGCATCATTTTTATGATGACCTAAGGCTATTTTGTTACATCCTAATTCTTTAGAATAATTATTTAAAGCCCCCCTCCTTAAATTAGCACATAAAGAACAAGGGTTTTTTTCTTTTCTTAAGTCAAAGACTATTTCTTTTATAGGGGTCTTATATATGTATAGTGGAACATTTATATTAGAGCATACATTTTCAAGAGGAGAAAAATCTGCTCCTGTCATTGTATCTAATGTTATAGCTATTAAATCAAATTTTTCAGGAGAAAAACTTTGATATTTTTTTAGTAGATGAAGTAAAACTATACTATCTTTTCCACCAGATAAACCAACAGCTATTTTATCTCCATTTTGTATTAGATTAAAATCTCCTACTGCTCTTCTAAGCTTTCCTAATAACTTTTGCATTATATTCCTCCCTAGTATATGTATAAATTTATATTATAAATATATTATAAATTAATACATATATATTACAAATAAATTTATCGAAATAAAATAGTGAGAAAAACAAAGAATTTAAGAGAAAAAACTATATATTTAGTATTAGAATTGATGTAAAGGCCATAAATTTTGTTTGAATTTATGTTGATAAATAGATATACTATTTCTTGTCGATACGACACAAAAAATATGCTGGCATGGCTCAATTGGTAGAGCAGCTGACTTGTAATCAGCAGGTTGTAGGTTCAAGTCCTATTGCCAGCTCCATATGTGGAGGAGTTCCCGAGTGGCCAAAGGGGGCAGACTGTAAATCTGTTGCGATTCGCTTCGATGGTTCGAATCCGTCCTCCTCCACCAAACATCTTTACTTAAAGTAAAGATGTTTTTATTTGCATATATATCATAATGTATATATTAATATTATAAGCACAATATTGACATGTATTTTTTAATATGATATGATTTTTAATATATAATAATAATAATAAACTCTTATCAAGAGAGGTGGAGGGAAAAGGGCCCTATGAAACCCGGCAACCAGTGATATTCACTAAGGTGCCAATTCCTGCAGTATTATCTGCAAGATAAGAGAGAGTAGTTAGACAATAACCTCTTCTTATTGAAGAGGTTTTATTTTTTTAGACAAAAATTGGTAATTAGGAGGAGTTAATGTGAGAAAGTTATTTACATCTGAATCAGTAACAGAAGGGCATCCAGATAAAATATGTGACCAAATTTCAGATGCAGTTTTAGATGCTATATTAGATAAAGATCCTAATGGAAGGGTTGCTTGCGAAACAGCAGTTACAACAGGAATGGTAATGGTAATGGGAGAGATATCAACAAAATGTTATGTTGATATACCAAAGTTAGTTAGAGAAACTATAAGAGGAATAGGATATGATAGAGCTAAATATGGATTTGATTGTGAGACTTGCTCTGTAATAACATCAATAGATGAACAATCAGTAGATATAGCCATGGGTGTTGATGAAGCTTTAGAATCTAAAAAAGGTGAAATGGATAAATTAGATGCTGTAGGCGCTGGAGATCAAGGTATGATGTTTGGTTTTGCTACAAACGAAACTAAGGAATATATGCCAATGCCTATAGAGATGGCCCACAAATTATCAAGAAGATTATCAGAAGTAAGAAAAAATGGTACATTACCATATTTAAGACCAGATGGAAAAACTCAAGTGACTGTAGAGTATGAGAATGGTAAACCTGTAAGAATAGATGCTATAGTTATTTCAACTCAACATGGTCCAGAAGTTTATTTAGAGCAAATAGAAAAGGATATTAAAGAACATGTAATAAAAGTTATAGTACCATCAGAGTTATTAGATGAAAATACTAAATATTTTATAAATCCAACAGGACGATTTGTAGTTGGTGGACCTCAAGGAGATTCAGGATTAACAGGAAGAAAAATAATAGTTGATACTTATGGTGGATATGGAAGACATGGTGGTGGAGCCTTTTCAGGTAAGGATCCAACAAAGGTCGATAGGTCTGCTGCATATGCTGCAAGATGGGTAGCTAAAAATTTAGTTGCAGCAGGGGTTGCTGATAAGCTAGAAATTCAGTTAGCTTATGCTATAGGGGTAGCTAAACCAGTATCTATTTCAGTTGATACATTTGGAACAGGTAAAATTACTGATGAAGAAATAGTTTCAATAGTAAATAAAGTATTTGATTTAAGACCTGGTGCTATAATAAGAGATTTAGACTTAAGAAGACCTATATATAAACAAGTTGCTGCCTATGGTCATTTTGGAAGAACAGATATAGATGTACCATGGGAAAGATTAGATAAAGTAGAGGAAATAAAAAAGCATATATAAATTAATATTAGTATTAATATGAAAAGGAATGGACATGATAACATGCCATTCCTTTATATTTTTTCATAATAATATGATATAATTGTTCTAAATGAATGGCTAAAATTAAAAAAGTATAGATTCCTATACTTATAAGCAGCGGTACTATGAATAATAATGATGGAATGAAAAAGATTAGGAGAGATTCTTTATGCAGGAAATACAGGGATTTATAGAGGATATACTTTTTAAAAATGATGAAAATGGGTATGTAGTGGCAAAAATAAGGAAGAAGAAAGAGCTTATAACCATAGTCGGATGTATGCCCTACATAACAGAAGGACAAAACTTAAAATTAAAAGGTGAATGGGTAATTCATCCACAATTTGGTAATCAATTCAAAGTAGAAATATGTGAAGAAATAGTACCCGATACTGTAGCTGGCATAGAAAGATATTTATCCTCAGGAATCATATCAGGTATAGGCCCAGTGACTGCAAAAAAAATTGTGAAAAAATTTGGAGAAGCAACATTAAATATATTAGACAATAATATAGAAAGATTAACAGAGATAGAGGGAATAGGAAAGAAGAAGATAGAAGTAATATATGATTCCTATATAAAACAAAATGAAGTGCGAAATATAATGATGTTTTTTCAAAATTACGGAGTTACACCTAAGCAATGCATGAAAGTTTATAAAAGATTTGGAGAAAATTCTATATCAATAGTTAAAGAGAATCCATATATACTTACGGAAGAAATAAGAGGAATAGGTTTCAAGACAGCAGATAAAATAGCTAGGAGCTTAGGAATAGCCTCTAATTCACCTTTTAGAATTCAGAGTGGAATAAATTATATAATAAATGGATTCTGTAGTTTAGGAAATACTTATATGCCTTTAGAGAGGCTTATAAGTGAGGCTATGGACATATTAGGAGTAAAAGAAGAAGAAATACATGAAAATATATATAATAATGTAGCAGAAAATAAATTAAAGATAGAAAAAGTAAAAGAACGAAGTTGTGTTTTTACTCTACCGTATTATTATTGCGAATTAGGAGTTACAAAAAAAATACTTAGTTTATCTTTGTCACAATATGATAATTTAAATATAAATATAGAAGACGAGATAGTGAGTTTTGAAAAAAATAATAATATAAAATTTCATGATTCTCAAAGAGAGGCTATAAAAGGTGCCTTAGAAAATGGAGTAGAAATAATAACAGGAGGCCCTGGTACAGGAAAAACAACTATTATTAATTGTATAACAGAGATATTTGAAAAAGCTAATATGAAAGTTTATATGGCAGCACCTACAGGAAGAGCGGCTAAAAGAATGTCTGAAACTACAGGTAGAGAAGCTAAAACAATACATAGGATGTTAGAAATGGGTGTATCTGAGGATGACACAGAAGAAGTTTTTTCTAAAGGTGAAGAAACTCCTTTAGAATGTGATGTAGTAATAATAGATGAAGCTTCCATGATAGATATAATATTAATGAATACACTGTTAAAGGCCATAGCTTTAGGTACAAGAATAATAATAGTTGGGGATGTAGATCAACTTCCTTCAGTAGGTCCAGGGAATGTATTAAGAGATTTAATAGAAAGTAAGTGTGTAAAGGTAGTTAGATTAAAGGAGATATTCAGACAATCTAAAGAAAGTATGATTATAGTAAATGCCCATAGAATAAATGATGGAGAGATGCCAATTATAAATAAAAAAGATAAAGATTTTTATTTTATAGAATGTAGTGAACCTAAAAAAATAGTTAATACATTATTAGAACTTTCAAATAGAAGATTGCCTAAATTTAATAAAAGTTGGCATAAAATTCATGATATACAAATACTATCTCCAATGAGAAAGGGAGTTCTAGGAGTTTCTAGTTTAAATAAGGAATTACAATCTGTTTTAAACCCTAAAAATGATTCAAAAAAAGAAATGGAATTTAAGGATTATATATTTAGAGTAGGAGATAAAGTTATGCAAACCAAAAATAACTACTCTTTAAAGTGGACCAGAGCAAGTGGTGAGGGGGAAGCAGAAGGGTTAGGAATATTTAATGGGGATGTAGGATATATAGAGGATATAGATGAGGAAAAAGAAACAATTCAGGTCTTATTTGATAATGAAAGAAGAGTAGTATATGAAAATTTATATTTAGATGAAATAGATTTAGCTTATGCTGTAACTATTCATAAAAGTCAAGGTAGCGAATTTCCAGTAGTAATTATGCCAGCTTTTAAAGGTCCCCCACTTTTAATGAATAGAAATTTATTGTATACAGGAATAACAAGAGCGAAAAGGCTTGTTGTCTTGGTAGGATCTTTAAAATCTATTAATTTTATGGTACAGAATGATAAAATTTTTGAAAGATACTCTCTTTTAAAGTGGCGTATAAGTAATATTTTAGATACTGAAATTATAAATGGAGAATAA
Protein sequences of DBSCAN-SWA_1 >NC_017299|188147:197750|194149_195325_+|WP_012343331.1|DBSCAN-SWA MRKLFTSESVTEGHPDKICDQISDAVLDAILDKDPNGRVACETAVTTGMVMVMGEISTKCYVDIPKLVRETIRGIGYDRAKYGFDCETCSVITSIDEQSVDIAMGVDEALESKKGEMDKLDAVGAGDQGMMFGFATNETKEYMPMPIEMAHKLSRRLSEVRKNGTLPYLRPDGKTQVTVEYENGKPVRIDAIVISTQHGPEVYLEQIEKDIKEHVIKVIVPSELLDENTKYFINPTGRFVVGGPQGDSGLTGRKIIVDTYGGYGRHGGGAFSGKDPTKVDRSAAYAARWVAKNLVAAGVADKLEIQLAYAIGVAKPVSISVDTFGTGKITDEEIVSIVNKVFDLRPGAIIRDLDLRRPIYKQVAAYGHFGRTDIDVPWERLDKVEEIKKHI >NC_017299|188147:197750|189809_190532_+|WP_014519503.1|DBSCAN-SWA MEKKPSNKKSNFFKKEGFYVVLFLCLCIVAAIAAISVKSNSHVKKEPIENKVVENKKEKDSAKAIEGNSKSYNNALEVKKEENKENEKSKQNEKETAQVSKAESNSFIKPVEGTLARVYSEDPVFWSSTSSYRANLGLDIKAKLNSPVCSIADGKVEDIVTSSQDGVKVTVNHQNGIKSVYANLDPKVKVTKDQQIKQGCLIGNVGKTTLRAAYEKYGDHLHFAMMKGNKYINPSKHIKY >NC_017299|188147:197750|195515_197750_+|WP_014519506.1|DBSCAN-SWA MQEIQGFIEDILFKNDENGYVVAKIRKKKELITIVGCMPYITEGQNLKLKGEWVIHPQFGNQFKVEICEEIVPDTVAGIERYLSSGIISGIGPVTAKKIVKKFGEATLNILDNNIERLTEIEGIGKKKIEVIYDSYIKQNEVRNIMMFFQNYGVTPKQCMKVYKRFGENSISIVKENPYILTEEIRGIGFKTADKIARSLGIASNSPFRIQSGINYIINGFCSLGNTYMPLERLISEAMDILGVKEEEIHENIYNNVAENKLKIEKVKERSCVFTLPYYYCELGVTKKILSLSLSQYDNLNINIEDEIVSFEKNNNIKFHDSQREAIKGALENGVEIITGGPGTGKTTIINCITEIFEKANMKVYMAAPTGRAAKRMSETTGREAKTIHRMLEMGVSEDDTEEVFSKGEETPLECDVVIIDEASMIDIILMNTLLKAIALGTRIIIVGDVDQLPSVGPGNVLRDLIESKCVKVVRLKEIFRQSKESMIIVNAHRINDGEMPIINKKDKDFYFIECSEPKKIVNTLLELSNRRLPKFNKSWHKIHDIQILSPMRKGVLGVSSLNKELQSVLNPKNDSKKEMEFKDYIFRVGDKVMQTKNNYSLKWTRASGEGEAEGLGIFNGDVGYIEDIDEEKETIQVLFDNERRVVYENLYLDEIDLAYAVTIHKSQGSEFPVVIMPAFKGPPLLMNRNLLYTGITRAKRLVVLVGSLKSINFMVQNDKIFERYSLLKWRISNILDTEIINGE >NC_017299|188147:197750|192719_193442_-|WP_014519505.1|DBSCAN-SWA MQKLLGKLRRAVGDFNLIQNGDKIAVGLSGGKDSIVLLHLLKKYQSFSPEKFDLIAITLDTMTGADFSPLENVCSNINVPLYIYKTPIKEIVFDLRKEKNPCSLCANLRRGALNNYSKELGCNKIALGHHKNDAIETLLMSMLYEGRVSCFSPKTYLNKANITIIRSMIYIDEIAIKSMIKRYDLPIIKNPCPANGNTKRQYMKELTYTLEKDIPKVKDRLLGCLTNINQINLWDKDKIQ >NC_017299|188147:197750|192146_192671_-|WP_014519504.1|protease|DBSCAN-SWA MNIEKTHYMESLSYYKIANTLKNYLNKDTIIICIGTDRCIGDCLGPLVGTILRYKNIPLKLYGTLDEPIHALNIEKTIKNIKNSYPNSSIIGIDACLGDKDNIGQIQVRNFPIQPGKGVGKTLPKVGDCSIVGIVDSNENCDIFTSANTRLSLILNIAKVIANSILQCCYVLDI >NC_017299|188147:197750|190639_190894_+|WP_003356559.1|DBSCAN-SWA MKDYIEERVLEVAHYIIDSKATIRKTAKVFGVSKSTIHKDMTERLPKINPQIAEEAKEILDYNKAERHIRGGKATKMKYKAIEG >NC_017299|188147:197750|188147_189224_+|WP_014519502.1|DBSCAN-SWA MRRLNRYTNINKLVITIISTVFIMLILSFALSFSENKEQKVKETISKVKLDQKRQEEKIDINKKYKVKSEPQVRVYFVNEKVVRSIPLEEYVKGVVSAEMPAEFHIEALKAQAVAARTYALAHMKGFGENQYNKRINADVCDSVQSQVFMPKDKRIKSWPKEKRNEYWNKIEESVNSTKGNVLVYNNEIVMAPYYFATSNGKTEDSENVFNSEVPYLKSVKSPGEEKAPKFKSSKKISYDQFIKIIKTQYPKCTINKKDINKKIIIKDKTESGSIRKIKIDNIEIKGTEFRKILGLNSSKFSLEFKDNYLIVNCNGYGHNVGMSQWGANSMGKSGKKYDYILKHYYKGVNMEILKYSD >NC_017299|188147:197750|190993_192022_+|WP_003356149.1|DBSCAN-SWA MFFSVGTDMGIDLGTATVLVYMKGKGVILNEPSVVAIDRNKNKVLAVGQEAREMIGRTPGNIVAIRPMRDGVISDYDITEKMLKYFIGKACGKKKISAPRVVICIPSEATEVEKRAVMDAARNAGAKKVFLIEEPLAAAIGADLDITKASGSMIIDIGGGTTDIAVISLGGIVVRSSIKIAGDKFDDAVIKYIRKKHKLMIGERTAEDLKIKIGSAFRKGENTSMDIRGRDLVTGLPKNLTVTSDEMREALQDTVNAIAELTHSVLEKTPPELSADIADKGIIMTGGGALLSGLSDLIESVNKVPVHIAENPVSCVAEGTGKMLEYLDKMGISESGDGLNLL |
8 | Clostridium_phage(33.33%) | protease | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
699366 : 732082
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NC_017299|699366:732082|DBSCAN-SWA TCTACTTTAGCTTTGGTGTTAGTCTGTCTGCTACACAGGGATGAACTTTAAATCCATAGTCTTTTGCAAATTGTTGAAATTTATTATTTATCTTACCTTTAGAATAATTAGTTCTAGGTTCATCCATAACAGTTTTCATATTATCCTTTAATAGTTCTTTCGGAACTCCACAAAATGATTTAAAGGACTTATCTAGAAAACAAAATAATATATTTTGAGTTTTATGAAGAGATAATTTATATACTCTAAATCTTAAATATGAAAGTATTAACATAAATATATTTATATTAATAACTTCTCCTGTACTCAAAATAAATTCTATATTTTCTTTCCAATCTAGTTGTGCTTGTTTAGCTTTATCTGTTTCATATCTCGTGGGCGTAGTCTTCGATAGATGACTTTTTTTTCTGCTACCAAAATATTGATTAAATTCTGGATGATTAGAAATATATCTTCTAAAGGAAGATTGAGCACAATCTAATTCATGATTATCTTTAAGATATTGCAATAAAATACGTTTATAATAAAATATTTGAATAGAATCTTTACTAAGAAGTTCTTTAATAATAGGCTCAAAAAGGTCTATTTTAGATTCAAGATTTCTAGTAGTAGAACTCACATATTCATTCGAATATTTACCTACAGTACGTAGATTAACTCCAAGTTCTCTAGCTATCTGACTTTTATTTACTTTTAAATTATTTTTATCCATAATTAATTTTAATTTATGAAGATCTTCTAATTTACCTATTTCTATCTTAGAATGAATATCTACTTGTATAATCATAATTACCTCCAATTTAAATATTAGTAATTATACTATGCATAGAGTTAATTAGTACATTTTTAAATGATCATTTTATTACATTTCTATAATATCATTTATAAGATGTTTATTATGACTGAATGAAAGTGAAAGGTTATATAAGCATTGCTAGGACTTTTAGGAATAGTCCAAACTGAGTTTTTATATGATGCTCAGGATAAGTCTAGCGGGAACATGGCTATTGGTCAAATGTCTATCGGTGTAGAGACTACAGGAGAATTCTGAATATTTATGCTAATCGAAAAAGTCGAGTTGATGATATACGAGAATGAAATCAGAGAAGAGATTTTTAGGTTAGGAAAAATTCATAGTAGTATAGAAATTGCTGTAATGGAAGTGGAACAAAGGGATTCTATTATCTTAACTCTTGAAATATTAACAACCAGTGATTGGAGGATTAAATTTGGCAGAAGAAAAATTATTTAGAATCACGGAAGAAGAATTGGTAATAGCATATAAACGTGTTAAAGTAAATAGATGTGCTGGAGACATCAATGGAATAGTTTTTGAATATTTTGAACACCTTGGAAAAATTATGAGAAAAATATGTATAAATTATAATATATAAAATTTATTTTCAAAAGCAGCAGGAGCAGTTAGATACTTGAAAAGAATAGAAAAATAAGGATTCAGAGAATACCAACAATTGAAAGTAGAATATCGCAAACGGTTGTTAGAAATAGATTCGTGAAAAATGTATTTTTAGAAGACTTTTATGGATATAGACTCCATAAATCAGCATTATATGCAATAGGCAGGCAAGAAAAAGGTATTTTAGGATGCCATAGATTATTGAGTTTGATATAGTAGATGACTCAGTAATTAAAATACTCTTACATAAAACTTGTAAAAAAACGTCCTTTCTATGGCTATAAGAAAATCACTAAAATTATTCGTAAAAATCACTGCTAAGAAAGTGTATAGATTAGCTAAAAAATTAGGACTACTTGCACCATATGCTAAGCATACAAAACAAGGATATTTAGCTATAGCAGGAGAAGTAACAGGAATAAATAAACTTTGGCAAATAGATATAAAATACATAAAAGAAATTAATGGAGAAGTTATAATGCTAGCAGATATTATAGATGTATACTCTAGAAAATTGGTTGGTAAAAGAATGACCAAAACTGATACAATTGAAGATTCTTTAAGCGCTATAAAAAGACATTAGAAGAAAATAATGTTACTGAAAAAATAGTTCTTAGGAGTGATAATGGTCCGCAATTCACTTCTGTTAAGTTTGAGCAATTTTATAAATCTAATAATATATCATGAGATTATGCCAATAGACTCATCTAATTATAACGCTCATATGGAATCTTTTAATAACTTACTTGAAAAGTAATGCATAAGATAGAATGAAATTATAAATTTTACTCATGGATATAAGATAATTAATGACTACATAAGTTTTATAATGAAGAAAGAATCCATGATATTTTAAATTGTATGAGTCCAAATGAATTTATAATGAAGGCTACAAATTAGTTGGTATTTGGTATAAAATGTAATATTTGTGGAGAACAATCCGATTTAATTAGCGAAGAATAATTCTAGCAACAATAAAAAGGGACAAAGCAAAGTTTCAAATTCCAAAGAGGTTTACACATTAATATTTAAGAAGAAAAGATTAATTAAGAATGTGAACTCATAGCCCACTAAACAATTAAATATTTCAAAAATATTAACTAAATCTCTATTGGGGTTATTGCTAGATTAGAAACTAAAATTCTAGCTCATAATCTATGCCATTTCATAAATATAATTCAAGGTAATGTGGAAAATATGTAAACTTAATAATAATTCAACTATTTTCTAAGTCTTTTTATATGAGTATATTTTGCTTTTTATATTAGATGCCACTAGCGTTTAACAGTTGGAATTAAAACACTATTGACAAAATTGATATGAAAATTAACCATTAATTTTATAATGAAAAAATCAGCAACCTTTGCTTTAGTATAATTACCACACCATACATTGTAAGGAGGTTGCTGATTATTAATATAGATAATTATAATATGCTATTTCAAAAATTTATAGATTTAATTTACTGGAAATCCTTGAAAATAGCTTCTTATAAGTTAAATATTGATTATTTAACTATAGAAAATCACCTTAAAACTTTGATTTATTTTCAAATAGCGGAGCTAGATTATTTAAGAGATATTCATGAATTTATGCAATTAAAGTCTGATTTAACTCAAATAATAAAGGCGTTAGCCTGGGAAGTTTATCAAATTATAATAACAAAATAAATTATACTGTATTGCTTCCTGTAATTAATAGTATTTTAATCAAATCCTTTATTTAAATTCCTACAAATAAAAGAATTAAAAAATTCGGTTTTGTAAAACTTATAGATTCTTCAACTATTAGTACATGTATAACTTATTTTAAATGGATGGAATTTAGAGCTTCAAAAGCAGGAATTAAAGTTCATACAAAATTTGATTTAGGAAAAGGTATTTCTGAAACAATAGTTGTAACTAATGCTAAAGAACATGATAAATCAGTACTTGAAGAATTAATAACTGAAAAAGATTGCATTTATATTTTTGATAGAGCATATGTTGATTATGGATGCTTTGATGGGTATTCCCAAAATAATAAGTATTTCATATCTAGACTTAAAAACAATGCTCTTATTAGTGAAGTTAAAAATTTGGATATAACTTATTGTGATAGCAATCATAAATTATTAGATAAAGATACTGAAATAATTTACGACAAAATTGTTCACTTAGGACATAACTATAATTATAAGACTAAAGAAAAGTATAGAGTTATAAAAATTGTAGATTCTCAAGATAGAGAAATAACATTTGCAACTAATATATTTAATTTGTCCACTGAGGAAATATCATGACTATATAAAAAACGTTGGGAAATAGAACTTTTCTTCAAATGCATAAAACAAAATCTTAAAATTAAAAAGTTTATAGGGTATAGTTTAAATGCTGTAATGATGCAAATAATATCGGCAATAATGACCTTCTTAATGCTAAAACTTATAGAAAAAGAATCTACTACATCCTTCGGATTCACGATTATAAAGCGTAGAATAAAATATTGTTTAAGTAAAAAAGTAAATTCAACAGAATTCTTATGGGCTAATTTTTTAGGTGGCTAAATAAACATAAAATTCCATATAAATCCTCAAGCTAACGCTTTTGGTATTCCATACCCTTTTTTATAGGAATAATAATGAGACCAATCCTAAATTTAGAATATGAAATAATCTAGGATTAGTTTTTAAAATGTCAATATAAAATATTTTCTAATTAATGAACGCTAGTGATTAGATGCAAGAGTATGAATAAATAGAAATAGTAATTATAAAGTAACTACAACTTTTAAGTTAGAAGAATTTTAAAATATTAACTAATATTATTGAAAAACAAATTATAGTCACAATTTACTTATATTTCGCGACGATGTTTGCTGAATCTTGAATTGAGCTCGATAAAAGTAATTATTGTTAATGAAATAGAACCTATAATATCCATTATAGTATCATATTTATTATAATTATATATAAGAGCCGTAGTTAAACTTCCAATCCAAAGTAATAATAAAATAATTAGAAGTAATAAATTAAATAAATGTAGATTTGATTTTAAATTTTTTTATATAAAAATATTGAATTAGAGTGTATATAAAAATGGTAGTAGATAACAAAATAAATTGTTTAAAAGAAATATTTATTGGGATATCACTTGTTATTATTGTTTTGTATATCCATATAAAAATTCCTAAAATAAATAGGATTAAACATAAAAATAGATCTGCATACTTATTCATAAAAATATCCTTTCATATAAATTATTATATGTTAAAACAACCTTGAAATACTAAAATTATACATTTCAAGGTTGGCCATTTTTATTATATATACAAAAATTAATTTTCTATTGCTTTCAATAATATTGGATCAATGGTGTTATTGTCAATATCTTTTTGTACTTTAATCATTATGTATTTATTAAGTTTTAAATTTTTATTTTTAGGATTTTTTATAATTTCATCTACGTGTTGTTCAGTATTCATTTTAAGCATTAATGAATTTACGCTTCTAGAATTAGCCCTTTTAGAATTATCGAAATTATCACCTATTACAGCAGCAATGCTATCCCATATCCATCTATTGCTATCTACAGATTTTTCGCCAATATCTATAATACTTGTATGCTTTGTTATTATATTTCCTAATCCAAAAGGCAAATATTTAGCTATTTTATCAGGGTAAACATGTCCTATTATTTCTATTGCCATTGATGTTCGCGTAACGTCAATAGGTTCTGAATATTTTAGAACATAATTAGATTTTGCATAATCTGCAATATTTAAGCTGTTCTTTGAAGAATTGGATAAATAATCCTTTAGATTATAATCATTAGTTATATGTACTGCTTTAGGTGAATATGAGCAAATAATATCAGATAAATTAGCTGCAAAAGTAGTTACAGTACTAAAGGATATTAATGTAAATGAAACTAATCCTACTATTAAAATTTTAATTGACTTTTTTTTCATGTGATTTCCAAGTCCTTTCCATGTAATATTTTGAAGTAATAACTTATTATGTAACATTTATATAATTATACCATAAAATTATATTAAATTCAAAGATAGGAAAAAATTTATTAAGGATTTAAAACTAGTTTATAAGGCGTCTGGTGAAGAGTTAGAACTAATAGAATTAGGTAAACTTAAAGAAAAATGGGGTTGTAAGTATGGCATAGTCATTGATTCTTATTATAATAACTGGAATAATTTATCTAATTTCTTTCAGTTCTTGCCCGAAATTAGATAAATTATATATACAAATAATGTTCTTAAAGGATTTAGTAGGCAAATAAGAAAATTTACTAAAACAAGAACCGTATTTTCTACGGAAGAATTCTAAAAAAATCAGCGTATTTAGCTACTATTAAAATAGTGAAGAAATGGACTTCACTAAGACAAAATTGGATAATTACACTTGCTCAATTAAGCATTGCCTTTAATGATAAAATAGACGAAGATTTATTCTTGCCATTGTAAAAAAATAAATAAATTTTGAAATAAATGGATATAATAAACTAATTTAAACTAATACTAAAATTAGTCTAAAATAACGATTATTAGTATGTCTTCTAGGCAATAAAATATTACTGAAAAATAATTTATGGTAATATTTGATAGCGAAGATTATAAAGTACATAAATCTATCTATATTCTCATTGATACTAATATATTATTTTTGTTTTGATGCTTTTAATTACAGTGGAAGTTTTTTAGTCTAAGGCATAATAGTTAACATCATTTCTTTATCATTTATATCTACTTTTGATAACATTTTAAATAAATATACTAGATATCGTTAGGTCTCTAGCTGTTTCAATTTTAAATCTTCTTCTTGAGTCATACACCACCTAAATTTGTTATTTTTTAACCTATGGTAGTAGTATGACCAAAATCCTTCATCAACAAAATGTAATATCTTGAGCCTTTTTATTTGCTTATTATAAAATATAAATAGAACTTTTTCAAAACGAGCTAAAAAGGATCTAACTTGAATTGGTTTTCCACAAGCATAGTTAATCCATCTATACTTTTTCTTAAGTCTGTGTAACCGCAGGCTGAATAATAGTTTTTACCTTATCTATATTTAACATGATTTGGCCATATGCTTAATTATATTTGATACTATTGCAATTTCACTAGCAAGTATATAAATATTAGTTTTGCCAATTTCTATTCTTATATATTTAGAATAAGTTTGCTCGCTAATATTAATTGTGCCAATAATTTCTTCTCTATTTAATTCAATTTCAATTCTATAAAAGGTAGGCTTATTTCCTTTTTCTTATTTCTTCTTTTTATAATATAATTGATGTTGACTAATATTATATCCTTTACAACAATTAATTATCATTCCTGTGTATGAAGAAAATTTATTCATAATCTCATCCCAATTTATTATATCAACCTCTATTGATATAAACAGATCTGCAAATTCAATTTTTATATCTGTAATATTATCAAAGAAAGTTTTTAGTATTTAACTGTGAAAATAATTTACACTCTCCAGGTCGCCTATATATTGGAATTTATTTTTTCTTGTTATTATTTTTACTAATAGCAATGAAGGCACATAAAAAAGCTGCAAATATAGAAAGATATAAAGCAATCATATTATTATTCTTACTAATAGTAATGAAGGCACATAAAAAAGCTGCAAATATAGAAAAATATAAAGCAATCATACTTATTTATCACCACCTTTAGTTGAGATATATTGTATTAACTCAAGTAAATTACATTTATTTTCAAAATATCATAGTTTTTAATAAGATACTGATTAGACTATATAACATTAATCTAATACTCTGCAATTTTCTTCTTGCAACTTAAAGAGGATAGTGTTATAGGAATCAGCATTAAAATATCCATGTTCTTCCCAATATTTAGTTTCTGAGCTTGGTATATTATTTTCTTTTAACGTTAACATATAACTTTTTAGATTTTGGAATAATGTTTCCTGAAAATCAGTGGCAGATATCTGGTGATTATTTATTAAATAATCACAGATAAGGTAACTTATTGGCATAATATCAAGATTATTAAAAGTATTGTTAGTAGTTAGAGGGTTAATCATCTGTATTGCCTTAAAATTGCAGATTACATTAATACCACAGTATTGCATAAATTTATTAAGATATTTATTTATATATTCATTTCCATTGGAGTCAGAAGTAGAAATAGTTACTCCTAATTTGCCTGCAAGTCGAAAAATATGCATCCAATAAGTAAGCCTATCAATAAATACTTTCATATTTCCAGTTACATTGTGAGCATAAACCGGACTCGCCAGAATAATTAAATCTGATTGCAACATGTCTTCTTTAATAGATTTCATTGAATCAAAATTATCTTGTGGACAAAAGCCATTTTCAAAACAACACTTGCAACTAGCACAAAAATTTATTTTTATTTGATCTGGTGATATAAGATTGTATTGAATTTCGCCATCACTTAAAGAAATCACCTGCTCCAATATATTTTTAGTTAGCTTCCATGTATATGAGTTTTTTCCTTTTTGGCTTCCAACATATGCAAATATTTTTTTCATAATTTCCTCCTTAATTTTGATTAATGTCTATGCTATATGATTGCTGTCTTAATACGAAGTTATAAAATCTGCCTTTTTTGTTTATTAACGATGTATATGTTCCTTCTTCTGTTATTTGTCCGTTATTCAGCATAATTATTTTGTCACAAAGCTGAACGGTTGATAATCTGTGTGCAACAACAATTTTAGTACAATTCAATTTTTCAAGCGAATGAATTAAATTTTCTTGTGTTATATTGTCAAGTGAAGAAGTTGCTTCATCCAAAATAAGAATCTGTGGTTGCGAAACAATTGCTCTTGCAATTAAAATTCGTTGTTTCTGTCCACCTGATATTGAACCATCACCTTCACTTATTAATGTAAACATTCCCATAGGCATATTACGAATATCATCTGCAATTCCGGCAATTTCAGCTGCGTTCCATGCATCTTCAATAGTAAGCTCAGGCTCAAAAAATGTAATGTTTTCAAAAATTGATCCTGTAAATAATTTGCCATCTTGTAATACTGTACCTATTTGCTTTCTCAAATTTCTAAGATTCATATCTTTTATATTTACATTATCATATGTAACAGAACCGGATTGCGAAATCTCAAATCCAAGCAATAAACGTAGCAAAGTGCTTTTACCGCAACCTGTAGGTCCAGTAATTGCTATATACTGACCACTTGGAATTTTAAGTGAAAAATTATCAAAAACATTTTTATTTTGAAGATTATATTTAAAGCATACATCTTTAAGTTCTACATTTCCTGATAATTTTTTGGTAATTTGTTTATTATCATCTGAATCTGGGATTGAACTTAATATAGGATCTAATAGTTCAATTGTTGAATAAAACTGTGCAAATACAATTGCTACATCGGAAAGAGATGTAAGTGCAGAGGTAACCATACCGAACGCAACAGTAAATGACATAAAAGAAGCAACGGATATATTAGCAGTAGCAGCTATGTAATATAGTATTATCGTTGTTACATAAGATGCAATTAAACTAAAATGCGGCTGTATTTTTAAAATGAAAGGTGGGTTATATAGTAACTCAGCCGATTTTTTATACTTTTTGTTCCAATAATTAAATGCTCGTTCCTCAGCTCGGGCAAGTTTAATTTTTTGTATTCCAGATAATAAAGAAAAAAAGGTGTTTGCTACATTAACATCGTTTTTATTTAATTTAATATAAACATGCATTTCCATAGTAATAAAAACTACAATAAAGGCAAGTATAAATAATGTAATTATAGATGCTGGAATTGCTAATACAGGCGTCATTTTTGTTATTTGAATTATATATACTAATGAAAATAAAACTGTTAAAACAGTTATTAGTATAGTATCAATCATTTGGGAGATGACTGAAATAAAACTTTGCAATCGTTTGGTTATATCTCCAGATGAATATTCTTTAAAAAATGAAATAGGCAATGACAATATTCTATATATTAACGCATTTTGTGTGGTTACTGAAATTGTAGTTCTTATATTATATACTACAGAATGGCTTATAATTGTAAACAAAGTTGTTACTATTGTAATACCAACTAATACATAAGTTACTGATAATAATGCTTTATATGAACTATTAGAAATAATATCACTAAAAATATATTGGTTAATATTAGGTAATATAAGACCAAGTAATGTAACAACTAAATATGATAGAAATAACATTATATATTTTTGCGAAGGTACTGCCTTTAAAATATACTTAAAAAAATCTGAAATATTCAGAGATTCTTTAGGAAGAGATTTATTGAAAAAAAATGCTTTAGATTCAAATAGTTCTGTAGATTTTTTCGTAACGTTGTATATTTTTTTTGTTTTGCAATTTATATATTTATACCCTGAAACTATTTTAGGTATAAATACAACGGTTTCTCCTGTTCGCATTTTTCCAATCATAGCCCCCATGCCATTCTTATACCAATCATTTTTCAAAATAATAGAACGATATATCAATCCTTTTGTAGGAATTAAGTTAAGTATCATATATTCAATATTTTCGGATTGCATGCAAGAGTCAGTTAATGAGCTTACTTTGTAATATTTTAATATCAAATTTAATGCTAATTTATTTTGTTTCTTGACATTATTTTCTTTGCTTTGCCATGTTTCTTTGATGGGAATTTCGCTATCAAAATCGTTTAATGACTTTTCATTATTTATTATATTATTTATATATCTATTCATAAATTATCTTTAGTGGAGAGTGGGTGTTGTAAGTACCAATCTCCACTAAAGTTCACCACCTTTCAATATAGACACTTTCTAGTGGATAATAGATTATTTTATATTTCTAATCTTTATCTTAATCTTTTAATTTCAGCTTTAAGTTCTTTCATTTCAACTAATTGAATAATTAGATTCTCATCATATTTTTTGAGTTTCTTAATTTCTTCATATAGTTGCTTTATATTAATCGTCTTTAGCCTTTATTTTATCTTTAGGTGTAGAGAACTATATTTTCATTAAGAACATCTTTTTAAATGACTTTTAGATTTAATATACGCTCAGGGTAGCCTTAGATATTGTTTTAGAATTAATTTTCTTAGCTTTAGAACGCTTTAGCTTATCTATGGCTTTACTAAGCATTTCGATAGTTATTGTTTTTTCTCTTCTTCTTTATCCATCGTTAGGGTTTCTTTAAATTAATATTTATCCTTAATGCTTTTAGTGATTTATTTATTTTTGGTGCTCCATAGAGATTCTTACTTATTTTGTGGATATTTATAATTTTTCTTTATATCTTTTTATTTTCTATTGATTGGATTCTTATTTAAATACTTTATTATGATATTTTTTGTTGTTAGTAATGAATTCAAATAGAGTAGTTACTTTCTTGCGAATATGCCATATTTTTTTATCCATCCTATTATTGTTGATTTTCATATGACATATTTGCTACTTAATTGTGATAAGCTTTTTTCTGCGTTATAAAGATATACTATAGTACTTTTAAATTCTTTTCTAGATTGTTATTGACTTCTTGTCATTCTTAACACATCCTTCTTTTATCTATATTCTAATGTGTTCGGCTTTCTGTGTCTACAATATTATGCTAACATCAATTTTTTCACCTATTCTGTGGTAATATATTTCGTATACATTTTATTTTGTTTAAACAATTCGTTGTGGTTTCCACGTTCGGAAATTTTACCATTATCCATTACGATTATTTCATCACAATCACGCACAATAGACAATCTATGTGAGATAATAATTAAGGTAATATTACGGGAGCGGATGGCTTGCATTACTTTATATTCAGTGTCTGCATCTAATGCGGACGTAGCTTCGTCGAATATTATTACTTGAGGATTTTGTGCTAAAACTCTGGCAATTTCAATACATTGCCTTTGCCCTCCTGATAAATTATTACCATTTTCAAGAAGAATTTCCTGATAACCATTTTGACGATCCATAATAGTAGAGTGAATTTGCGCATCTTGAGCGGCTGCGTACATCTGTTCATCAGTAATAGAGGAGTCCCATAATTTAATGTTATTTTCAATAGTATCTTCAAATAGAACTATATTTTGGTCAACAACTGCTAATAATTTTCTAAATACATTTGATGGTATTTCGTTTAATGAATTATCAAAATATGAAATTTCTCCAGACCATGGTTCAAGCAAGCCAGAAATAAGTTTGGATAGTGTAGATTTACCACATCCAGAAGTCCCAACTATTGCAATACTTGTTCCAGACTGTATTTTTAGGTTAAAATCGTCTATAACAGGATTAGAATACTTTGAATACCCAAAGCTAACATTATTAAGTTCTAAATACTCAAATGATTCTGTTTTATAGGACGAATCTATAGTACAAAATGAATCAGGTTTTGCTTGCATTATATCTTCAATACGTTCCATAGATGAACGCATTTCCTGAATGGCTTGTCCAGCAGAAATTAAAGAATTTACTGGTTGAATAAAAGCTGCCATAAAGCCTTGAAATGCAAGTAGCATACCAACTGTGAAATGATTCTTCATAATATAAAACGCACCTAGTGTAAGTACTATAATATTTCCTAATTTCTCAATTAACTGAGGAATCATACCCCATGAAATAGAGATGTTATCTAGTCTAATATTAGTGTTATTGACAGCTGCCTGATTGCCGGCCCAGATTTTGTAAAAACCAGATTCAGAACCATTTGCTTTTATTGATTCAATCATTTGTAATCCATTTAAAGTTTTTGACATTAATTTACCTATGTTTGTAGCTTGAACTCGTGATATTTCAAGCCTCTTAGTGGAAATTATCCTAGCCAGAATAGAATTTATACACGTAATAGAAACAACTATAACAGTTAATAGAACGTTGTATTGAATCATAATAAAAAAATAAGTTATTAGTAGCACTAAGTTTAAAAATGTGGGAGCTAACCTTTGAATTAATGTATATGAAATAGTACGATTTGAATCTTGTCTAACAGAAATATCGCCTGCCATATGCTTAGAAAAAAAGCTAAATGGTAATCGAAGTACGTGCTTAATAAAGCAATAATCAGCGTGTATAGCATATTTACCTTGTATTTTTAGCGAAGTAATTCCAGTAATAACAGCAACTATAATTTGAGATAATAACAATAATAGCATTACACTAATGAGATTACATAACCAATTAGGATTACTTTTACTTAAGATATAGTCAAGGAATATTCGACCCAATACAGGATAAATTAATGCTATAATACAAGTAATAACACTTGTAAGTAAAATAAAAATTATAGGAGAAATTGAATTACTAAGTCTATTTTTAACAAACATATAAATACTTTGACGTTTTCCATCTGCTATAAACTGTGATGTTTTGTTAAATTCCATATAAACACCAGTAAAACCTTCAGAAAATTCTTCTATGGATATTACTACCCTCCCTTGGGCGGGATCGGTTAACATAGCTCCTTTTTTAGTAAATCCATTTAACACGACAAAGTGATTAAAGTGCCAATGAATGATACAGGGTAATTTCACTTTTGTCATAATATGATTTAATCCACAGCTATAACTATGTACTTCCAATCCATAGTTCTTTGCAGCAAGTGTTATATTATTAAGATTACAACCATCCCTAGATATTCCACATTCTTCTCTTACTTGATTCAATGGTATCCATTTGCCGTAATGTGCAAGAATCATTGTTAAGCATGCGGCACCGCATTCAACATTTTCTAACTGCATAACCACAGGTACTTTTATACAAGGCTTATAAAACATTGCTAATCTCCTTTATCAATTTTTAAAAAAATTCATCAAATTAATATAGCCGTTAGTAATGGTTATATTATATAATTTATCGTCTTTAATTGAATTAGTGTCGCATGTAATGGTGACAACCATATTCCAATCAGATAAGGTTATATTTGATTTATAATAGTCTAACTTAAGTGTACTTTCTACTTCGTCCTTTGAAAGTGGTATAGATGATATATTTGAAATTTTTGCATCATATGTATTGTTTATTTTTACTGTCGAATCTGCTGATAAGGATTTATACGCCTCTGGAGAAAGATAACATATTAATTTATTTTCTTTAGATAAACCAATGAGTTCTATTTTGTTTGGCAATGTAGCAGTAAATATAAAAATGAGGATACTAATTAATAGAATAAAAATTGCTAAAAGAATAACCCAAGTCTTTACATGTATATTTTTTACATAATCAGTAATGCTATCCTCCTCAGGTGTTAACATTTTTTTTAAACTGGCTTCGCGGAATAAATTTAAATCCATGCAAAATACCTCCTTGTTTATTCATAATGCGCATTAAACTTAAAAACTATATTAGCATAAAATTGTATTACGATAATGTAGCGGATATAAAGAGTCAAACCTTTTAGGCTACATTTCTAGTTAACAATTTACACTGATATGGAGTCAGGTAATTGACAAAATATTAATTTATCTTCTTTATCAGAAGCTTATATGTAATAATAATTTTTTTAACTATAGAAAGCATTAGTCACATCCTTTCTGAAAGTTTAGATAATGTTTTTTGAATGTAAATCAAGAATAAATGCTAAGTATCCTCAACTATATTTTAGATCATAAATATATCTTATATCTCTAATTTATTTTTCATTGATGAAGTAGTTGTGGAATATATTTTTAAAGCTATTTCTAATACTTCTACAACTTTCTTATTTGAATAAGGCCTATTATTTTCTTTTTGTTTATAGATTTAGCTTTATTAAGTGATTTATAATATTAGCTTATGTTATATCTAGAACACAACAAACGCAACACATATTATTAACATCGTGTTTATTATTTTTATAGTAAATTTAGTTACTGTTTGTACATAAGGCAATATTTTTCATTTCGTTTTCATCTTTAATTGTAGCCCTCTCTTTTTTAATTCAATAACTTCCTTTAGGTTCATAGGCTCATTTTTACCAAACTTAATTTTTTTATAGTTAGAGTATATCTTTTACTATTTTTCATATTTAGACATATACTTATATAACTAAATATTATTTTACGTAGTTCATATTACTGTGTTTACTGCTTTATACTAGAATCAATTCACAGTTAATTTATTGGACATCAGTAGGTGTGGTGTTAAGTAATGCTTATTGATTTCATTACAACCATTAACAAAAATTCAAAATAATATAAAATAATATTAATAATAATTATAATAATAAAATACAGTTATATTGTCAACTGAATAAAAAATCTTATTTAAATAAAATACATATTTTCCAAATTTGCGAAAATTTATATTGCTAAATTAATATATTTGATGTACAATAGCAATTGAATAAAACTTACTAAAAAGTAAATAATAAACAAAAAAAATAAAAAATGGGGGGAAAATGATGAAAAATAACGAAGTTTGTAAAAATGCTGGCTTTATTAGTGAAGACGAATTGGTAGAATTAGTTGATAATAGTGATATTAGTGGTGGTACTGCAGCTTCTGCAGCTGCTGTTTCAGCAACTGTAGCTTCAGCAACTGCTGTTTCTGCATTGTTTACAGTAACAAGCGCTTGTACAACTAAGTGCAAATAAATTAGCTATTTTGTATAGAGGGGGAATATAATTATGATAAAAAATCCAATTAAACGTCAAAGTGAAGATGTTAAACTTCCTTGTGGAGATACAAAAGTAGAGATTACAGAAAATCAAGGATTAGATGTAACTGGTGGTACATTTAGTGAGGGTACTATTAGTATTACTTTAAGTGTTTACATGGGTAATGATGGAAAAGTTTGTACTTGGACTGTTGAATGTCAGAATAATTGCAGTCATAAAAAATAATAATTAATATTTAGTTAATTTTAGTAAGTTTTTATATTGTATTACATCATCTTCATATATAACAAATGAAAATGATGTAATACTTTAAATAGAGTAATTTGTCAAGAAAATTTTACAATTAATTTTAAAGTGGATTTATAGGTTAATTATATTTTTACTATAAATTAGAGTTAAAATTTAAGTGAATACAAAAATATATTTCATAATGGAGAGAAAATATGAATCGTATATTTGAAGATTTTGCAAATGAAGATGTAATTAATTATTGGTCAACGCTCTTTCCTAACTTTGATACACATAATAAAGTGATTGAACATATTGAACAAATGTTAGACATTCCATTAGAAAAATGCGGGGACCAAAAATTGTTTTATGGATATCTAGCTAGTCATGATGATAATTATTTACAAATATCAATTTCTGATGAGCAAAAAAAACAAATTAATGAATATATGAAAAATGATGTGGCAATGATACCAGTATATATGTTATATGAAGATATAGTATATAAAAATGTTGGAAAATTATTGGATGCTATTGAAAATAGCAAAATAATAGAAGATAAATCTTATTTTACTTCTAATATTATTTCCCAATTAAATAGTCTTCTTGGACCACAATTTATTCGTACTGTAGTATTAGAATTAAATTGTGCAAGAGAAGATGGAATCTTAAAAGGTAATGATAGCCATCAAAGATATGAATATTTCATAAATCATATGCTAACTGATTCTCAATATAAGGAGAAATTTTACACTGAGTACAGTTCACTGCTATATGTTACAACCGAAATAATTCAAAACTTTTTTGATTATGTGAAAGATATTTTAATTAATACAGAATCAGAAATGAATCAATTGAATCAAATTTTTTCAAGTAATATAGAACTTGGTAAAATTAAAGATATAGAACTCTCAGAAGGAGATACACATTGTAATGGTAAATCAGTTGCCATTATAAATTTTACAAATTCAAAGATTGTTTATAAACCGCGAACAATGAAGATTGATTTACAGTTTCAGAAGTTTTTAAAATGGGTCAATTTAAAAAAAATTATTCAAGGCATACGATTGGCTACAATAAAAATACACACTATTCATAACTGTGGTTGGATGGAATATGTGGAACAAGAGGGTTGCGATAGTCAAGAAAATGTAAACAATTTTTATACAAAATCAGGTGTTTTATTGGGAATTTTATATTGCTTTAATGCAGTTGATTTCCATTTTGAAAATATTATTGCTCATGGAGAAGAACCAATATTAGTAGATTTAGAAACATTATTTCATCCTGAAATTAAGGATCAAATCTTAAAAAATAAAAATAGTGGATTTCAAGTTGCAACAGATTTTATTTCTAAGTCGGTTGCTAAGATTGGATTACTTCCAACTAAAATGAGAATTAAAAAAGACAATATTGTAGAAAGTGTTGATGTAGGTGCATTGAGTGAAGGTAAAGAACAGAATAATATACTTAAATCGTTAGTTTTGGAAAATTTAAATACTGATAATTTATGTTTAGCATATAAGTACCTCCCAATTGCTTCTAAGAAGAATGTACCAAGACTTTTAGGACAATCTCTAAATCCTAAAAAGTATATGTTGAACTTAATAGAAGGATTCAAAGCTTTTTATCAGTTTGCTCAAACAAACAAGGAAGAAGTGCTTAATTATATATTGGCTAATTTTGGAGGTTGCCAAATACGAGTAATCCTAAAATCTACAGTTACATATACTAGTTTGTTAAGCATTGCTTCACATCCAGATTTTATGAGAGAGCCAATTCATAGGCTGATATTGCTATCTAAAATTGGTGCTAACGAATATTACAATTTATCTATTAAACAATTTGAACTTTCTGAACTTGCTAGAAGCCAGGTTCCGTATTTTTATACATATTTTGAGTCACATGATATTCATGGATATCCAAATGTGTATTTTAGCAATAATATAGAAAAAAATATCCCCAAAGTGTTAACTAACAAATTTAATAGTTTATCAACTTCGGATATGGAAACTCAGATTAATTTCATTAAAGATGCCTTTTTTATACGTAACGCACAAGATGATGTAACAGGTATATCATTTGATTATAAACCTTATTTAAATGTAAAACCAAATGATTGGCTTCAATTTGCTGAGCAGGTAGCCGAACACATATTGTCACGTAGTTTCACAGGAATTAACGATGATAAGAGAGTAGACCGCGCGTATATAGGTGCACAAACGTTAATGACAGATACTAATGATTGGAATGTAAATGTAGACAGTATAGATTTATATGATGGAAATTCAGGTACTGCTCTTTTTTTTATATATTTATGGAAATTAACTGGAAACGAGGAATATCATCGTTATGCGCTTGAAACAATTCAACCAATAATTCACATTGTTAGTAAAAGAAACGAAGTAAATTACAAAAGTGCTATTGGTGCATATAAAGGTGTAGGTGGTTTAATATACGTCATAAATAAGATTGCAGTTTTAACACAGGATTCTACATTAGAAGATTGTATTGTAGGATTATATGATATCATTGAACAAAATGTTCAAGAAGATGTAAATTATGACTTTATAGGCGGTGGAATTGGTTGTTTAGCTGCTTTATTATCGATATATGAAGATCCTTATAATGATTCATTAAAAGATAAGGCATTGTTTTTAGCTATAAAAATATATGAATTTCTTAGGGAGAAATTTGTACTAAGTGAATATGGAAAAGTTATCAACTTAAATAAAGAACGAATTTGCTCAGGATTTGCACATGGTACATCTGGATTTACACCGTATTTATATAAATTATATACAATAACTTCTAACAATGAGATATTGAAATTAGTACAAGATATTTTGGAATATGAAAGAAATGTTTTCTATACTCAAGATATTCCTGGATGGCGTTCATCAATTATAAAAGGAGAAATGGATGTTAGCTGGTGTAATGGTGTTGCAGGGATTCTTTTAGGTAAGTTATTATTGAAAGAATATGGTTATCATGATGATTTAATTGATGATGAAATTAAATTGGCATTTGATTCAGTACTTAAAACTAGTTTAGGTCATAATTTATCTTATTGTCATGGAGATATATCTGTACTAAATATTATAAGATATTATTCTAAACTAATGAATAATAAGCAGGTAGAAATACAATGTATGAATGTATTTCAACAATTATATGAGTGTATTAAAGATAATTGGAAATCACCAAAGAAAACATTGAATAAATATAACGGCTTAATGTTAGGATCAGCAGGGTTAGGGTACGCTATGCTTAAACAATATGATTATGAAAATTTAGATGAATTTTTATGGTTAGTTTAAATATTATTTTAAAGAATAGGTGAGGTTATGGTAAAAAAAAATAGTGTTCAAAATAAATATTTGAGTAATTGGGATTCGTCAGATATTGTTAACTCAATATGTAATGACTTATCTACCGCTTTTGGAAACTTTCAAAAGATATTTTTGAGTTATTGTGAAATGCATATAGAGATTGCTCTTGAAAGGTTTTCATTTAAATATTCATTTGCAATTGATAAACAGACAATAATGTGTTCACTTTTAACTAATATTGCTGAAGAAATTACTGGTTTATCAATACGTACTTTAATTGTAGAACTAAATAATTTAAAGTCAAATAATCTATTGGAAGGGGAAAATTCAATTGAAAGATATAACTATTTCAATGAAAAATTAGCTGATCAATTATATTTGGAAGATATTTTTTCTAGATATCCCGTATTGCTATATTTAATAGATACAAAAATAACGGATCGATTAATTCTTATAGATGAAATATTAGACCGATTGGGACAAGATAAACAAGATATTCAGAGCAAATTTAATATAAATGTCCATAATCTTACAAATATAAATATTTCTTCAGGTGATTCTCATAATAATGGGAAGAAGGTTACAATTTTACAATTTGACCAAAAGTATATTGTGTATAAACCTCACGGACTTTCACCGGAAAGTTTATTTAATAAAATAATTGATTACCTTAATAAAAAAGTTACTTTTGAATTTGATTTAAAAAAATTAGAATGTATAGATTGTACTAATTATGGATGGCAGGAATTTGCTGTTTATAGCGAAGCAGAAAATTCATATGATACTTATAAATTTTATTACCGTACAGGAGTTTTTCTTTCTATTTTTTATATGTTTTCATGTAGTGATTTGCATCATGAAAATATTTTAGCATGTAAGGATACTCCTGCAATATTTGATTTAGAAACATTAGTTAACATTTTTAGCCAATCATTTGAAGGTAATAGAATTACTGCAGAAATTGCCGGATCAGTTTTAGGAACAATGTTATTACCTTCAAATTTTGTAAATGGATGTTTTGATTTTGATTTGAGTGGAATGTCAGGAAGTGATGACATGATATCAAATAAATGGTTTTATTTCAAGCTTGAAAATTTAGGAACTGATAATATAGGCCTTAGGAAAGAGGCTTGCACCTCTCCAAAAGCTAACAATGCTTTGGTTTTTAATAATGAAATTGTATCACCTAAATTAAATTTTTTAAGTATAAAAAATGGTTTTTCAACCTGTTATTGTGCTTTAGAAAAAAATAGTGATGAGATACTAAATATTATTAGTAAAAGTATGTTTGTTATCAGACATGTTCTTAGACCAACTGCTGTATATGCTCGTTTTCTAGAAGCAAGTACATATCCTAAATATCTGGGATCTATGGAAGCAATGCAAAATTTATTTTCAAAGCTATATACGAATGATTCTAAGAACGATATTGTTAAATGTGAAATAGATGCTTTGATCAAACATGATGTTCCATATTTTTCGTCTTATATAAACAGTACAACAGTTACTGGAAATAAAAATAAAAATATATTTTCTTATTTTCCTAAATCAGCTTATAAGGTTATTGAAGATAAGATTAAATCATTCAATAAAAATGACCTTAATAAACAGTTATATTATATAAGTCAATCTTTAAGTACAATAAAAGGCCCTGTAAACAATTATATATATAACTATGAAATTAAAGCAAAAGATAGTTACCTTTTAAATGCAAGATCAATTGCTGACCAGATATATAATTTTTCAGTGTTTAATTCTGATCAAAGTGAAGCCAGTTTTTTAATGACATTGGAATCATCAGATATGAAGAAAAATATTGATAATATGGATTTTAACTTGTATACAGGTGGTGGAATTATTCTATTTTTGGCTACCTTGGGAATCGAACTTAAGGAACAAAAATATGTTCGATTAGCAGAACAATTTTTAAATTACCAGCTATCCAATACAGATTCATTTAATTCAATATCCGCATTTACAGGGATAGGTTCTAAAATATATATATGCTATAATATGTATAAGCTTACAAATAATAAGACATATTATGAAGAAATCCATAAAATGTTATTAAAAATTAAGCTATATGAAAATTGTTCTAAAGATTTTGTGACAGGTACTGCTGGCTTGATTGTAGTCTTACTGAATATTTTTGAAAAAGAACAAGATAGAATTTGGCTTGAAAAAGCTGAATTGTTAGGAAGAGATTTATATCAATCTTTAATTACGGGAAATGACAATTTATTAACAGGATTAGCACACGGATTTTCAGGATTTGCATGGGCACTTATAAAATTAGGTATGGCGACCAACAAACAAAAATACATTAGTTTGGGTATGAAGCTAATTCAGAAAGAAAACATGCATTATACATCTTCTGAGCATAATTGGATGGATTTGCGTGAAGAAAATCGGTATTTATCCTATTGGTGCTACGGGGCAGCAGGTATTTCTTTAAGTAGAGTTAAAATTCAAGAATTATTAAATCGTGATGACAATACTATAACTGATGATTTATTAAATGGAATTGAAAATTTAAAGACATATAAATGTAAAACTGATAGCGCTTGTCATGGTACTTTTGGGAATATTGATATTATTCTAGAAATTGGTAAGATAAAAAAAATGGATAACTTGATAAATTTAGCTAAAGATTTTGCAAATACTCAATTAACATATATTCAAAATAATGGAATAGTTTTAGGGAATGATTCTTACCTCATGGATTATTCATTTATGCAGGGTATTTCTGGCATTGGGTACTCTTTAGTAAGATTAGCAAATAATAATTATCCATCTATTTTATCATTAGATGTAATGTAATAACTGTATTATAATTATATGCATATTTGATAAAAAGTTATATGTTATATATGGGTATTTTTTATGATGAAATATGGAACTCTAATATATTCTTTAGAATAATATTCTAATTAATATGTAATTCTTTAAAAAAGATGTATTTTAATTTCTATAGAGTAGTATTTGGATTTCTGTGTTACTTACATTGTATTGATATCGAAAAAGATTATATATATATTATTAAGTCCCAAAAATAATTGAACAATTACTCTAAAATTAAATGTAATGAAGAAAAGTAATTGAAGGTAATTTATGAGAGGTATAAGTTATAGAAAAGAGTTAAAAGAATCAATAATAAATGAAGTAAAGGAAGTTGTAAATGTTTCATTAGTAGCAAGAAAGCATATAATCTCAAAATCAACAATAGCTACGTGGATTAAAAATTTTAAAGAAAAAGATGAAATTGAAATGAAGCCAGAAAGAGAAGCTTTAGTTAAGGAAAAAATAATAATTCTAAAAAAGAAATAACACAAGGAAATGATACTCCAAAAAATATATAGAACAGGGATATAATGTAGTTTTTGATTTAAAAATAGTAAAATTATCTAGATCAATATATTACTATAATTTAAGTGTAGAAGGTAAAAAAAAATATAATCCGGTAATCACTAAACCAAAGGGATACTCTTTAACTAGAGAAGGTAAAAAAATCTGTGATGATCAAATTAAACGTAGCATTGTTGCTAATAGAACTGTAACTGGCTCAAATTATCTATGGGAAATGTATATAAAATATAGATATATTCAAGGGGAAGATAAATTTTTCTATATGCTTAACATTATAGATGCCTTCGATATAAGTATTGTTGATTATCATATGAAATTTCGTTGTGAATAAGAAGATGTTACTGAATTGTTAGGGAAAAGTTTAATTAGAAGAAAGTGATACAAAACCTATTATAAGAACTGATAATGGTTTACAATTTGAAAGTTATAAATTTAATGAATGGTGTGAAGAACTTAAATTAAAGCATGAAAGAATACCAGTAAAAACACCAAATAGGTATGTTAACATGGAATTTTTTTGAAGAATATTGGGGGATGAATGTTTTAAAAAACAACGAACTTCAGAGCTATAAAGAAACATATAGAATAGTAAATAACTTTGTTGACTTTTATAATAATAGAAGATTAAATTCTAGTCTAAGTTATATGACTCTTAATGAATTTTATAATCTTTATATGGAAGGCAATTAACTAATGTTGGGGTAAGAGTATAATTATAAGAAAATATGAGAACTAATTAGATAGTGTCCAAGATAAAGGGGGTAATCTGAATATGAATGAGAAAAACAAGTAAATACAATAATTTAAAAAGGAGATAAGATATGAGTAATATAGTTGTGAATACAAACAACTTACAAAAAAGTTTTAATAAAAAGATAGTGGTTAAGAATTTATGTTTAAGGATACCTAAAGGATGCATATTTGGACTTTTGGGTCCAAATGGAGTTGGCAAAACGACAACTATTCGCATGATACTTGGCTTGATTCGTCCAGATAATGGGAGTGTAGAGATATTTGGAAAAGATATTTCTTCAAACCGTGAAGCTATTTTAAAAAATATAGGGGCTATGGTTGAAACTCCATCCTTTTATGGTAATTTAAATGCATGGGAAAATCTAAAAATCGTTTGTTTAATGAAACAGATTAGTACAGAGCATATAAATTCTACTCTTGAGTTGGTTGGTTTGGAAAATTGTGCAGAAAAGAAAGTTAGTAAATTTTCTCTTGGAATGAAACAAAGGTTAGGAATTGCTACAGCTATTATTGGGAGTCCTAAACTTGTTATACTAGACGAGCCAGTTAATGGATTGGATCCTGCTGGTATACACGAAATTAGGACATTAATTAAAACTTTAGCAAAAAAATTACAAATTACCTTTTTAATTTCTAGCCATCTATTAAATGAAATGGAACTTATGGCAGATAAAGTTGGAATTATAAAAAATGGACATCTTATTTATCAAGGGGATTTACAACAACTAATGAAAAATCATCATAGAAAAATTGTATTAGGCGTTACTGAGTTAAAAAAAGCTATTAAATATTTTAGCAATAAGAATATACCAGTTATTAATCAAGACAATAATTTAGTAATTGAGGGCAAGTATACTGTAGAAGATATTTCTAAAGAACTCATGGAACAAGGAATTGGAATTACTAGTATTTACAATAAAAATGATTCATTAGAAGATATTTATTTAAAAATGATGGATGAATAATTCATATTTTTATAATGCGTTTTATATAATTGTGACAAATTTTATCTAAAAGTAGCAATAATAATTATTTATACTGTCTTAAGATAAGATTTGTGGAAATTGCAGAACTTTAAAACTGGATTTTATACGGAGGAATTAGATTATGTTATTTAAACTTTTAGAGTGTGAACAAATTAAGCTAAAAAGGACATGGATTTTTGGTGTATCTATTTTAATTCCGTTTGCTATAAATCTTTTGCTTACAATAGATCTACAATATCGCTATACAGGCTATCTTCTTGTATATCAGGAAGAAATGAAATTATCTTGTTGGCAATTGATATTTAAAGAACAACGTATTTTATATTTTACCGCACTTATTCCATTTTTTGCAACTTTAATTTTAATTCATGTGTTTTCTATAGAAACGAAAAACAATGGATGGTCTATGGTTTTAACTCAGCCTATAAAAAAATCAAAATTTCTTTTAGCAAAATATATTGTTAGTTGCAAATATATTACTGTACTGATTTTTTTTGATATTATAACAATAGCAATAGCAGGTATTATAACAGGTATAAAAGATCCACTTGATGTAGCGCTATTTATAAGATGCTTTTTGATATTGTGGAGTTCAGCAATGGCAACGGCAGCAATACAAATGAGTATACTACAAATATTTCCATCTAAATGGATAGGCTTGTTTATAGCTTTTTTTCTTGGAGTAAAATCACAAGATACATATTTAAATTGTATAATTGGTGAATTTAATCCTTATTCATTTACTGATTATAGTTTTAGAGCAAATTGGAATCAAACTTTGTCTATATTGATTATTTCATATATATTTATTATTGTTGGACTATTAATTTCTACTTTAATATTTAATAGGAAAAAATGTCTATAAGTAGTAAGAGGAGGGGGATTATGCTAAGAGCTGAATTATATAAATATTTTAAAAATCATTTGGTTAGTATAACCTTAATTATGCCAATTGCTTTGGTAGTATGTATGATATATTTATCACCTACATTAAATTATTCAGATACTTCCGATAAGGGAATTTTAATATATATTGTTTCCCGTAATTTTTTTTATACTATTATGGCTCCATTATATATTATCATAATTTGTAGGATTGTTGGAGAAATGGAGCAAAAAAAATAACAACTGGACATTTTTGCTGAGTATGCCATTGAAAAAAAATAGGATATATTTTATTAAGATGTTTGCTTTAACGGGGATGGTATTGGTACATTATTTAGGGTACTTAATGGGTATATTGTTAGTTAAAGTTATTTTAAATGATTTTAAAATAGCTTTTGGAAGCATTTTATTAGATTTATTGGTATCATTTTTATGCACCTTTTCAATAATATCCTTTTTTTATATCTTTTCGTTAGAAAAAATATCATTAATAGTTTATTTGGGCATAGGAATTATCATTCTACTATCTGGATTTTTGGCATCACAATCAGAAAATTTATGGGTATATTGTCCATCAAGTTATCCTTCTGTAGTTCCATCACTATCAAATGGAGTAAACAAATACATTTTTGTTGGTGTTGCACTTACTATAGTATTTCAATTAACCGGCTTTATACGCTTTTGGAAAAGAGAATGGATTTAATATAAATTGAGATATCGGATTGGCTCCCATAAAACTGATATTTTCTACCGGATATTAATTAGTTTGTAGATTTTTTTATAAATGCATTTGATTTGATAAAATCTAAACTATTATAGATTCTTTCTTCGTTATAAAACCTCATGTAGTCATTAATTATCTTATATCTATGAATAAAATTTATATTTCATTCTGTTATAAATATTCCTTTTCAAGTAAGGTATGAAAGGATTTTATATGAGCGTTATAATTAGGTGAGTTTGTTGGTATAAGCTCATGATATATATTATTAGATTCACAGAATTGTTCAAATTTAACAGAGGTGAACTGTGGACTAGTATCACTCCTAAGAATTATTTTTTAAGTAACATTATTTTCTTCTAATGCTCTTTTTATAGTGATTAAAGTATCCTCAGTTGTAGCAGTTTTGGTTATTTCTTTATCAACCAATTTTCTAGAGTATGCGGCTATAATATCTGTTAGCATTATAACTTCTCCATTAATTACTTTTATGTATTTTATATCTATTTGCTAAAGTTTATTTATTCCTGTTACTTCTCCTGCTATAGCTAAATATCCTTGTTTTGTATGCTTAGCATATGGTGCAAGTAGTCCTAATTTTTTAGCTAATCTATACACTTTCTTAGCAATGATTTTTACTAATAATTTTAGTGATTTTCTTATAGCCATAGAGAGGACGTTTTTTACAAGCTTCACGTAAGAGTATTTCAATTACTGGGCCATCTATTATACAGTTGTTTACACCATATGAATTACCTAAAGGTTTTTTTTTGCGCATTTTGGGTTTTCTTCTTAGGATAACAAGAAGTTCTTGATACTTGAAGTAATTTACATGCTCTAGCTAGTTTAAATCCTTTTTATTATATTCTTTTCCTAAAGCCACTTTAGGTATTTTTTTAAGTAAATCTTATAGCATATCAAGTCTTAGATTTTTTTACCTAAGAGCTCTTTAAGCTTTCTGCTTTCTTTTTCTAAGGCTTTTTCTTTAACTGTAAATTTATAATTTGTTGGTTTAGTAGCATTTATTACAGCAAGCTGTCTTTTGAATGTACTAAGTGTTGATTATGCTATCCCATATTTCTTGCATACTTGTGCATTTGTTAAATCATTATTTAATTCTTCTATTATTTCTATCTTTTGTTCCAAAGTGTATTTTCTTCTACCCATATTTTCTAACCTCCATGTTGATACTGTTATATTATCATGTTCGTTATATTATGTCGAATACCCTTATGAGGTTAGAAAGCTAACACCAACCTATTTCCAAAGATACATTTAATAAAGTAACGAATATATTAACTAAATTAGGAATAATAATTCTTCAAAGTAAAACAGGACTTGGAATTAATAAAGTACTTTCTATAAATAATGTTAGTATAGTATTGTAGATACAGAAAGCTGAACACATTAGAATATAAATAAAAGAAGGATATATTAAAAATAGAAATAGATCAACAACACGATATATAGAGAAATTTAAAAGTATAATAGTAGGGCTTTATAACCCGGAAAAAAGCTTAGCGGAATTAAGTAGCAAATATGACATATCAAAATTAACAATAATATAATGGATAAAGAAAAATAATCAGCTTGAAGAAGAATTAGAAATATAAAAAACTATGGCATATTCGCACGGAAGTAGCTACTTTATTTGAGTTCATTACTAACAACAAAAAATATCATAATATTGAGCTTATGTGTAAGGTATTAAAGGTGTCCGGAAGTTTTTATTATAAGTACTTAAATAAGAAGTCAATCAATAGAAAATAAAAAGATAAAAAGAAAAATTATAAATATATACAAAATGAGTAAGAATCACTATGGAGCATCAAAAATAAATCACTAAAAGCTTTGAGGAGAAATATTATCTTAAAGAAAGCTCAACGTTTAATGAAGAAGCTGGAAATAAGATCGATAATAATAATATTTTTTAGGCGATCAGTATCTAGAAAGAAAGTAGTAGAGTAAGAAAACGTTTTAAAAAGAAACCTTGAAGCAGTTACTATCAATGAAAAGTGAGTAACAGACATAACTTATATACATACAATTAAAGATGGCTGATGGTATTTAGATTCAGTTATGGATTTGCATAGTAGAAAGATAATTGGATATTCTATGTCTAAGGTTATTGATACCTCATTAGCTCTACAAGCTGTTTAAGCACCAACTGAAGCTTTGATTTTACATAGTGATTTAGAATATCAACACACAAGCTCCTCTTTTAAAGAGTACATAAATAGAGTACTAAATTAATTGCCCATTCTTTCGGTTTAAAAGGCTACCCATACGATAATGCCTGTATAGAATATGTGTGGAGAACGGAAGCATATCTTGCTAAATTTGAAAATTCTAATTTAGAGGTAGTTTTAACAAAAGAGGGTGTAATTCCTCAATATGACAACTTTGTAATACCTAAAAAAGCTAAGAATAAAAAATTAGCAGAAGAATTTATAAATTTCATATATAAACCTGAAATAAGTGCTCAAGTGTCTGAGGAATTTCCTTATGCAAATCCAAATAGGGCAGCATATCCTTTAATGGATAAAGATAAATTAAATCATATAGCAGTTTATCCACCAAGAGAAGCGGTAGAAGGAAATGAGCTTATTCAGGATGTAGGGGAAACTACAAAATTATATGATGATATACGGACTGAAATTAAAAACAGTAAAAAATAAAGATAGTTCATATTTGTTTTATCTTTCAAAGTATGAGTGATCATGCCAAAATTAGTATGAAACATTCAAAGTAATTATTAGGCTAACGGATGATATTTCTTGTTAGCCTATATTTTTAGTTTTATTATTTTAAAAGTAAGAATCCTCATTAATGATTATAATCAAGGAAAGTGAGTACCCCTACCTATCTTATATAGTATAAAAATTATAAAGTAGAAACTAATTTGTATAAGTATACAAGCATTAATTGAAATTCATATATTTATGTTTGTTGATAGATTTATGAAATTTTAGATCTAATAATTCTTAAAGTTCTTATAGTAATCTTTAGGGGATATACCATAGGCTTTTTTAAATGCACGTATAAAGCTTGAATAGTCTCCAAATCCACATTTTAGATATATTTCTGTAATCTTATATCCTTTTATTATAAGAGACTTAGAAAAAGCTAAACGTTTTTGTTGTATATATTTATGAAGAGTATAACCAGTTTGAGATTTAAATTTGTGCATAAGATAACATTTATTTATAAAAAATTTAGAGGATAAAGTATCTATAGACAGGTCCTCTTGAAGGTTTTCCTTTATATAATTTATAATTTCTTCTATTTGTTTATCATATTCTATATCTTTTTTGCATATATGGTTATTGCCATTCATAAATAATCTATTTAGATATACCATTAACTGAATGAATAAAGAATTTTTTAATACAATATTGCCAAATTCCTTATCCTTTGTGGCAGATTCGAGAGAAAATAAAGTATGTTTTATTAAGGATATATTATGTTCTTCCATACGGAAAAGATTAATTTTATGCTTAGAAGATAATTGAAAGCAAGTAAGCAAGTTGTTATTATTTTTATTGTGCATTTCTAAAAACTTTGAATTAACCCATATTATTATCCTTTCATAGGGTTCATCATTGTTTATTATAACTTTATGTAGATCATTACTGCTTACAAAAAGTATATCCCAGGGTTTCAGTTTATAAGCTTTTCCTTCTATAAGATAACTAACATTACCAGACATAAAAACAATTATTTTATTAAAGTCATGATAATGAAGCTCAAATTCCATATCTTTTTTATCCTTTAGGTGAAAAAATCTAAAATCTTCTTTTAAATATCCTCTTTTTATGTTTGATGAAGAGTTTTTTATGTTCATTATTATCCCATCCTTAAAAATTCATATATACATTATAGCATTTTTTGCGATATTAATAGCAGTTTTAACAATAAAAATAGCAAAAATTATATATATAATATATTATAGATTTGGATTTCATCACTAAGATTTTAAAAACATCTGTTTTAATAAAATGATAAATTAAGAAGTACACATTATTAGACAAGTATTTTTAAACTTAAGTTTAAGGTAGAATTCTATAGGAAGTCAAGAATTTTTGTTATTGGGCTTGGATTATGAAAGTAAAAATAGATTTTATAAAGCTATATATATTGGGAGGAGATAGAATGAAAGTATGGGAAAATTATAAATGGTCTATAATACTGCTTATTTCTGTAATTATAGGAGGAATAGTTGGATTAATTATAGGACCAAGAGCTGAAGTAGTAGAACCTTTAGGTAACTTATTTTTAAATTTAATGTTTACTGCAATTGTGCCCTTAGTATTTTTTAGTGTGGCTTCAGCTATTGCTAATATGGCTAATATGAAAAGACTAGGAAAGATTTTATTAAGTGTATTTATAGTATTTACTTTTACCGCATTAATTGCAGCTGTAATTGGTGTTATAGGAACTTTAATAATAAACCCTACAAAGGGTGTGGATCCTTCCACTATGCAAAAGATAATGGCAAATACAGCTAATGAAGTTCAAAATAAAGAGAAGGTAAGTATGCTACAACAAATTGTAAATACAGTTACAGTATCGGATTTTGCATTATTATTTTCTAGAAAAAATATGCTACAAATTATTATATTTTCAATAATCTTTGGTGTTTCTACAGCTATGGTTGGAGAAAAAGGTAAACCTGTTGCTAAGTTTTTAGAAGCTGGTTCAACTGTAATGATAAAAATGATAGACATAATAATGTATACAGCACCAATAGGACTTGGTTGTTATTTTGCTTCAGTAATAGGACAACTTGGTCCACAAATAATTGAAGGATATGTGAGAGTGTTTATATTATATTTGATACTTACTTTAGTATATTATTTTATTATGTTTAGCATATATGCATATATGTCAGCAGGAAAAACAGGAGTGCAACTATTTTGGAAGAATGCATTGGCTCCTTCAATAACATCTCTTGCTACCTGTTCTAGTGCAGCATGTATTCCTGTTAATTTAGAAAGCACAAGAAATATGGGTGTACCAAAGGATATTAGAGAAACAGTTATACCCTTGGGAGCAAACACTCATAAAGATGGCTCTGTTATAGGTGGAGTTTTAAAAATAACCTTTTTACTTCGATTATTTGGTCATGATATGACTAGTTTTAAAGCAATAATTACAATAATTGTAGTGTCTTATTTAATAGGAGCTGTTATGGGAGCTATCCCTGGTGGAGGACTTATAGGTGCTATGTTAATCATAAGCATATATGGCTTTGCCCCTGAAGTTTTAGGTATAGTGGCAGTCATAAGCACTATAATAGATGCTCCAGCAACCTTATTAAATTCTACAGGAAATACAGTATGTGCTATGATGATAACAAGGCTTGTGGAAGGAAAGAATTGGGCTGTTAAGAAAATTACAGCGTAAAAAGGGTGTAAGCATCCTTGGTTTAAAAAGAAATGTGTGGTTACAAAGGCAATTCACTTCAATAAGAGATTCTAATTTTGTTCAAATGCCTTTTACACCACACATTCCCTTTTTAAACCAATGAAAGCTAATATAAATTTTTAAAGATTATAAAAAAATATAATTAAAGATTTTGTATAAAGAAATGGAACAAAATCATCCTTATCTGTTCTCTTTCCTCTAAATAAAAGTCCTGTTTACTTCACGCTTAAATATTAATGCACAAATAAAGTATTCTTATTATTTTTATAGATATCTATACTCTCCAAAAGTATTTCTTGTTTTAATGCCTTTGAAAGTTTTTACAGTAATTTTAAATAGGGAGAGAAGGATGAGAATTGAAATCTTTGTTTTTTCTTAAAATATATTTTAGTGCTTTTTTATAATAAGTAAAAATATATATTATATTGAAAATAATGTTTGTTGTGGATATAATTAAACTATTGTTAAGTAGAGAGTGGCAGAAAATATTGAATAAAAAAATGTAATTTATAAGTAAATATATGTTTAAATAGAACATATAAGGAGGAGTAGTTGTGGATTTTAAAGAGATGACAATATCAGATATAAAAGAGGTTGTAGATATATATGTGCATACATTTAACTCTCCACCTTGGAATGACAAGTGGACAATTGAAACTGCTTCAAAACGTTTATATCAAATGATAAATTGTGAATCTTCATATGGGCTTGTAGCATATGAGGATGAGTTAATTTGCGGTATGATTTTAGGAAGTGAAGAGCAGTATTATGACAGTGTTGTGTTTAATATTAAAGAATTCTGTGTCAGGAATGATATACGGAACAAAGGGCTTGGTACAAAAATTTTTGAAGAATTTGAAAATCCATTAAAAGGTAAAGGTGTAACTGAGATTACATTAGTTACTACAAAGGATTATAGGACAGAAGGATTTTATAAAAAAAGAGGATTACAATCAAATAATGAGATGGTTGTTATGGGGAAAGAACTTTAATTATATTTTTATATATTTTATAGGGGGTAAAAAATGTCTGAGCACAGTGTTTCAAAGAAAGAGCTTATTTTATTCTTGGTAGTAACCTTTGGTTTTACTGCAGTTATGGGAATTGCTATGGCATTTACATATCCTAAATATAAAGTAGATGCTTTTCCGTTGGTACAGATGTGTTATCCAGCTACTGGTACTATGATAGCTTTATTGCTAAACAAGAACAAACGTAAAGAGTTGCCAATAAAATTTTATGGAGTCTATTTGTTTTTTACTATTACTTTAGTTTTATATATTTTGGTAGAGATATTTATATTTCATAAAAATCCAGGTTGGTATGTGGAATACTATACCATCATAGGAAGCTTGGCTTTAATCATTATGTATTTTTCAGACGAAAAAGACAAGATAGATGCTTTGGGATTGAAGGTTGGTAAAGATTCTAAAGAATGTCTCAGGTATACTTTGTTATTTGTTATTTTGTATCTATGTGCAATTTTTTTAGGTCAACTTATTTTTGGTAACGTTAAAGATTTTATTGCTCCTTTCAAAGATCCAAAGAGATTGGTAGGAATGTTTCTACTACCACTTTCATTTCCACTTACCTTTATTGTATTTTTCGGAGAGGAATATGGATGGAGATATTTTCTTCAAACAGCCCTTCAGGAGCGGTTAGGTAAACGAAAGGGAATAATTCTTCTAGGGATTATTTGGGGGATATGGCATTTGCCATTGAACTTATTTTATTATAGTCCAAAAACTTCTTTTTATTCTGTTATAAATCAGCTTATTGTTTGCATTGGTTATAGTGTATTCTTCGGATTTGTATATATGAAGACAGAAAACATATGGGCTGTTTCTATGATTCATTTTATCAATAATAATCTTGGTTTTATTCTTTACGGTAGTACAGGGGCGGATGTTGTTTTTAGCGGAAAAGCAGTCTTAGGAAATTTGTTTTGTATTTTTGTAACCTATTTACCTTTCTTATTTACTAAAGAATATAGTAAAAAAGAAGCCGAAGTTTCTAACTATAGTGCTTAG
Protein sequences of DBSCAN-SWA_2 >NC_017299|699366:732082|704097_704787_-|WP_041926529.1|DBSCAN-SWA MLHNKLLLQNITWKGLGNHMKKKSIKILIVGLVSFTLISFSTVTTFAANLSDIICSYSPKAVHITNDYNLKDYLSNSSKNSLNIADYAKSNYVLKYSEPIDVTRTSMAIEIIGHVYPDKIAKYLPFGLGNIITKHTSIIDIGEKSVDSNRWIWDSIAAVIGDNFDNSKRANSRSVNSLMLKMNTEQHVDEIIKNPKNKNLKLNKYIMIKVQKDIDNNTIDPILLKAIEN >NC_017299|699366:732082|725135_725294_-|WP_158308772.1|DBSCAN-SWA MAIRKSLKLLVKIIAKKVYRLAKKLGLLAPYAKHTKQGYLAIAGEVTGINKL >NC_017299|699366:732082|728777_730031_+|WP_014519835.1|DBSCAN-SWA MKVWENYKWSIILLISVIIGGIVGLIIGPRAEVVEPLGNLFLNLMFTAIVPLVFFSVASAIANMANMKRLGKILLSVFIVFTFTALIAAVIGVIGTLIINPTKGVDPSTMQKIMANTANEVQNKEKVSMLQQIVNTVTVSDFALLFSRKNMLQIIIFSIIFGVSTAMVGEKGKPVAKFLEAGSTVMIKMIDIIMYTAPIGLGCYFASVIGQLGPQIIEGYVRVFILYLILTLVYYFIMFSIYAYMSAGKTGVQLFWKNALAPSITSLATCSSAACIPVNLESTRNMGVPKDIRETVIPLGANTHKDGSVIGGVLKITFLLRLFGHDMTSFKAIITIIVVSYLIGAVMGAIPGGGLIGAMLIISIYGFAPEVLGIVAVISTIIDAPATLLNSTGNTVCAMMITRLVEGKNWAVKKITA >NC_017299|699366:732082|700594_700759_+|WP_014519811.1|DBSCAN-SWA MAEEKLFRITEEELVIAYKRVKVNRCAGDINGIVFEYFEHLGKIMRKICINYNI >NC_017299|699366:732082|707321_709502_-|WP_014519818.1|DBSCAN-SWA MNRYINNIINNEKSLNDFDSEIPIKETWQSKENNVKKQNKLALNLILKYYKVSSLTDSCMQSENIEYMILNLIPTKGLIYRSIILKNDWYKNGMGAMIGKMRTGETVVFIPKIVSGYKYINCKTKKIYNVTKKSTELFESKAFFFNKSLPKESLNISDFFKYILKAVPSQKYIMLFLSYLVVTLLGLILPNINQYIFSDIISNSSYKALLSVTYVLVGITIVTTLFTIISHSVVYNIRTTISVTTQNALIYRILSLPISFFKEYSSGDITKRLQSFISVISQMIDTILITVLTVLFSLVYIIQITKMTPVLAIPASIITLFILAFIVVFITMEMHVYIKLNKNDVNVANTFFSLLSGIQKIKLARAEERAFNYWNKKYKKSAELLYNPPFILKIQPHFSLIASYVTTIILYYIAATANISVASFMSFTVAFGMVTSALTSLSDVAIVFAQFYSTIELLDPILSSIPDSDDNKQITKKLSGNVELKDVCFKYNLQNKNVFDNFSLKIPSGQYIAITGPTGCGKSTLLRLLLGFEISQSGSVTYDNVNIKDMNLRNLRKQIGTVLQDGKLFTGSIFENITFFEPELTIEDAWNAAEIAGIADDIRNMPMGMFTLISEGDGSISGGQKQRILIARAIVSQPQILILDEATSSLDNITQENLIHSLEKLNCTKIVVAHRLSTVQLCDKIIMLNNGQITEEGTYTSLINKKGRFYNFVLRQQSYSIDINQN >NC_017299|699366:732082|706555_707311_-|WP_014519817.1|DBSCAN-SWA MKKIFAYVGSQKGKNSYTWKLTKNILEQVISLSDGEIQYNLISPDQIKINFCASCKCCFENGFCPQDNFDSMKSIKEDMLQSDLIILASPVYAHNVTGNMKVFIDRLTYWMHIFRLAGKLGVTISTSDSNGNEYINKYLNKFMQYCGINVICNFKAIQMINPLTTNNTFNNLDIMPISYLICDYLINNHQISATDFQETLFQNLKSYMLTLKENNIPSSETKYWEEHGYFNADSYNTILFKLQEENCRVLD >NC_017299|699366:732082|731077_732082_+|WP_014519837.1|protease|DBSCAN-SWA MSEHSVSKKELILFLVVTFGFTAVMGIAMAFTYPKYKVDAFPLVQMCYPATGTMIALLLNKNKRKELPIKFYGVYLFFTITLVLYILVEIFIFHKNPGWYVEYYTIIGSLALIIMYFSDEKDKIDALGLKVGKDSKECLRYTLLFVILYLCAIFLGQLIFGNVKDFIAPFKDPKRLVGMFLLPLSFPLTFIVFFGEEYGWRYFLQTALQERLGKRKGIILLGIIWGIWHLPLNLFYYSPKTSFYSVINQLIVCIGYSVFFGFVYMKTENIWAVSMIHFINNNLGFILYGSTGADVVFSGKAVLGNLFCIFVTYLPFLFTKEYSKKEAEVSNYSA >NC_017299|699366:732082|724799_724961_-|WP_079007347.1|integrase,transposase|DBSCAN-SWA MILRSDTSPQFTSVKFEQFCESNNIYHELIPTNSPNYNAHIKSFHTLLEKEYL >NC_017299|699366:732082|730606_731044_+|WP_014519836.1|DBSCAN-SWA MDFKEMTISDIKEVVDIYVHTFNSPPWNDKWTIETASKRLYQMINCESSYGLVAYEDELICGMILGSEEQYYDSVVFNIKEFCVRNDIRNKGLGTKIFEEFENPLKGKGVTEITLVTTKDYRTEGFYKKRGLQSNNEMVVMGKEL >NC_017299|699366:732082|702526_703063_+|WP_139369695.1|transposase|DBSCAN-SWA MKKFGFVKLIDSSTISTCITYFKWMEFRASKAGIKVHTKFDLGKGISETIVVTNAKEHDKSVLEELITEKDCIYIFDRAYVDYGCFDGYSQNNKYFISRLKNNALISEVKNLDITYCDSNHKLLDKDTEIIYDKIVHLGHNYNYKTKEKYRVIKIVDSQDREITFATNIFNLSTEEIS >NC_017299|699366:732082|714363_714579_+|WP_014519822.1|DBSCAN-SWA MIKNPIKRQSEDVKLPCGDTKVEITENQGLDVTGGTFSEGTISITLSVYMGNDGKVCTWTVECQNNCSHKK >NC_017299|699366:732082|725687_725792_-|WP_139369697.1|transposase|DBSCAN-SWA MGRRKYTLEQKIEIIEELNNDLTNAQVCKKYGIA >NC_017299|699366:732082|702200_702452_+|WP_139369702.1|DBSCAN-SWA MDNYNMLFQKFIDLIYWKSLKIASYKLNIDYLTIENHLKTLIYFQIAELDYLRDIHEFMQLKSDLTQIIKALAWEVYQIIITK >NC_017299|699366:732082|714884_717902_+|WP_158308769.1|DBSCAN-SWA MIEHIEQMLDIPLEKCGDQKLFYGYLASHDDNYLQISISDEQKKQINEYMKNDVAMIPVYMLYEDIVYKNVGKLLDAIENSKIIEDKSYFTSNIISQLNSLLGPQFIRTVVLELNCAREDGILKGNDSHQRYEYFINHMLTDSQYKEKFYTEYSSLLYVTTEIIQNFFDYVKDILINTESEMNQLNQIFSSNIELGKIKDIELSEGDTHCNGKSVAIINFTNSKIVYKPRTMKIDLQFQKFLKWVNLKKIIQGIRLATIKIHTIHNCGWMEYVEQEGCDSQENVNNFYTKSGVLLGILYCFNAVDFHFENIIAHGEEPILVDLETLFHPEIKDQILKNKNSGFQVATDFISKSVAKIGLLPTKMRIKKDNIVESVDVGALSEGKEQNNILKSLVLENLNTDNLCLAYKYLPIASKKNVPRLLGQSLNPKKYMLNLIEGFKAFYQFAQTNKEEVLNYILANFGGCQIRVILKSTVTYTSLLSIASHPDFMREPIHRLILLSKIGANEYYNLSIKQFELSELARSQVPYFYTYFESHDIHGYPNVYFSNNIEKNIPKVLTNKFNSLSTSDMETQINFIKDAFFIRNAQDDVTGISFDYKPYLNVKPNDWLQFAEQVAEHILSRSFTGINDDKRVDRAYIGAQTLMTDTNDWNVNVDSIDLYDGNSGTALFFIYLWKLTGNEEYHRYALETIQPIIHIVSKRNEVNYKSAIGAYKGVGGLIYVINKIAVLTQDSTLEDCIVGLYDIIEQNVQEDVNYDFIGGGIGCLAALLSIYEDPYNDSLKDKALFLAIKIYEFLREKFVLSEYGKVINLNKERICSGFAHGTSGFTPYLYKLYTITSNNEILKLVQDILEYERNVFYTQDIPGWRSSIIKGEMDVSWCNGVAGILLGKLLLKEYGYHDDLIDDEIKLAFDSVLKTSLGHNLSYCHGDISVLNIIRYYSKLMNNKQVEIQCMNVFQQLYECIKDNWKSPKKTLNKYNGLMLGSAGLGYAMLKQYDYENLDEFLWLV >NC_017299|699366:732082|723904_724144_+|WP_014519828.1|DBSCAN-SWA MLRAELYKYFKNHLVSITLIMPIALVVCMIYLSPTLNYSDTSDKGILIYIVSRNFFYTIMAPLYIIIICRIVGEMEQKK >NC_017299|699366:732082|722101_722998_+|WP_014519826.1|DBSCAN-SWA MSNIVVNTNNLQKSFNKKIVVKNLCLRIPKGCIFGLLGPNGVGKTTTIRMILGLIRPDNGSVEIFGKDISSNREAILKNIGAMVETPSFYGNLNAWENLKIVCLMKQISTEHINSTLELVGLENCAEKKVSKFSLGMKQRLGIATAIIGSPKLVILDEPVNGLDPAGIHEIRTLIKTLAKKLQITFLISSHLLNEMELMADKVGIIKNGHLIYQGDLQQLMKNHHRKIVLGVTELKKAIKYFSNKNIPVINQDNNLVIEGKYTVEDISKELMEQGIGITSIYNKNDSLEDIYLKMMDE >NC_017299|699366:732082|712549_713050_-|WP_014519820.1|DBSCAN-SWA MDLNLFREASLKKMLTPEEDSITDYVKNIHVKTWVILLAIFILLISILIFIFTATLPNKIELIGLSKENKLICYLSPEAYKSLSADSTVKINNTYDAKISNISSIPLSKDEVESTLKLDYYKSNITLSDWNMVVTITCDTNSIKDDKLYNITITNGYINLMNFFKN >NC_017299|699366:732082|705559_705817_-|WP_079007346.1|DBSCAN-SWA MRLHRLKKKYRWINYACGKPIQVRSFLARFEKVLFIFYNKQIKRLKILHFVDEGFWSYYYHRLKNNKFRWCMTQEEDLKLKQLET >NC_017299|699366:732082|714138_714330_+|WP_014519821.1|DBSCAN-SWA MKNNEVCKNAGFISEDELVELVDNSDISGGTAASAAAVSATVASATAVSALFTVTSACTTKCK >NC_017299|699366:732082|700422_700617_+|WP_014519810.1|DBSCAN-SWA MLIEKVELMIYENEIREEIFRLGKIHSSIEIAVMEVEQRDSIILTLEILTTSDWRIKFGRRKII >NC_017299|699366:732082|717962_720734_+|WP_158308770.1|DBSCAN-SWA MSNWDSSDIVNSICNDLSTAFGNFQKIFLSYCEMHIEIALERFSFKYSFAIDKQTIMCSLLTNIAEEITGLSIRTLIVELNNLKSNNLLEGENSIERYNYFNEKLADQLYLEDIFSRYPVLLYLIDTKITDRLILIDEILDRLGQDKQDIQSKFNINVHNLTNINISSGDSHNNGKKVTILQFDQKYIVYKPHGLSPESLFNKIIDYLNKKVTFEFDLKKLECIDCTNYGWQEFAVYSEAENSYDTYKFYYRTGVFLSIFYMFSCSDLHHENILACKDTPAIFDLETLVNIFSQSFEGNRITAEIAGSVLGTMLLPSNFVNGCFDFDLSGMSGSDDMISNKWFYFKLENLGTDNIGLRKEACTSPKANNALVFNNEIVSPKLNFLSIKNGFSTCYCALEKNSDEILNIISKSMFVIRHVLRPTAVYARFLEASTYPKYLGSMEAMQNLFSKLYTNDSKNDIVKCEIDALIKHDVPYFSSYINSTTVTGNKNKNIFSYFPKSAYKVIEDKIKSFNKNDLNKQLYYISQSLSTIKGPVNNYIYNYEIKAKDSYLLNARSIADQIYNFSVFNSDQSEASFLMTLESSDMKKNIDNMDFNLYTGGGIILFLATLGIELKEQKYVRLAEQFLNYQLSNTDSFNSISAFTGIGSKIYICYNMYKLTNNKTYYEEIHKMLLKIKLYENCSKDFVTGTAGLIVVLLNIFEKEQDRIWLEKAELLGRDLYQSLITGNDNLLTGLAHGFSGFAWALIKLGMATNKQKYISLGMKLIQKENMHYTSSEHNWMDLREENRYLSYWCYGAAGISLSRVKIQELLNRDDNTITDDLLNGIENLKTYKCKTDSACHGTFGNIDIILEIGKIKKMDNLINLAKDFANTQLTYIQNNGIVLGNDSYLMDYSFMQGISGIGYSLVRLANNNYPSILSLDVM >NC_017299|699366:732082|727599_728469_-|WP_014519833.1|DBSCAN-SWA MNIKNSSSNIKRGYLKEDFRFFHLKDKKDMEFELHYHDFNKIIVFMSGNVSYLIEGKAYKLKPWDILFVSSNDLHKVIINNDEPYERIIIWVNSKFLEMHNKNNNNLLTCFQLSSKHKINLFRMEEHNISLIKHTLFSLESATKDKEFGNIVLKNSLFIQLMVYLNRLFMNGNNHICKKDIEYDKQIEEIINYIKENLQEDLSIDTLSSKFFINKCYLMHKFKSQTGYTLHKYIQQKRLAFSKSLIIKGYKITEIYLKCGFGDYSSFIRAFKKAYGISPKDYYKNFKNY >NC_017299|699366:732082|703084_703327_+|WP_139369696.1|DBSCAN-SWA MELFFKCIKQNLKIKKFIGYSLNAVMMQIISAIMTFLMLKLIEKESTTSFGFTIIKRRIKYCLSKKVNSTEFLWANFLGG >NC_017299|699366:732082|699366_700152_-|WP_162470373.1|transposase|DBSCAN-SWA MIIQVDIHSKIEIGKLEDLHKLKLIMDKNNLKVNKSQIARELGVNLRTVGKYSNEYVSSTTRNLESKIDLFEPIIKELLSKDSIQIFYYKRILLQYLKDNHELDCAQSSFRRYISNHPEFNQYFGSRKKSHLSKTTPTRYETDKAKQAQLDWKENIEFILSTGEVININIFMLILSYLRFRVYKLSLHKTQNILFCFLDKSFKSFCGVPKELLKDNMKTVMDEPRTNYSKGKINNKFQQFAKDYGFKVHPCVADRLTPKLK >NC_017299|699366:732082|701056_701365_+|WP_041926527.1|DBSCAN-SWA MAIRKSLKLFVKITAKKVYRLAKKLGLLAPYAKHTKQGYLAIAGEVTGINKLWQIDIKYIKEINGEVIMLADIIDVYSRKLVGKRMTKTDTIEDSLSAIKRH >NC_017299|699366:732082|723140_723884_+|WP_014519827.1|DBSCAN-SWA MLFKLLECEQIKLKRTWIFGVSILIPFAINLLLTIDLQYRYTGYLLVYQEEMKLSCWQLIFKEQRILYFTALIPFFATLILIHVFSIETKNNGWSMVLTQPIKKSKFLLAKYIVSCKYITVLIFFDIITIAIAGIITGIKDPLDVALFIRCFLILWSSAMATAAIQMSILQIFPSKWIGLFIAFFLGVKSQDTYLNCIIGEFNPYSFTDYSFRANWNQTLSILIISYIFIIVGLLISTLIFNRKKCL >NC_017299|699366:732082|706289_706445_-|WP_014519816.1|DBSCAN-SWA MIALYFSIFAAFLCAFITISKNNNMIALYLSIFAAFLCAFIAISKNNNKKK >NC_017299|699366:732082|721778_721970_+|WP_158308771.1|DBSCAN-SWA MLTWNFFEEYWGMNVLKNNELQSYKETYRIVNNFVDFYNNRRLNSSLSYMTLNEFYNLYMEGN >NC_017299|699366:732082|721025_721241_+|WP_041926654.1|transposase|DBSCAN-SWA MRGISYRKELKESIINEVKEVVNVSLVARKHIISKSTIATWIKNFKEKDEIEMKPEREALVKEKIIILKKK >NC_017299|699366:732082|710389_712534_-|WP_014519819.1|DBSCAN-SWA MFYKPCIKVPVVMQLENVECGAACLTMILAHYGKWIPLNQVREECGISRDGCNLNNITLAAKNYGLEVHSYSCGLNHIMTKVKLPCIIHWHFNHFVVLNGFTKKGAMLTDPAQGRVVISIEEFSEGFTGVYMEFNKTSQFIADGKRQSIYMFVKNRLSNSISPIIFILLTSVITCIIALIYPVLGRIFLDYILSKSNPNWLCNLISVMLLLLLSQIIVAVITGITSLKIQGKYAIHADYCFIKHVLRLPFSFFSKHMAGDISVRQDSNRTISYTLIQRLAPTFLNLVLLITYFFIMIQYNVLLTVIVVSITCINSILARIISTKRLEISRVQATNIGKLMSKTLNGLQMIESIKANGSESGFYKIWAGNQAAVNNTNIRLDNISISWGMIPQLIEKLGNIIVLTLGAFYIMKNHFTVGMLLAFQGFMAAFIQPVNSLISAGQAIQEMRSSMERIEDIMQAKPDSFCTIDSSYKTESFEYLELNNVSFGYSKYSNPVIDDFNLKIQSGTSIAIVGTSGCGKSTLSKLISGLLEPWSGEISYFDNSLNEIPSNVFRKLLAVVDQNIVLFEDTIENNIKLWDSSITDEQMYAAAQDAQIHSTIMDRQNGYQEILLENGNNLSGGQRQCIEIARVLAQNPQVIIFDEATSALDADTEYKVMQAIRSRNITLIIISHRLSIVRDCDEIIVMDNGKISERGNHNELFKQNKMYTKYITTE >NC_017299|699366:732082|724166_724607_+|WP_041926530.1|DBSCAN-SWA MPLKKNRIYFIKMFALTGMVLVHYLGYLMGILLVKVILNDFKIAFGSILLDLLVSFLCTFSIISFFYIFSLEKISLIVYLGIGIIILLSGFLASQSENLWVYCPSSYPSVVPSLSNGVNKYIFVGVALTIVFQLTGFIRFWKREWI |
31 | Lactococcus_phage(25.0%) | protease,transposase,integrase | attL 707159:707175|attR 736487:736503 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
952809 : 964454
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NC_017299|952809:964454|DBSCAN-SWA ATTAATTAGTAATATCTATATGCAATCTTATATTATAGTTATTTAATTCTGTAACTTCTACTTTTAATATATAAATTGCACCATTTAATAAACGTATTGACTTGGTACTATTTAAGAGATTTAAATTTTGTTGTATATTAATTAAATTATAGCCGTCAATAGTTTCAGTGACTCTAAATAAAGTACCTATTCCTTGGTTATAACTAGTATAAAGCCTAATGTTAGATGTATCTTTATTATTAAAGTTACCAGGTACTGTAAATTCATATGAAATATAGTCATGGACATCAGGGCTTTGTCTTGTATAGTAATGTGCACCTGTTGAATTAAGATCATCTATTATATTAACTGAAGAATTCATTAAATTTCGGAGATCCCCTTCTTCTCTCTTGAATTGTATTTGATTTTCTATATTAGAAGAAGTTTGTGGTACTCTAATGTAGTAATTTTTATCCTTATTAAGCAAAACAACTAAATAACTTTTAACATTAGGACTGTCAAACCCAGTAATATAATTTATTGCTTTAATATCATCATCACATAAATTCCCAGATTGGAAATTTCTATTACCAGAACCTATCGCTTCATATATTTTTAATGATGGTAGATTATTCTGAGCATTAATTTTATAAATTCCTGTAGTATTTACTGTAAATAATATATAAAATGGATTATTATTTACAATACCCGGAATGTTATATGTGTAATTATCTGAAATAGCAGTATTTATTTTTTGTATATTTTCAGATGGGTCTATGACACCTACTACGATTTCTTCCTCGGGGCCATTCTGTATAAACCCATCTTCAGCCACTTGCGTTTTAACTACTTCAGATTCAGGTGAAGGAGCATTAGTTACTTCACAATATCCTAAGGAAGGAAGGTAATACTCAGCTTTATTAACAATACTTCCATTTTGATAGTCTATTAATTCATACTTTTCATAGGTATTATAAGCCTTTATGCATATATTTTTATTTGAAGGAGCTTCTTCTACAAATTTAAATAACGATGTTGATGTATTAAATAATTGTACATTGAAAGCGTCTTTAAGTCTTTCTTCAGTATATTGTTGTGAGAATTTTGCATCATTACTTGTGGTGAATAATGGCCTAGTTGTATTTCTTAGTCGAGGTTGTATAATACTTCCTGATGAACCTGCTTCGATTAATAATGTACCTATCAAATCTTTATCATTTGTTCTTATATATCCATCACCCTTATTAATAACATATAATCCATTACTATAAGGTAATACTCGTTGTGTGCTACTAACTTTAGAATTAAAAATATTGTTAGTTGGTATATTTTTAGTAGTTTCTAAAATTTTTTTATATAGGAATTGTTCATTTAAAATGCACTTATCATTAGTTAAAAAGTAAAAATCTTTATTTATTTTTTCCCCTGGATTAAATTCTATAGACTTAACATATCCAAGAGATGGAACATATAAAACTGCTCTTTCTATAATTTCATGTTGCAAGACTTTTATTATTTCATATCTAATGTAGGTATATTGTAAATACATATATAAGTTTTTATTTGAGGGAGCGGTTTTACTAAATTCAAATCCTATTGGAATTTGATTAGCTTCAGTAAAGTTAGCAAATACAGTTTGTATATTATTTTTTATATATTCTTCATTGAAGGATGGTGTTGGATAATAATATGGTATCGCATTATCATTTACACGTAGGTCCCCAACTATTCCTGTTGATCCATTACTAATTACACTTCCACCTAGTATTTGATTTTGTCTAGATAATATCCATCCATCCCCTCTGCTAACTACATAATTACCATCAGCTAAATCAATAGTATCACTATAGTTTATAACTTTTTCTTGTATATCATTATAAATTTTTTTTATAGATGAATTCATACACTTTTCTCCTTTATATTTTTTCAAGTTTGAACATTTCATTTGAATTGTATATATCAAAATTAGGTAGTAGGAGTAGTGGTTGGCTTAAAATATTTTTATTAGTATCATAAATGTCCCAGGCATAATCTAATTCATTCACTTTATTTAAACTTAACATAATATAAGTATTTACAGCGATTTTAATGGGAAACCAGTAGCATCTATTGGATAATGAATCTAAAGAAATAAATCCAAAGTTATCGTAACTTAAATACTTATTTGGTTCTGCTACATTAGAGATTTTAAAGCATCTATTTTCAGCCATATATTCTACATTCCATTTTTGATTATTTGCAGAAGATTCATTTGAAAATGTTAATGATCCTGATACAGGATTTAAATATAAAGAATCAGAAAAGATAGATTTTATATTGTAATTACCATTAGGTAGAAAAGTTCTTTCAACTGACATATAATTCACCTCTTTATAAATTAGATGATAGTACTCATATTAAATTTTTGTTGATATTAATTTTATGGGTTACGAATATACCATTTCTGATTATCATCTCCATGATAATTAAATACTTGAATATCAGTTCCGTTTGCTGTTTGGCTGTTATATAAATCTAGAGCTTTAGTTTTATCGCGTAGATTAGTAATTGTATATGTTTCATAAGTATCTGGAACAGGATTTATAAGCCAATATTGGGCATCATTATTTTGATCATTAGAATAAACCCTTACAGTATTACCATTTGAAAAAATCCATGTTAGAACTCCGTTTGAAAGTATTTCATTAAAAAACTGGTATGCTGCTTTTTCTTCATTATATCTAATTGTCCATTTTTGATTGCGATCATTGTTCCAAGTATATAAATTAACATTTAGATCTGTCATAGCTACTTGTTGTACAACTTTATTAGAAGCTAATATTGGACTTATTTTACATGTGAAATTGTTAAGATCTGATATTATATAATCTTCTATGATAAATTTTATATAATTTGAATTATTAAGTGTGCTAAGTTTCAAATTACGAGCTACGGTATCGGCATATAATACTAAGTTAGGGTTTTTATAACTTGCAATAATAAATGAATTGTTACCAATGTCTTTTAATAATAACCAATATTGATTATCTGCATTTGAATCTTGTTGCGCTGATATATTATGTGTTGGTGCATTCCATGTTAAAACTAAATTAGTATTATGGATATTCATACTTTTTATTTTATAAGCAGCTTTATTAGAATCATATATAATTCTCCATCTTTCAAGGTAATTTCTAGTTTGTTGAAATAAGCTAACGTTACCGTTACCGTCAACTTGATAAAAAAATAAATCTGTATTAGCCTTACAGGAGATGGTAACGATTTTGTCATTTAATGAATTTTGGATTACTGAATGGTGTTCCATTATGATTCCTCCTTTATTTAATAATTAATCTTACATATAATATATAACATAATGAAATTATTTTTTGTAAACCTAAAATTTAAAAGCAATTAGTTTCTTTATAGTAAATAAAGTAATAATATATATATTATGGGGGGATAGCGGTAAATATGAATAAATTGTTTTTACAAATTAAAATGTTGAAAAATGACAACAGAGAGTTTCAAGAAATTTTTAAGCATTTTGAAAAAACTATAGATATATTTACTAGAAAATATAATATATATGATAATTACAATGATATTTTGTACCATTTATGGTATATACTTAAAAAAGTTGATTTGAGCAATTTCAATACACAAAATGATTTAGAGAGATATATTAGTAGGACTTTAAAAAGATATTGCTTAGATATTTGCAATAAAAGAAAGATTGATAAGAAAATAATATATAATTCAGAAATTGCAGATAAGAAATTAAGCTTAATAGCAAATAGTTATTCAAGTTATTCAGAATTTGAATTTAATGATTTAATATCCATATTACCTGATAATCAAAAGAAAATTATATATATGAAATTTGTTGAAGATATTAAGGAGATAGATATAGCTAAAAAACTTAATATAAGTCGTCAATCTGTATATAAAAATAAAATACTGGCTTTAGAGAGATTAGAACCCATATTGAAAAAATTAATTAATATGTAGTTTATATTTTTTAAAAATTTTAGGTTTACAAAAAATAGTGTGGCTATGTTATATATAAATGATAACAATATACTGAAAAATATATCCAAAATTTAAGGGGGCGTGTATAGTAAATAATTAAAAGTATGTGCGTTGAAATAAATTTAGGAGAGTGGTTAGATATGAATATAAATGACAACTTAAGTATAAATTCCCCAGTAGATAATAAAAATGTTGTAGTAGTTAGAGCTAGAAAAACTGATACGTTTTTTAAGGCTTTTAAGGTTGCTCCTAATATTTGGGTGGCGCCAGAGAGATATTATGGCGAATCTCTGAGTATAGATGAAGAATATAAAGTTGATGGGGGAATATATGATTCTAATTTTCTTTCACAAGATAGTGAAAAAGATAAGTTCTTACAAGCCATTATTACTTTGTTAAAAAGAATTAATAATACTAACGCTGGGGAAAAATTATTATCTTTGATTTCTACAGCTATTCCATTTCCTTATGGATATATAGGTGGAGGATATTATGCACCTAATATGATTACTTTTGGATCAGCACCAAAATCTAATAAAAAATTGAATTCTTTAATTTCAAGTACTATTCCATTTCCTTATGCAGGATATAGAGAAACAAATTATCTTTCATCTGAAGATAATAAAAGTTTCTATGCATCTAATATAGTTATTTTTGGTCCAGGAGCAAACATAGTAGAAAACAATACTGTTTTTTATAAAAAGGAAGATGCAGAAAATGGTATGGGAACAATGACTGAAATATGGTTCCAACCATTTCTAACCTATAAATATGACCAATTTTATATTGATCCTGCAATAGAATTAATGAAATGTTTAATAAAATCTCTTTATTTCTTATATGGGATAAAACCAAGTGATGATTTAGTTGTTCCATATAGATTAAGAAATGAATTAGAGAATATAGAATACTCACAGTTGGATATAGTTGATTTACTAGTATCCGGAGGCATTGATCCTAAATTTATAAATACAGATCCATATTGGTTTATAGATAATTATTTCTCAAATGCAAAAAAAATGTTTGAAGATCATAGGAATATTTATGAAACAGAAATTGAAGGAAATAATGCCATTGGTAATGATATAAAATTGAGATTAAAACAAAAGTTTCGAATCAATATCAATGATATATGGGAATTAAATTTAAATTATTTCTCTAAAGAGTTTAACATTATGATGCCAGATAGATTTAATAATGCACTTAAACATTTTTATAGAAAACAATACTACAAAATAGATTACTCAGAAAATTATAGTATAAATGGTTTTGTTAATGGTCAAATTAATGCTCAATTATCTTTATCAGATAGAAATCAAGATATTATAAATAAACCTGAAGAAATAATTAATTTATTAAATGAAAATAATGTTTTATTAATGAGAAGTAATATTTATGGTGATGGATTAAAAAGCACTGTAGATGATTTTTACAGTAATTATAAAATCCCATATAATAGAGCCTATGAATATCATTTTAATAATTCAAATGATTCTTCTTTAGATAATGTTAACATTGGAGTAATAGACAATATTCCAGAGATTATAGATGTAAATCCTTATAAGGAAAATTGTGATAAGTTTTCGCCGGTACAGAAAATTACAAGTACTAGAGAAATTAATACAAATATACCATGGCCTATAAATTATTTACAAGCTCAAAATACCAACAATGAAAAATTTAGTTTATCCTCAGATTTTGTAGAAGTAGTTTCTTCTAAAGATAAATCTTTAGTGTATTCTTTCTTATCTAATGTAATGTTTTATTTAGATTCCATAAAGGATAATAGTCCTATTGATACAGATAAAAAATATTATTTATGGTTAAGAGAGATTTTTAGAAATTATTCTTTTGATATTACTGCAACTCAAGAAATTAATACTAATTGCGGTATTAATAAAGTAGTAACTTGGTTTGGAAAAGCATTAAATATTTTAAATACATCAGATTCTTTTGTAGAAGAATTTCAAAATTTAGGGCCAAGTTCACTTATTAATAAAAAAGAAAATTTAAGTATGCCAATAATTGAGATTTATGAAATCCCTAACGATATGTTAGGATTACCACTAAATGATTTAAATGAAAAATTATTTAACATATATTCTAAAAATACAGCTTATTTTAAAAAAATCTACTATAATTTCCTAGATCAGTGGTGGACACAATATTATAGTCAATATTTTGATTTAATTTGTATGGCTAAAAGATCAGTGTTAGCTCAAGAAACTTTAATAAAAAGAATAATACAAAAAAAATTGAGTTATTTAATAGGAAATTCTAATATATCATCTGATAACTTAGCATTGATGAATCTTACAACAACAAATACATTAAGAGATATTTCAAACGAATCACAAATAGCAATGAATAATGTAGATAGTTTTTTAAATAATGCCGCTATATGTGTTTTTGAAAGTAATATATATCCTAAATTTATTTCTTTTATGGAACAATGTATTAATAATATAAATATTAAGACAAAAGAATTTATACAAAAATGTACTAATATTAATGAAGATGAAAAATTACAATTAATTAACCAAAATGTTTTTAATAGCTTAGATTTTGAATTCTTAAACATTCAAAATATGAAAAGTTTATTTAGTTCAGAGACAGCATTACTTATAAAGGAAGAAACTTGGCCTTATGAACTAGTGTTATATGCTTTTCAGGAATCAGGTAATAATGTTATCGGAGATGCATCTGGTAAAAATACATCAATAGAATATTCTAAGGACATAGGTTTAGTTTATGGAATAAATAGTGATGCATTATATTTAAATGGATCTAATCAAAGTATAAGTTTTTCTAATGATTTCTTTGAAAATGGATTAACTAATAGTTTTTCAATTTATTTTTGGTTGAGAAATTTGGGCAAAGATACTATTAAATCTAAGTTAATAGGTAGTAAGGAAGATAATTGTGGTTGGGAAATTTATTTTCAAGATACTGGGTTGGTTTTTAATATGATAGATTCTAATGGAAATGAGAAGAATATATATCTATCTGATGTTTCTAATAATAGTTGGCACTATATAACTATATCTGTAGATCGTTTAAAAGAACAATTATTAATATTTATTGATGATAATTTAGTGGCTAATGAAAGTATTAAAGAAATTTTAAATATCTATTCAAGTAATATAATTTCTTTATTAAGCGAGAATAATCCAAGTTATATTGAGGGATTAACTATTTTAAATAAACCCACTACAAGTCAGAAAGTTTTGAGTAATTATTTTAAGGCTCTAAATAATTCATATATAAGAGACAGTAGTGAAGAACGATTAGAATACAATAAGACATATCAATTATATAATTATGTATTTTCAGATAAGCCTATATGTGAAGTTAAACAAAATAATAATATATATTTAACAATTAATAATACAAACAATTTAAATTTACAAGCTTCTAAATTTAAATTATTAAGTATCAATCCAAATAAACAATATGTTCAAAAATTTGATGAGGTAATAATATCTATATTAGATAATATGGAAAAATATATAGATATATCTGAAGATAATAGATTGCAGCTAATAGACAACAAAAATAGCGCAAAGAAGATGATAATTAGTAATGATATATTTATTTCTAATTGTTTAACTCTATCTTGTGGCGGTAAATATATATGTTTATCTATGAAAGATGAAAACCATAATTGGATGATATGTAATAATGATATGTCAAAGTATTTGTATTTATGGTCATTTAAATAATTAATAATTTAATTAATTTTAAATATTATAAGAGGTGTTAAATATGCTATTTGTTAATAAACAATTTAATTATAAAGATCCTGTAAATGGTGTTGATATTGCTTATATAAAAATTCCAAATGCAGGACAAATGCAACCAGTAAAAGCTTTTAAAATTCATAATAAAATATGGGTTATTCCAGAAAGAGATACCTTTACAAACCCTGAAGAAGGAGATTTAAATCCACCACCAGAAGCAAAACAAGTTCCAGTTTCATATTATGATTCAACATATTTAAGTACAGATAATGAAAAAGATAATTATTTAAAGGGAGTTACAAAATTATTTGAGAGAATTTATTCAACTGAGCTTGGAAGAATGTTGTTAACATCAATAGTAAGGGGAATACCATTTTGGGGTGGAAGTACAATAGATACAGAATTAAAAGTTATTGATACTAATTGTATTAATGTGATACAACCAGATGGTAGTTATAGATCAGAAGAACTTAATCTAGTAATAATAGGACCCTCAGCTGATATTATACAGTTTGAATGTAAAAGCTTTGGACATGACGTTTTGAATCTTACGCGAAATGGTTATGGCTCTACTCAATACATTAGATTTAGCCCAGATTTTACATTTGGTTTTGAGGAGTCACTTGAAGTTGATACAAATCCTCTTTTAGGTGCAGGCAAATTTGCTACAGATCCAGCAGTAACATTAGCACATGAACTTATACATGCTGGACATAGATTATATGGAATAGCAATTAATCCAAATAGGGTTTTTAAAGTAAATACTAATGCCTATTATGAAATGAGTGGGTTAGAAGTAAGCTTTGAGGAACTTAGAACATTTGGGGAACATGATGCAAAGTTTATAGATAGTTTACAGGAAAACGAATTTCGTCTATATTATTATAATAAGTTTAAAGATATAGCAAGTACACTTAATAAAGCTAAATCAATAGTAGGTACTACTGCTTCATTACAGTATATGAAAAATGTTTTTAAAGAGAAATATCTCCTATCTGAAGATACATCTGGAAAATTTTCGGTAGATAAATTAAAATTTGATAAGTTATACAAAATGTTAACAGAGATTTACACAGAGGATAATTTTGTTAAGTTTTTTAAAGTACTTAACAGAAAAACATATTTGAATTTTGATAAAGCCGTATTTAAGATAAATATAGTACCTGAGGTAAATTACACAATATATGATGGATTTAATTTAAGAAATACAAATTTAGCAGCAAACTTTAATGGTCAAAATACAGAAATTAATAATATGAATTTTACTAAACTAAAAAATTTTACTGGATTGTTTGAATTTTATAAGTTGCTATGTGTAAGAGGGATAATAACTTCTAAAACTAAATCATTAGATGAAGGATACAATAAGGCATTAAATGATTTATGTATCAAAGTTAATAATTGGGACTTGTTCTTTAGTCCTTCAGAAGATAATTTTACTAATGATCTAAATAAAGGAGAAGAAATTACATCTGATACTAATATAGAAGCAGCAGAAGAAAATATTAGTTTAGATTTAATACAACAATATTATTTAACCTTTAATTTTGATAATGAACCTGAAAATATTTCAATAGAAAATCTTTCAAGTGACATTATAGGCCAATTAGAACTTATGCCTAATATAGAAAGATTTCCTAATGGAAAAAAGTATGAGTTAGATAAATATACTATGTTCCATTATCTTCGTGCTCAAGAATTTGAACATGGTAAATCTAGGATTGTTTTAACAAATTCTGTTAACGAAGCATTATTAAATCCTAGTAGTGTTTATACATTTTTTTCTTCAGACTATGTAAGGAAAGTTAATAAAGCTACGGAGGCAGCTATGTTTTTAGGCTGGGTAGAACAATTAGTATATGATTTTACCGATGAAACTAGCGAAGTAAGTACTACGGATAAAATTGCAGATATAACTATAATTATTCCATATATAGGACCTGCTTTAAATATAGGTAATATGTTATATAAAGATGATTTTGTAGGTGCTTTAATATTTTCAGGAGCTGTTATTCTGTTAGAATTTATACCAGAGATTGCAATACCTGTATTAGGTACTTTTGCACTTGTATCATATATTGCGAATAAGGTTCTAACTGTTCAAACAATAGATAATGCTTTAAGTAAAAGAAATGAAAAATGGGGCGAGGTCTATAAATATATAGTAACAAATTGGTTAGCAAAGGTTAATACACAGATTGATCTAATAAGAAAAAAAATGAAAGAAGCTTTAGAAAATCAAGCAGAAGCAACAAAGGCTATAATAAACTATCAGTATAATCAATATACTGAGGAAGAGAAAAATAATATTAATTTTAATATTGGTGATTTAAGTTCGAAACTTAATGACTCTATAAATAAAGCTATGATTAATATAAATAAATTTTTGAATCAGTGCTCTGTTTCATATTTAATGAATTCTATGATACCTTATGGTGTTAAACGGTTAGAAGATTTTGATGCTAGTCTTAAAGATGCATTATTAAAGTATATATATGATAATAGAGGAACTTTAATTGGTCAAGTAGATAGATTAAAAGATAAAGTTAATAATACACTTAGTACAGATATACCTTTTCAGCTTTCCAAATACGTAGATAATCAAAGATTATTATCTACATTTACTGAATATATTAAGAATATTATTAATACTTCTATATTGAATTTAAGATATGAAAGTAATCATTTAATAGACTTATCTAGGTATGCATCAGAAATAAATATTGGTAGTAAAGTAAATTTTGATCCAATAGATAAAAATCAAATTCAATTATTTAATTTAGAAAGTAGTAAAATTGAGATAATTTTAAAAAATGCTATTGTATATAATAGTATGTATGAAAATTTTAGTACTAGCTTTTGGATAAAAATTCCTAAGTATTTTAGCAAGATAAATCTAAATAATGAATATACAATAATAAATTGTATAGAAAATAATTCAGGATGGAAAGTATCACTTAATTATGGTGAAATAATCTGGACTTTGCAGGATAATAAGCAAAACATACAAAGAGTAGTTTTTAAATACAGTCAAATGGTTGCTATATCAGATTATATAAACAGATGGATTTTTATAACTATCACTAATAATAGATTAAATAACTCTAAAATTTATATAAATGGAAGATTAATAGATCAAAAACCAATTTCAAATTTAGGTAATATTCATGCTAGTAATAATATAATGTTTAAATTAGATGGTTGTAGAGATCCACATAGATACATTTGGATAAAATATTTTAATCTTTTCGATAAAGAATTAAATGAAAAAGAAATCAAAGATTTATATGATAATCAATCAAATTCAGGTATTTTAAAAGACTTTTGGGGTAATTATTTACAATATGATAAACCATACTATATGTTAAATTTATATGATCCAAATAAATATGTCGATGTAAATAATGTAGGTATTAGAGGTTATATGTATCTTAAAGGGCCTAGAGGTAGCATAGTGACTACAAACATTTATTTAAATTCAAGTTTGTATATGGGGACAAAATTTATTATAAAAAAATATGCTTCTGGAAATAAAGATAATATTGTTAGAAATAATGATCGTGTATATATTAATGTAGTAGTTAAAAATAAAGAATATAGGTTAGCTACTAATGCATCACAGGCAGGCGTAGAAAAAATACTAAGTGTATTAGAAATACCTGATGTAGGAAATCTAAGTCAAGTAGTAGTAATGAAGTCAAAAAATGATCAAGGAATAAGAAATAAATGCAAAATGAATTTACAAGATAATAATGGGAATGATATAGGCTTTATAGGATTCCATCAGTTTAATAATATAGATAAACTAGTAGCAAGTAATTGGTATAATAGACAAATAGAAAGATCTAGTAGGACTTTTGGTTGCTCATGGGAATTTATTCCTGTAGATGATGGATGGGGAGAAAGTCCACTGTAA
Protein sequences of DBSCAN-SWA_3 >NC_017299|952809:964454|955206_956091_-|WP_014520036.1|DBSCAN-SWA MEHHSVIQNSLNDKIVTISCKANTDLFFYQVDGNGNVSLFQQTRNYLERWRIIYDSNKAAYKIKSMNIHNTNLVLTWNAPTHNISAQQDSNADNQYWLLLKDIGNNSFIIASYKNPNLVLYADTVARNLKLSTLNNSNYIKFIIEDYIISDLNNFTCKISPILASNKVVQQVAMTDLNVNLYTWNNDRNQKWTIRYNEEKAAYQFFNEILSNGVLTWIFSNGNTVRVYSNDQNNDAQYWLINPVPDTYETYTITNLRDKTKALDLYNSQTANGTDIQVFNYHGDDNQKWYIRNP >NC_017299|952809:964454|952809_954690_-|WP_014520034.1|DBSCAN-SWA MNSSIKKIYNDIQEKVINYSDTIDLADGNYVVSRGDGWILSRQNQILGGSVISNGSTGIVGDLRVNDNAIPYYYPTPSFNEEYIKNNIQTVFANFTEANQIPIGFEFSKTAPSNKNLYMYLQYTYIRYEIIKVLQHEIIERAVLYVPSLGYVKSIEFNPGEKINKDFYFLTNDKCILNEQFLYKKILETTKNIPTNNIFNSKVSSTQRVLPYSNGLYVINKGDGYIRTNDKDLIGTLLIEAGSSGSIIQPRLRNTTRPLFTTSNDAKFSQQYTEERLKDAFNVQLFNTSTSLFKFVEEAPSNKNICIKAYNTYEKYELIDYQNGSIVNKAEYYLPSLGYCEVTNAPSPESEVVKTQVAEDGFIQNGPEEEIVVGVIDPSENIQKINTAISDNYTYNIPGIVNNNPFYILFTVNTTGIYKINAQNNLPSLKIYEAIGSGNRNFQSGNLCDDDIKAINYITGFDSPNVKSYLVVLLNKDKNYYIRVPQTSSNIENQIQFKREEGDLRNLMNSSVNIIDDLNSTGAHYYTRQSPDVHDYISYEFTVPGNFNNKDTSNIRLYTSYNQGIGTLFRVTETIDGYNLINIQQNLNLLNSTKSIRLLNGAIYILKVEVTELNNYNIRLHIDITN >NC_017299|952809:964454|954703_955144_-|WP_014520035.1|DBSCAN-SWA MSVERTFLPNGNYNIKSIFSDSLYLNPVSGSLTFSNESSANNQKWNVEYMAENRCFKISNVAEPNKYLSYDNFGFISLDSLSNRCYWFPIKIAVNTYIMLSLNKVNELDYAWDIYDTNKNILSQPLLLLPNFDIYNSNEMFKLEKI >NC_017299|952809:964454|956240_956777_+|WP_014520037.1|DBSCAN-SWA MNKLFLQIKMLKNDNREFQEIFKHFEKTIDIFTRKYNIYDNYNDILYHLWYILKKVDLSNFNTQNDLERYISRTLKRYCLDICNKRKIDKKIIYNSEIADKKLSLIANSYSSYSEFEFNDLISILPDNQKKIIYMKFVEDIKEIDIAKKLNISRQSVYKNKILALERLEPILKKLINM >NC_017299|952809:964454|960563_964454_+|WP_014520039.1|DBSCAN-SWA MLFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTELGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHDVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGEHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPEVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDEGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIVLTNSVNEALLNPSSVYTFFSSDYVRKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWGEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIGDLSSKLNDSINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASEINIGSKVNFDPIDKNQIQLFNLESSKIEIILKNAIVYNSMYENFSTSFWIKIPKYFSKINLNNEYTIINCIENNSGWKVSLNYGEIIWTLQDNKQNIQRVVFKYSQMVAISDYINRWIFITITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDPHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGNYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSIVTTNIYLNSSLYMGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSVLEIPDVGNLSQVVVMKSKNDQGIRNKCKMNLQDNNGNDIGFIGFHQFNNIDKLVASNWYNRQIERSSRTFGCSWEFIPVDDGWGESPL >NC_017299|952809:964454|956938_960520_+|WP_014520038.1|DBSCAN-SWA MNINDNLSINSPVDNKNVVVVRARKTDTFFKAFKVAPNIWVAPERYYGESLSIDEEYKVDGGIYDSNFLSQDSEKDKFLQAIITLLKRINNTNAGEKLLSLISTAIPFPYGYIGGGYYAPNMITFGSAPKSNKKLNSLISSTIPFPYAGYRETNYLSSEDNKSFYASNIVIFGPGANIVENNTVFYKKEDAENGMGTMTEIWFQPFLTYKYDQFYIDPAIELMKCLIKSLYFLYGIKPSDDLVVPYRLRNELENIEYSQLDIVDLLVSGGIDPKFINTDPYWFIDNYFSNAKKMFEDHRNIYETEIEGNNAIGNDIKLRLKQKFRININDIWELNLNYFSKEFNIMMPDRFNNALKHFYRKQYYKIDYSENYSINGFVNGQINAQLSLSDRNQDIINKPEEIINLLNENNVLLMRSNIYGDGLKSTVDDFYSNYKIPYNRAYEYHFNNSNDSSLDNVNIGVIDNIPEIIDVNPYKENCDKFSPVQKITSTREINTNIPWPINYLQAQNTNNEKFSLSSDFVEVVSSKDKSLVYSFLSNVMFYLDSIKDNSPIDTDKKYYLWLREIFRNYSFDITATQEINTNCGINKVVTWFGKALNILNTSDSFVEEFQNLGPSSLINKKENLSMPIIEIYEIPNDMLGLPLNDLNEKLFNIYSKNTAYFKKIYYNFLDQWWTQYYSQYFDLICMAKRSVLAQETLIKRIIQKKLSYLIGNSNISSDNLALMNLTTTNTLRDISNESQIAMNNVDSFLNNAAICVFESNIYPKFISFMEQCINNINIKTKEFIQKCTNINEDEKLQLINQNVFNSLDFEFLNIQNMKSLFSSETALLIKEETWPYELVLYAFQESGNNVIGDASGKNTSIEYSKDIGLVYGINSDALYLNGSNQSISFSNDFFENGLTNSFSIYFWLRNLGKDTIKSKLIGSKEDNCGWEIYFQDTGLVFNMIDSNGNEKNIYLSDVSNNSWHYITISVDRLKEQLLIFIDDNLVANESIKEILNIYSSNIISLLSENNPSYIEGLTILNKPTTSQKVLSNYFKALNNSYIRDSSEERLEYNKTYQLYNYVFSDKPICEVKQNNNIYLTINNTNNLNLQASKFKLLSINPNKQYVQKFDEVIISILDNMEKYIDISEDNRLQLIDNKNSAKKMIISNDIFISNCLTLSCGGKYICLSMKDENHNWMICNNDMSKYLYLWSFK |
6 | Clostridium_botulinum_D_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
1742686 : 1749751
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >NC_017299|1742686:1749751|DBSCAN-SWA ACTATGTCATATTTGAATATATATCATTAATTTTTTTACATTTATCCTTTATAATTTCTCTAATATGATTGGGTTCAAGTACTTCCACATATTCTCCGTAACTTAATATCATGGAATATATCCAGTCATCTTCTAATAAATATGTATCTACAATTACACTACCATCTTCTTGAAACTTTATTTCATCTTTATCGAAACAATCGTCTATTCTATATCTAACTCTTTCAGAAAACTTTAATACAACTCTTGTAGGTACTTGTTCACTCTCACTAATATTTATATATTCTTTATAGGAAATTCTATTTTCACTAATTTTTTCATCTAAAACAGTTAAATTTTCAATTCTTGATAATTTGAAAAACCTATAATCATTTTTAAATTTGCAAAAGGAAAATAGATACCAATAAAAACCTTTAAAAACAAGAGTTAATGGTTCTACTTTTCTCCGATTATATTCACTTTTTGAGTTCCTATAATCAAATACTATACATTTTTTTGATTTAACGGCATTATGTATAATTTTATACTTTAAATTTTCTTCGTCACATTTTTTAAAACCCCAAGGTAATGTATCTATAAACATTTGATCAAAATGTAAATCAAATACTTCTTTCTTTTCTTTAGGAACAATATTTTTTACCTTTTCAATGGCTACATCAATACTTTTATCTTCTAAAAATCTATTCATATTTTTTAAAGATTCTATGATTGAAATCATATCTTCTAATGTTAAAAGCTGATGATTGATTTTATAGTTATCTATAATATAAAATCCACCGTTGTTTCCAATTTGAGAAACTATAGGAATTCCAGCAAGATTAATTGCTTCAATATCTCTATAAATTGTTCTTACAGAAACCTCAAATTTTTCAGCTAATTCTGATGCAGATATTTTTTCTCTATTCAAAAGTATGACAACAATTGATAATAATCTATTAATTTTCATGAATCTATAAACCCCCATAATTTGAAATGACTATTTTATTATATCAAATTAATAACTTGTAAGATTGGTTAGAGAGAAATTGTTGAGGGAATTGCATAAGAAAGTTTTAAAAGAATAAATTCCAAAATGGTAATTTTTGGGTTATATATGGGTATGAACTTGACTTAACAAATGTACTATAGTAAACTTATATCGTAAAAAAGAATAAAGACAGTTCGTAACCATCCTGTCTATAAATAAAACTAGGACGTAGCTACCGCCTTAGGTAGTTTTTTTGTTGATGGGCATTTAATGCCCTTTTTTATTTGCAAAAAATTTACAAATAGGATTTTTGTTTTAGGTAAAATTTTTAATTTATATAAAGTTTAGAAATTGTTATTCAAGGACGCAGAGGTCTTATCCAATGAATTTTTTAACTTAAATATAACAGTAACAGTATAAGGCTGTTTTTTATAAAGATTATCCAAATATAACTTAAAAACCTTACAAGTTAGGAAACTTTAAATAGTTGTAAAATATCCTAATGAATAATAATTTATCATAACCATTATAACTGTTTAATGTTTTCAAGTCTAAGTGAGTGTAATAGATTGAAAAATCTATAGCACAAGGAGGAATGAAAATGAAAAAAATAGGACTAACAACTACAGTGCCAGTGGAAGTTATTGTTGCAGCAGGATATACACCAGTAGATTTAAATAATATGTTTATAACTTCAGAGAATTATTTAAAATATATAGACATAGCTGAAAGAGACGGTTTCCCCAAAAGCTTATGTGCTTGGATAAAGGGGATTTATGGAGCATGTCTAGAAAATAATATTAAAGAAATAGTTGGAGTTATGGAGGGGGATTGTTCTAACACTAAAGCCCTCATTGAGGTTTTTAAACTAAGAGGAATAAAAATTTATCCATTTTCATTTCCCCATAGCCATAGTTTAAAGGATGTAGAAATTGAAATAAGAAAGTTCATGGATATCTTCAATGTTAACGAGGATAAGGTAGAACAGGTTAGAAAAAGATTAAATAGAGTTAGGAAGCTAGCAAAAAAAATAGATGAAATGACTTATATAGATAATAAGGTTAATGGTTTTGAAAACCACCTATATCAGGTGAGCTCAAGTGACTTTAATGGAAACATAGATGAATTTGAAGAACACCTTAAAAAAGTCATTGAGGGTATGGAGAAAAGAGAGCCAATAAATAAAAAATTAAGATTAGGCTATATAGGAGTTCCTCCAATGACTGGAGATATATATGAGTTTAGTGAAAAATTAAATGCTCATTTTGTATATAACGAAGTTCAAAGAGAATTTGCTTTTCCTAGGGGGATAGAAGCTGCAAATATATTTGAACAGTATTATAATTACACCTATCCTTATGATAATGAGTTTAGAATTAAGGAATTGAAAAAGGAAATAGAAAAGAGAAAGATAGATGCTATAATTCACTACACTCAGGCTTTTTGCCATAGAGCTGTTGAAGATATAGTATTAAAAGAAGAATTAAATATTCCTATGTTAAATATTGAAGGTGATAAGTTAAATACATTAGATGCAAGAACTAAACTAAGATTAGAAGCCTTTCTGGATATGTTGCTGGACTTAAAGCAGAAGTAATAGGTGATCTAGTAAGAATTTTTATCTTAATATATTGTTGGATTTAAAGCAAAAGTAATACACGGTATATAAAAGAAGTTCATGTTTTCTTTATATTTAGCGAAGGAGGGGAATTAATGAGATTGTTAGGAATAGACCTTGGAAGTAGAGAAGTTAAGATTGTTTTAATGGAAAACAATATTATAGTTCAAAAGAAAAAAGTAAGTACCATGAAATTTTATAGAGATTACTGTAGCTTTCATGGCAAGATTGTAGTAGATTTAGAAAAACTTAATATAGAAGGAATAGATAAAGCGATATCAACGGGTTATGGGAAAAATAATACGGATTTAGAATTTTTTACACCTATAAATGAGATAAAAGCCCATGTTTATGGTGGGATCTATCAAAGTAATTTAAAGGATTTTATACTTTTAGATGTAGGTGGTCAGGACGTTAAGGTGGTAAAGGTAGAAAAGGGCGTTGCAACAGATTTGGAGCTTAATGAAAAATGTGCTGCTTCCTGTGGAAGATACTTGGAGAATATGGCAAATGTACTTGAAATATCCCTAGATGAAATGAGTCAGTACTCGGAAAATCCCGTGGATTTAAATTCCACCTGTGCAGTATTTTCTGAATCAGAATTAATTGGAAAAATAGCCGAAGGGGTACACATAGAAAGGTTATGTGCTGGGGTTAATTACTCTTTGTATAAAAGGCTACAACCTCTTTTAAGTAAGTTTAGGGGAAAGAAATTAGTTATAACCGGTGGTGTTGCAAATAACCATTCAATAAAAAAATATTTAAATAATGATTATGAAGAAATAGTATCCGTAAAAGATCCTCAGTTTAATGGGGCTATTGGATGTTGTTATTACGGAAGCAAATTTCTAAAATAAACTTAGGAGGAAAAAACATGTATACTTTAAAAGTAGAACATAATTTTGATAGCGCTCATTTTCTTGCAGGTTATGAGGGGAAATGTGGAAATATTCATGGACACAGATGGAAGGTTGAAATTCAGGTTCAGGCAGAATCATTAGTAAAAGGCGGTCAACTTGACGGGATGATAATAGACTTTGGAGACTTAAAAAAAGATGTTAAATCTATGGTAGATTATTATGATCATGCACTTATAATAGAGAAAGGAACTATGAGGGGGCAATCATTAAGCTCATTAAAGGAGGATGGATTTCGTATAATAGAAGTTAATTTTAGACCAACAGCGGAAAATTTTGCAGCTTTTTTTTATAAAATTATGAAGGATAGAGGATATAATGTAAAAAGTACTACAGTTTATGAAACACCTAATAATAGTGCTACCTATGAAGAAAGTGGGGTAATTTAAAATGGATTTTAAGGTTGTTGAAAGGGTTGTAAGCATAAATGGAGAAGGAAGGCGTTGTGGACAACTGGCTATATTCATAAGATTCGCGGGTTGTAATTTAAACTGTAGCTATTGTGATACACTTTGGGCAAATGAAAAGGATGTACCCTATGAAGTATTAAGTTCCAAAGATATATATGAATATATTAAGTCCAAAGAGGTTAAAAATGTAACTTTAACAGGAGGAGAACCTCTTTTGCAAAAGGGAATAATGGAGTTATTAAAACTTTTGTCTAAGGATAAAGAACTTTATGTGGAAATTGAGACAAATGGCAGCATATTATTAGATGAATTTTTGAATATAGAAAATTCACCAAGCTTTACTATGGATTATAAACTTCCTTTAAGTAATATGGAAAATAAAATGGCATTAGATAACTTTAAATATTTAACTAAGAAGGATACAGTAAAATTTGTATCAGGTAGTATAGAGGATTTAGAAAAAGCTAGAGAAATAATAAATAAGTATAACTTAGTAGATAAAACTAGTGTGTATATAAGTCCTGTTTTTGGAAAAATTAATTTAGATACTATTGTAGAATTTATGAAAAATAATAGAATGAATGGAGTTAATTTACAACTGCAGCTTCACAAGATTATATGGGAGCCTAGTAAGAGAGGAGTATAGCATATGGCAATTGATGTTAAAGCAATTGAAGAACACATAAGGGGGATTTTGATAGCTTTAGGAGACAACCCAGAGAGAGAAGGTCTAAAGAACACACCAAAACGTGTAGCTAAAATGTATGAAGAAGTATTCAAAGGTATGTGTTATAGCAATGATGAAATTGCAGAAATGTTTAATGTAACCTTTGAAGATAATTTATGTATAAATGATAATGAAAATGACATGGTTTTTATGAAGGAAATAGAGATATTTAGTCATTGTGAACATCATTTAGCACTTATGTACAATATGAAAGTAGCCATAGCATATATACCTAAGAAAAAAATTATTGGTTTAAGCAAAATAGCACGAATAGCAGATATGGTAGGACGTAGACTACAGCTTCAAGAGAGGATTGGAAGTGATATAGCAGAAATACTTCAGAAGATAACTGACTCAGAAGATGTAGCTGTTATTATAGAAGGAGAACATGGCTGTATGACCACTAGAGGAATAAAGAAGCCAGGTACTAAAACTATAACAACTACATTAAGGGGAAAGTTTAACACAGATCCTATTGTAAGCAATAAATTAATGATGCTTTATACGAAATAAAGAAATTTTTAGTTCTAGTTAGAGTTTTATTAAAATAAATATATTAAATTCGTACAAGATTAAAAAATCTTACACATGAGTAGAACAGTTTATATAAAGAGAGTGTATTAAAGAAGCATAACTATAACAAAGATTTTTGTAGATTGTAGGATGATAATAAAATAATAAAGGGATGTGTAGTAAATGAATAAGGAAAAAGCAATAGTAGTATTTAGTGGTGGACAAGATAGTACAACCTGTTTATTTTGGGCAAAGAAAAAATATAAAGAAGTTATAGCAGTATCCTTTGATTATAATCAAAAACATAAATTAGAGTTAGACTGTGCAAAGGATATATGTAAAAAATATAATATTGAACATCATATTTTAGATTTAAATTTGTTAAATCAATTAGCACCAAATTCACTAACTAGGCAGGATATAACTGTTGATAAAAGCGCACCTAAAGAAGGAGTGCCTAATTCCTTTGTAGATGGAAGAAATTTATTGTTTTTAAGCTTTGTCGCAGTATTTGCAAAACAAAAAGGAATAAACACTATTATAACTGGTGTGTCACAGAGTGATTTTAGTGGATATCCAGATTGTAGAGATGTATTTATAAAATCTTTAAATGTTACATTAAATTTAGCTATGGATTATGAATTTGAAATAATTACACCATTAATGTGGATTAATAAAGCAGAAACGTGGAAAATGGCTTATGATTTAGGAGTTCTCGATATCGTTAAAGAAGAAACCTTAACATGCTACAATGGAATAAAAGCGGATGGATGTGGGGAATGTCCAGCTTGTAAATTAAGAAAAAAGGGATATTTGGAGTTTGAAAAAGAGTATTTAAAATAATAATTTTATATGTATTGCTTGAGCAATACTTCCTTTTTATATTTCGTATTTAGTTTTTGTAAATTTTGTCGATAATTTAATATTATAAGTATGAAATATTAGGAGGATTATATTATGATAAATATTTTTAGTAAAAAAGATAGTGAAAAGGATAATAAAAATGATACTATTGAGCAGGAAGTTATTGTTGAAGAAAAACATGAAGTTGAAACTATAGATACTATGAAATTTCTAAAAGAAATGACTATACAGATAGAGGGTATAATACAGCAGCATAATAAAGTTAATGGTGAACATGAGGTGCTTGAAAAATTAGCAAAACAGATTGAAAATCATATGGTAACAGTATCAAATTTAACTGAAAGGACTAATGAATCAACAGATAAGCTTTTTAGTCAAGGAGAAAGTCTGTTAGAGATTACAAAAGATACTGTAAATAAATCCTTAGAAGGTAAAAAGTCAATTGAGGGTATGGTTAAAGTAATTGAAAATCTTGACATAGAAACAAAGGATACATACGAGAATATTAATGCTTTGGGCGAAAAACTAAAGGAGATTGGAGAAATAGCTCAATTGATAAGTGGAATAGCCTCAAAAACAAATCTTCTTGCTCTTAATGCTGCCATAGAAGCAGCCCGTGCAGGAGAACAAGGCAAAGGCTTTGCAGTAGTTGCTGATGAAGTTAGAAAATTGGCAGAAATGACCGGTGAAAGCAGTAGTAATATAACTAATTTAATTAGTGGCATAGACTCACAAACTAAAAATGTTTTAAATAGTGTTGAAAAGAGTACATTAGTAGTTACAGAAGGAGTAAAATCCTCTAAAGGAGCCCTTGAAAAAATAGAAGAAGTTCTAGATTCATTTAACAGAGTTGAAGATGACACTGATAGCCTAATAAAAACAATTAATACTCAAAAAGAAGATATAAGTAAAATTTTTAACGGAATAAATGGAGTAGATAAAATTCTTACTGAAACCAATGAGCAAATTATAAAGCATATAGATGAGGCACACAAAGTAGATGAGAAATTAGAAAAAAGTGTATATCATATAGCTCAATATGTAAAATAA
Protein sequences of DBSCAN-SWA_4 >NC_017299|1742686:1749751|1748794_1749751_+|WP_014520622.1|DBSCAN-SWA MINIFSKKDSEKDNKNDTIEQEVIVEEKHEVETIDTMKFLKEMTIQIEGIIQQHNKVNGEHEVLEKLAKQIENHMVTVSNLTERTNESTDKLFSQGESLLEITKDTVNKSLEGKKSIEGMVKVIENLDIETKDTYENINALGEKLKEIGEIAQLISGIASKTNLLALNAAIEAARAGEQGKGFAVVADEVRKLAEMTGESSSNITNLISGIDSQTKNVLNSVEKSTLVVTEGVKSSKGALEKIEEVLDSFNRVEDDTDSLIKTINTQKEDISKIFNGINGVDKILTETNEQIIKHIDEAHKVDEKLEKSVYHIAQYVK >NC_017299|1742686:1749751|1746144_1746576_+|WP_014520618.1|DBSCAN-SWA MYTLKVEHNFDSAHFLAGYEGKCGNIHGHRWKVEIQVQAESLVKGGQLDGMIIDFGDLKKDVKSMVDYYDHALIIEKGTMRGQSLSSLKEDGFRIIEVNFRPTAENFAAFFYKIMKDRGYNVKSTTVYETPNNSATYEESGVI >NC_017299|1742686:1749751|1742686_1743631_-|WP_014520616.1|DBSCAN-SWA MKINRLLSIVVILLNREKISASELAEKFEVSVRTIYRDIEAINLAGIPIVSQIGNNGGFYIIDNYKINHQLLTLEDMISIIESLKNMNRFLEDKSIDVAIEKVKNIVPKEKKEVFDLHFDQMFIDTLPWGFKKCDEENLKYKIIHNAVKSKKCIVFDYRNSKSEYNRRKVEPLTLVFKGFYWYLFSFCKFKNDYRFFKLSRIENLTVLDEKISENRISYKEYINISESEQVPTRVVLKFSERVRYRIDDCFDKDEIKFQEDGSVIVDTYLLEDDWIYSMILSYGEYVEVLEPNHIREIIKDKCKKINDIYSNMT >NC_017299|1742686:1749751|1744253_1745249_+|WP_014520617.1|DBSCAN-SWA MKKIGLTTTVPVEVIVAAGYTPVDLNNMFITSENYLKYIDIAERDGFPKSLCAWIKGIYGACLENNIKEIVGVMEGDCSNTKALIEVFKLRGIKIYPFSFPHSHSLKDVEIEIRKFMDIFNVNEDKVEQVRKRLNRVRKLAKKIDEMTYIDNKVNGFENHLYQVSSSDFNGNIDEFEEHLKKVIEGMEKREPINKKLRLGYIGVPPMTGDIYEFSEKLNAHFVYNEVQREFAFPRGIEAANIFEQYYNYTYPYDNEFRIKELKKEIEKRKIDAIIHYTQAFCHRAVEDIVLKEELNIPMLNIEGDKLNTLDARTKLRLEAFLDMLLDLKQK >NC_017299|1742686:1749751|1747246_1747837_+|WP_014520620.1|DBSCAN-SWA MAIDVKAIEEHIRGILIALGDNPEREGLKNTPKRVAKMYEEVFKGMCYSNDEIAEMFNVTFEDNLCINDNENDMVFMKEIEIFSHCEHHLALMYNMKVAIAYIPKKKIIGLSKIARIADMVGRRLQLQERIGSDIAEILQKITDSEDVAVIIEGEHGCMTTRGIKKPGTKTITTTLRGKFNTDPIVSNKLMMLYTK >NC_017299|1742686:1749751|1748020_1748680_+|WP_014520621.1|DBSCAN-SWA MNKEKAIVVFSGGQDSTTCLFWAKKKYKEVIAVSFDYNQKHKLELDCAKDICKKYNIEHHILDLNLLNQLAPNSLTRQDITVDKSAPKEGVPNSFVDGRNLLFLSFVAVFAKQKGINTIITGVSQSDFSGYPDCRDVFIKSLNVTLNLAMDYEFEIITPLMWINKAETWKMAYDLGVLDIVKEETLTCYNGIKADGCGECPACKLRKKGYLEFEKEYLK >NC_017299|1742686:1749751|1745365_1746127_+|WP_003358645.1|DBSCAN-SWA MRLLGIDLGSREVKIVLMENNIIVQKKKVSTMKFYRDYCSFHGKIVVDLEKLNIEGIDKAISTGYGKNNTDLEFFTPINEIKAHVYGGIYQSNLKDFILLDVGGQDVKVVKVEKGVATDLELNEKCAASCGRYLENMANVLEISLDEMSQYSENPVDLNSTCAVFSESELIGKIAEGVHIERLCAGVNYSLYKRLQPLLSKFRGKKLVITGGVANNHSIKKYLNNDYEEIVSVKDPQFNGAIGCCYYGSKFLK >NC_017299|1742686:1749751|1746577_1747243_+|WP_014520619.1|DBSCAN-SWA MDFKVVERVVSINGEGRRCGQLAIFIRFAGCNLNCSYCDTLWANEKDVPYEVLSSKDIYEYIKSKEVKNVTLTGGEPLLQKGIMELLKLLSKDKELYVEIETNGSILLDEFLNIENSPSFTMDYKLPLSNMENKMALDNFKYLTKKDTVKFVSGSIEDLEKAREIINKYNLVDKTSVYISPVFGKINLDTIVEFMKNNRMNGVNLQLQLHKIIWEPSKRGV |
8 | uncultured_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_5 |
2449379 : 2473869
Sequences of DBSCAN-SWA_5
Nucleotide sequences of DBSCAN-SWA_5 >NC_017299|2449379:2473869|DBSCAN-SWA CCTAATTAAATTTTATTACTGCACCTAAAATACCTAAAATAATAGCTCCAGCGATTGTACGCCAGAGCCACTTTTGATTATCCTTCATTTCTGTTATATCTTTTTCATTTTGGCAGGCCTTATTATAGGCTACATCTGCTTTTTCTCTTGTACTGTTATATCCATCTATCTTTGTCTCTATCCTTACTATTCTTTCTAGTATTTCCTGTTGAATATTAGAATCCACATTACACCTCCAGTAATTAAAAATAGGCAAAATAAAAAGACCTAATGGTTCCTATTTTGCCTTTATGATTTATTTAATTGTGTCGTTATATATTAAGAATAATGCGAACTAAAAAAGCACTTTTTATAAGTGCTCTTTAATAATATGTCATATTGTGTATTTAGTCTATTATTGTCTGCTCAACATATCCTTTTCATAGTTTCTAATTCATGACTTACTATTTTCAGAATAAAATTTTAAAGCTTCTCCAATAAATTTAGATGCACCATTTCCATATTTCTCATCAGTTACTTCTTGCAACATAGAATCTGATAAATAGAGTTCTGCCATATACCCCCAATGATTCTCTCCCTCATCCACTTTGTATAATTTTTGACTTTTTTTACTTTCATCTGATATTTCTTCAATGATTTGTTGAATCTCTTTTGAAAAAGGAGCTTTACTTAAGTCAGATGTAAGTTTTTCATATAGTTCTTCTACTTTAGGATGCTTATCTCCCGAATAATTTTTTAGAGCTTCTCCAATAAATTTAGATGCACCATTTCCATACTTCTTATCAACTACTTCTATCCATCCAGGATATACCAAATACATTTGTACCATATAGTACCAATGATCATCTCCATTATCCATTTTGAAAATTTCATAATCTTTTTTAGCGGTATTTGTTATTTCTTCAGCAATTTGTTGAATTTTCTTTGAAGAAGGATCTTTACTTAAGTCAGATACAAGCTTTTTATATAGTTCTCTTAATTTAGGATGCTTATCTTCTAAAAAATCTTTTTTAAATACATCATATTTTTCTGCTAAAGTTAATATATCACTATTAAGATTTTTCTTTAAAGCTTTAGCATATTTTTCAATACTTCCATATTTCTTCATAGCCATTTTAGCAATTTCATCTTCCTTAGATTTACACTTTTCAATACATTCATTATATTTATCTACACTACCATAAATTCTAATTACCTTATCCTCGTGTTCTGTTTTAAATTCTTCCAATACATTAAAATATTCACTCATATCAAATTCTTTAAAATTCATTGTGCTTTCTCCTTTTAATGTTTTATTTATAAGCTTTATTAAGCCATCCAATCTTTTGCGTTTTAACAAAAGCAACTTTTTCTGATTTTTTAGTGCTTGCATTTTATCAAAGTATGGGCTCGACATTATCTCTTTAACATCTTTTAAAGGTATATCAAGTTCCTTAAAAAATAAAATTTGTTGCAAGGTTTTAAGAGCTTCATCGTCATAAAATCTGTAACCTGCTTCTGTTATTTCACTTGGTTTTAATAATCCTATTTCATCATAGTAATGTAGTGTACGCACACTTATTCCTGTCAAATCCGAAACTTGTTTTACTGTTCTCATTGCTACACCTCAAAGTTTAATTTTAGGGCCATCACTACTATCTAATACTCCGCCGGCTGTGAGTTTTTGTTAATATAGATAAGCTCTACATATATATTGCACTATGACGTGGCGTTAGAGTCAACACTTTTTCAAAAAAATTTAATCCTAAAAATCCTTAATATTGCTTAAATATTTGTTTACAGCTATTATTGATATTTGGTACGCATAGTTTTATCTATTGCGTCTTAATTATATTTTCTTTCTCTTCTATAGTTATCCATTTTGCTTGTACAAAAATATCTAAATCTTCTTCCACATATAATCCCATTAAAAAATATTCTTTAATATAACTAAGCATTTGCATTACCTCCTAATTGTGCTATTTTTAATAATAAATCTGCATTTAATTCTTTCTGTTTATTTAATTCTATTTGTATCTCTGCATTATCTTTAAGCAATTTTGCATTTAAGGATTGTTGTTTCTGTTGTTCTAATTCTTCATCAGATTTTAGAACATCTTCATATTCATAGAATATTTGTTTATCTTCAGGATTCCAGTACATTATGGCTTGTTTATTTTCTATATACTTTGGTTCTGGTATATTTTCTATAAGAATTCCTTCTTGTTCTAATTCTTCTTTTGTTTTGTGTAGACCATAAACATTGTCAAAAGGTATATAATGTATAAATTTTGCCTTAATTTTATTTTCTTCAATCTTTTTTAGTTCACCTAAAAATATCATAATTTCTACCTCCTATATTAATTGATATACTATTATACTAAAACTTTATAAGCTAGCTTGATTTTATTAATAACATTGTTATTATAAAAATATATACAAGCATCTTTATCTGATCCTAAAAAATGATCATCTGTACAGTTATAAGAACAGATAATATTACCATTTTTATCTATTTTATGAAGTATACTACCTGTATAAATATATAAATATTTTCTTAAAAAATCTAATTCAATATATTTACAGTTTGAACCAATCTGTTCTGTTTTATTTGTTTTAATATTATATCTCCATATTTTTTTATTAGAATCATAACAATATACATATTCACCCAACATTACACTATTTGATTCATAAGGTAATGATTTTTTTTCTAATTCAGTTATATCACCATTTACATTAATTTTATAATAACTACCACTTGAATAATTAGAACTGATATAAAAATCAGTTCCATCTGAAAATATATTTGAAAAGTCATATTTAGTGTTCCATCCAAATAAACATTTACTCCATATAACATCTGCATAACTTAAACTAAATAAAAAAACTTCTCCACTATATTCATTATATCCACAACAAATTCCATTATTATTTATTGCAACTCCACCATAACCATAATAACTATAAGCTCCCTGACCTCCAAAGCCATAAGTCGATATTCGTTCAATATCACAAGTTTCTGCATATACTCTATAATAATATTTTCCGCTATGTTTTAATCCTTTATTAAAAATATAAAAAGAATTATTATGAAAAAAGATTTTATAAATATCATCAAAATAAGTATAAGAACCTGAGCTAAAACCGTTATGCTCTATTTTCTTCGATAATATTAAATTCCCATCTAAACTATATTTCTTTATAGAATCCTTCCAATTAATTACATATATATAATCTTTTATAAAAAATAGCATACCAGAATCCATATTTTTAGAAAAAATATTTTTTATTGAAAATTCTACATTCTCAATATTTATCAAATCATTTTGTGTATACCCTGTCTTTATATTTTTAATTTTATTTGATAAAGTATCATATGAATCGCTACCACTTGCTGGTATACCTTTGCCAGTAATAGCAGTAGCTACTTTAGTTTTTCCATTACTGGCAGATATAAAAAGCTCATTTATGGAACTTTTTATATCCTTAGCATTTGTTTTTAGTTCTTCTGTTCCAATTTCTGTCGTAATATCAGCCAATTGTGACTCAATTGTCTTTCCATCTTCTGTTTTTATATCTGATGCTTTTAATTCTATTGCACCAGTTTTACTATTTACAGAAGTTACTGGGATTTTAATATTTTTTATTTTATTTTCAAGTATTTCAATTTCAGACTTTTTAGCAAAAATTATAGTTGGATCTATCTTAAGAGTTATATTTTCTGTATTAGAAACTGTTAATACCATTTTCATTATTAGCTCTTTTGTACTGCCATCTTCAGCAAGTGGTTTATAGCTTTCTGCACATTTAGCTATAGCTAACATATTATTATCTTCATCAAATACCCCATATTCCCTAATCATAAAGCCGCCAACATTTGCAGGAATCATCATCTCTACGTTTATCCAATTAGGATTTTTCTCATCTATAGCCACATGAGTTATATTACCTTCCCATACTGTATTGATTAAATCTTCTTGATCTTCTCTTGGATTGTAATAAGATCCTCCACCATCCCCAACTTTCATTTTTACAAAGTTAATTTTACTTCCAAATCCAGCACTATTAGCTATTTTAGCTTTGCCTATTTCTGTAAGTAAAGTATAGAATTTTTTCTGCCAAGTTTATCCCTCCTTTGGATATGTTGTTATAGTCTCTAATCCTGCATTCTGTGCTAATGCTATTTCTATGTTTCCAGTTGTTTCAATATTGTTTGGTGTCCATGGATATACAGTTATAGTTTCTCCACTAAAAGAAGTTGCTCCAATATATAAATTACTTTCTGTCAATGAAATTAGCTTATATTTAACAGACAAATGAGAAGGTTTAATTTTTTTAACTTCTTTATACAAGTCTTCTAAACTTTTAGGGAATCCCTCTCTACCAGTTAATTTAACTTCAAATGTATAAGGAGCTATGTCTTCTGTTATCAAAATATCTGCTCCAGTATAATTCTTAAGGATCAAAGCCATTCTTTTAGGATTAATTGCATATCTACTCTGTAATTTAGCTATTACTTTTCTTCTTCTACGCTCTATTTCTTCAGTTGGATTATTTACTACATTTACTGCTTCTTCCCAATAAATTAATCCCCATGTCGCAGTCTGTGGGAAAAATTGTTTTAATATATCATTTGCAAGTAACCCAGCAGTATCCCATTCATAGCCTATAGCCTCAAAAATAGATTGTATCACTTTACTTTGTTCATAAATAGGTGAAACATATGTTATCATTTCTTTTCCTTTTTTGGACTTTATCATTGTATGTTAGTCACCTCACCTATTACAGCTACTTGATCTATAAGTTTAATATTCTCAGTAATCCCATTTACAGTTAAGTTTTTAAAATCTTCTATTCCCTCCCCCGTAAGAATCATAGATCCAACTATAGTGTGAATTGCAGTATAAAGTATAGTTCCTCCTATAGATATTCCAGATAAATACTTGCTTAAATTTTCTTTTAAACTGTTTAACACTATCTCAGAATTAAAATCTTCTTTAAATTTAAAATTGGCTTTTATATCAATAACTAAAGTAATTGGAGTATCTATTGTTGCAATAGCACCTATAGGAGCTTTTCCACCTCTATTTTCTTCTCTTGGGACTATTTCATATATATAATTTTGCACTTTATCTATAAGTTCTCTGGTAGCAGGCTTATTATTTTTATCTAATATTAATACTTTAACTGTCCCCGGACCATTCCATTCATCTATTACATATGCATAACCAACACCATCTACTTCCTTAGCCCATTTTTTATAATGTTCATTATTACCACTTGTAGCTTCATTTTTATATTCTTCTAAAACTCGTTCCCTATAATGTTCTTCATCTTCTAAGTCAGTTCCACCTGTAAACTCCTCTTCATTTGTAATACTTTCTATACCATTAATACGATCCATAAGTATGGTTATAGTGTTTTTTAGTACATTTCCTATAGTACCTGCCTTAGTACATTCAGCTTTAACATAAGCCACTCCTGTTTCATCAATAACTTTATTCTCTGTAAACTTAAAAACAACAGATTCAGAATCATCTGTTGCTACAGTTCCTATTAATTTATCTTTGTATATATTAGTACCTTTTCTTCCTATAACTTTTATAACTCCTATAGATTTAGTAGGAAGGTTTTTAAATACCCCTTTACATTCTCCTAAGTATTCAAGCCACACACCGTAACTAGTTTGTGGGAATGCTAACCTTAACATATTCTGTAATTGAACTTGCATTAAACTTGCTTTTTCCTCTGCGGTAGGTCTTGTATTATCCCAATAGAAATCTCCCTCAATGGTAGATACATTAGGCGGTGCTTTTTCTAACATTCTTTCATGTATGGTATCAGCATCTTCCTGTAAAAACTCTGGAATAAGTAAATCCCTTTCCAATCATATCACCACACTTTCAATTCACTATGCAGCATAAACTTTTCTTCATCTATAGTTATAATTTCAAACTCATAGTAAACTTCTTCTTTGTTTTCAGACCATTTAAAAATAAAATTATCAACGTCTTTAGTCCTTGGATGTACCATAAGAGTTTCTTCTGTCATTCTCTTTATCTCTAGTTCCATTGCATCTTTAGAAATATCTTGACCAATAATATTTTTAAACTCCTGACCATATAAATCTGAATAAGCTAATTTGTATCTTGGTGTGGCCATAGCTTTATAACACCATTGTACATAAGCTTCTAAATCATTAGCCTTAGCTATAGTTCCATCTGGATTAGTAACAAACTCTCCTGTTTTAAAGTCAAATAAATAAGAACCTTTAAAATCTATAATAGTTTCTTCTAATTCTTCTATATTATTTTCTTCTAAGTTGTCTGGGAATAAATTAGGCATTTACAACCCTCCCAACTACAACAAATTCATCTTTTAATAATGCAACTAATACTCTATCTCCTGGACCTAATGGTTTTAATTCTTTAGGTGTTTTAAAATTATGACTATGTGAATGTTCTCCTGCTGTTTCTGTATTATATTCATTCTTCATTTTTAAATAATCCAACATCATGTAATCTTGTATTTCATATTTAAAATTATCTAATTTAAGCCCACTAGAAGTTATAGTTGCTAAATCTAATCCTATATAAGAAATTGCTTCATTAACTGCTCTATTTGTATTACCTTTTATCTCTCTTGCTATTTCATTAAATATTGTCTCCACTATAGAATTTCCTCCTTATATAATTCAAATTAGATAAAGTTAAATCCATTCTTCCAGTACTACCTAGATTGTGGGTAACATCTATAACATATAATATCTGTCCATTAACACTTACCTTATCTCCTGCTCTAATACTGTTTATATCTATACCAGATATATGTGCTGTTTCTTCTCCAGTATTAAATAAAGCATCTGCTCTTTTTCTTCCTTCAGCACTGCTTTTTATTTTTTCATCTTGCACTAATTTTTGTATTGTTCCATACTTACTCGTATCTTTTTTATATACACCAGTAACAGGAGTTTTCTTATTTTCCTCCTGCTTACCTAATATCTTAACTTGTGTAATCATTCCTTCTAGACTACTTTTAAAATTTATATCCTCTGCTATAGTTTCTAATCGCCATACTGTCTTATTACTACCTAACTGTATTATATTTAACTTATCTAACATTCTAAGTTTATAAAGATTTCCACCCTTTTGAGCAGTTTCTTTCAGATCCTTTATCATCATTCCTAAAATAGTATCCCTTCTATATACTGCCTTAGCAAGTTTAGCCCTAGTATTAACTAAGCTTGCGGTAGGAATTCCCCAGTCTCTGCAATATTTTATAATTCTTTGTGTAGCAGTACCTTCTCCAAATAAATACTCGTCTTCGGACTCTTCTATATATATTGTTCTTTCTTTACAGGTAAGTGTTATTTTTTTGGATTTTCTAGATTTATCTATATCCCATATGACACCTTTAAACACTTGCTTGTTTTTCTTAGTTTCAAAATCAATATCATATATTTCTATAGAATGTCCTTTTGCTATTCCTAGTCTCTTAAGTTCCTCTGTTTCTACTAAATTAATATTTGCAGTATATGCTATACCATCTATAGATTCACTTAGCTGTATTCCTTCGATTAGGTTATCTATCTTATATTTATTTCTAAGTATTATATTAGCCACATTACATCACCAACTTTTGACCAGCTCTGATTATATTAGGATTAGGACCTATAATATTTCTATTCTTCTGATATATAACATTCCATTTAGAACTATCCCCAAACCACCACTTAGCTATCTTCCAAAGAGAGTCTCCTTGTTTAACTACATATATTCTAGAATTAGATTTTGTCGTTGGCCTATTATTTGTTAAAGCTACCGTTTTTACTGTGGATGTTGTTTTAGGTGGAGCTAATGTTTGTATCTTTAATTCCCTATAAGTTCTAAAGCTAATGGTAATATACTTATCTCCTGTTTCTCCTCCTCTTTCTTCTTCACTTATAGAGCTAATATTTACTAAATTATTAAAATTAAAATCTGTAATTATTAATCTAAGAGGCTCTTCCTGCTCCATCCACTTCTCTAATTTAGCTATAGCTTTTTCAGGTTTAGGAATGTTTCTATATCTACAATAAGTATCATATTCTTTAGGTAGTAACGTTAGAAAACTTAACTCTTTTATTTTTTTACCCTTGTCACTTAGATCCACTTCTCCATAATCTACTATATCCGCAGTATCGTATTTCTTGCTACGATTCACTACTATATTATCTAGTGGATTAACAGGAAATTGGAATGTTGTTTTTTCTTTTTCATTTCTTAAATATACATCCAATGAAAATCACCTCAAATAAAAAAGAGACACTTAAACAATTTAAGCATCTCTTTAGCTATACTATTTTTTTATTTTAATGCATCTGCAGCCTTTTTATACTTTTCATCCATAATATTAGTATTTTCTAATATATATTTTCCATCTTCTTTTTTATATGTTACAACAACACTCTTCATTTCATTATCTACATACATAACATAAGCAATTCTTACGAATTTTTTCTGAATAAAATAATCTTCTAAATTAGTTTGTATATTTGCAGCTTTCTTAGTATAAGACTCTAATTCTTCCATTGCTGTTCCTTTAGCAACATTTATACTTATATTTAAATTTATAAATCCTACTTCTGTATCCTCTATAGTAGATATTGCTTTAACCTTTTCTATAGAATTTATTTTATCATATAATTCCCCTTTAGTTATTTCTGTTGTTTTTTTATTATTTTCTTCTTTTTTATTCTCGACTTTTGTTTCCTTAGTAGTCTCTTTATTATCTTTAGATGTTTCATTTCCACAACCTATTAATAAAAACATAAATATAAATAGCAACAAAATTGAAATTTTAGTTAATCTTCTCTTCAAAACAACCCCTCCTTTTCTGTCATATTATAACATATTTAGAGGGGGTATGCATATCACTTCTTTATATTCTTAAGTGCTTCTTTTAATTTATATCCAAATTCTTTCATTGCTTCTTGTACCATCCCATCTATGTCAGCATCATTATCAAAATTATTCTCTACATCTACATCTATGTTTACATTTGATCCACCAACTCCGGCTAACTGAGGCTGTGCCACTGCAAAATATGGTTTTGGTTTTTCTTCTGTTATTTGATTATTTTCTTCATTTAATCCAGATTGTAAAAATTTTTTAGACTCCCTATTATTTAGTACTCTTTCTCCACCTTTAAATAATCTTGTTTGCCTACCAACTAATATCTCAAAACCTCTTTCTGCAACTTCATGAAATCCAGATGTAGCATTATTTGTTCCTGTTGCAAGAGCTTTCCCAGCCCCTGCTATAGAACCTGGTCCATTATAAGTATCCATACCATTTTTATCGTCGCCTTTAAAGAAATCATTTACCCAAGTTGTTATTTTTATTACTTTTTCTTTTATAGTTAAAGCATTAAATTCATGTATTTTAGCAATCATTGCATCAAAATTATCCCGTACTCTCCCAGTTTCCCAATCTACTTCAGTAACATGTTCTCCTGCCTGTTGTTGGGCATGTGATACTACCTCTGTATGCATTTCTTGTGCTTTTGTAACAGCGTCTTCTTTTTGTCTACTAGCTGCATCTAACATTTGATTCGCTTGATCAGAAGTTATTATTCCTAAATCATCTCTTTGATGTATAATTTCCGCTACAATTCTATTATACTGTTCTTCTGCAGCTTGTATTGAACCATCTCTAGCTTTAGCACTATTTTCTACAACTTTTGCCGCTTGTTGTGCTGTTAAATTTCCACTATCAAAGTTTAGCTTTTCCAAAATGACCCTTTGTTCTTCCGCTGACTTTGATATATTTTCCACTGCTGTTTGAGTCATATTGTTCCTAATTGTGTTAATTTCATTTAAGTCTTGTGTTGTAAGCTTTTTATGATTTTGAGATGCCTGATTCACTATTTCGTCTATTCTTTGCTGGCCTTGTTGAACTATATTTTTTTCTGCTTCTTGTTTTTCCCTTATTTTTTGTAATATTTGTTGATTTTCCTCTGCTTTAAGCCCACTTTTTTTACTCATAAAAGTTTGCATAGTTTGGTAGCCTTCATTATATCTCTTATCAATAGCACCTTTTAGTTGGTCTGACATTTGATTAAAATCACTTATAACACTTTGAGAGATTTCTTTAGTTATTTTTTTATTATTTATTTTAATATCCATAAGACTTTGTCCCACATGCTTATCTAATTTCATATATGAATTCATTGCTTCAGCAGTGGATTTGGATACTTCTTCTCCGAACTCTTTAACTGCAGGAATTGAATCCTTTTTAAAATGTCTATATAATTTAATTCCTGCATATGTTGCTCCACCTATTGCCCATGTCCAAGGGTTTAAGAGTAATGCTCCTCCTTTAGCTGCTAATCCTAGACCACCAACTCCTTTGGCTGCTAATCCTGTTCCTGTCGCCAATGCTTCTGTAGCTTCTGCTGCAACTGCAGCTTTTTTAGTAATACCAAAGAAAGCAGATAATTTTGGGCTAAGCTCAATTAAAAAAGTTAATGCTTTTGTAGTCCCTTTTATATATTTAGTTAAAGGATTAAATGCTACAGTTCCTATTGCTACTGCTGCAAACATTTTTTTAGTACCTGTACCAAGGCTATTAAACTTTTTAGCTAAATTTGATATAGTGTCTACAACTTTAACTATCCCTTGTGTTATATCTGGGATTTTAGCTGTAAACCAACTTACAAACTCTTTTGCATAAGGTGCTAACTTCTCGCCTAGTTCTATGTTCATGCCCTCAACTGCACTTTTAAGTATGGTAAATTGACCTTGTAAACTATCTAAACGAGTTTCTGCCATCTTTCTTGCTGCACCATCTGAACCTTCTAATTCCTTAGTCAAAGACTGTAACTTTTCGGGTCCCTGCTCAACCAACGCCATCATTCCACTCATAGCCTCAGTACCAAAAATCGTAGATATAGCTTGAGCTTTCTGTTGTTTAGTTAAGCCATTCATTGATGTTTTCAGATTTCCTATGACTTGACTTAAAGGCAACATTTTGCCATTACTATCGAATGCTTTGAATCCCAATTTTTCAATGGCTTCTGCTGCTTTTTCAGATGGATTTGCTAACCTAGCAAATGAAGCCCTTAAAACAGTCCCGGCCTGACTTCCTTTTATATTTGCATCTGCGAGCATACCTATTGCAGCAGATGTTTCTTCAAAACTAATCCCTAAAGATTTACTAACCGGTGCTACATATTTCATGGACTCTCCAATTCCGGATATATCTGAGTTGGTCCTGGATGCAGTAAGTGCTAATACGTCTGCAACATGTGCACTTTGTTTAGCTTCCATTCCAAACGCTCTTATTGTTCCTGCTGCTATATCTGTTGCTTCTGCTAATTGTATATCCCCGGCAGAAGCCATGTCTAGCAATCCTGGTAATGCTGCTATGGTTTCCTGTACTTTAAAGCCTGCTTGGCTTAGTAACATTTCTGCATCTGTTACATCTTTAGCCGACCAAGCAGTTTCCGCTCCTAATCTTCTAGCTTCTTTCCCCAGCACTTGCATTTCTTGTGCAGTAGCTCCACTTATAGCTTTAACATTAGCAAGCCCCTGTTCAAAATTACTAAAGTCTCTTACTGCAGCAGCTATTCCTAGTCCACCTATCATTACTGCTCCAGCAGTTGCTATAGCTGCTAATTTAGAACATGCTGCCTTTGAAAATTTAGATAACTTCCCTTCCATCTTCTCAAGGGGTTTACTTAACTTATCTTTTAATCTAACAGAAGGACTAGCTTTTATTTTATCTAAAGCTTTAGTCCTTTTTTCTGTTTGTTTTGCGAATCTCTCAGTTGCTGTCAGCTTCTTTTTGGCTTCACTATCTCCTTCAACCCCAATTTTTATATCTAATCTATAAATTTCTTTTTTAGCCAATTATCTAGCCCCCCTTTCGGGCTTGTTCAGCTATTTTCTTTTCCTCTTCTATCTCATAATCAGTAAAGGCGAGAATTAATCTTCTCGCCATATCATTAATTTGAACATTATAAAAGTCGTGAGGACAAATATTATGCTTTGAATACATATTGTATAAAGCTGTTATTTTTCCACCACGACTTATTAGTTTTTTATATCTTCAATTTCTTCTAATTCATTATCAAATCCGCTTAATTCTAAAACCTTATCTCCCATTGCAGAAGTTTCTCCTGCTAGGAATTTCTTTCTTATAACCTGTTTACCATCACTTGCTTTTAATGCATCTAATAATTTAGAATTATTCCAATTTGGGCTTACTGTTGCCGCTTCTATAAGTGCTGCATTAAATTCCTCATCGTCTAATTCTTTTATTCTTTTTCCTCTTTCTTTTCTAGTATAAGTACATTGTCTTTTTATTTTATTTATTTCTTTTTCACTTAAACCTTTTAAAGTTACTGGAACACCTAATCGTTCTATAAAATAAGTAGCTTCTGGAACTTCATCAGGCTCCATAAGTCTGTTTATTATATCTTCCTCTGTCATATTTAATATTTCTTCATCCTTTATTTTTTCACTCATTAATAATTCCTCCTAAAATTTATTTATTCTACAACTATTGGGTCTAAGAGCTCATAACCTTCAAATGTGAAAGGAGTTTCCTCCTCCACTAATTCATTAGCTTTTAAATTTATAAGATTTAATTTATCTGCCATACAATTCATTAATCGAATTCGTTCATGTCCATAAGCTTCTGGGTCTTCTAAAGATGAAATAACTTCAAATCTTTTAAACCCTCTTTGAATCATAGCTGAACTTACTTTAAATCCACTCATTGAACCTGTACCTTTTTTACTTCCTTGTTTATATCTTGTCCAATCATCTCCAACTAAGTTAAGTTCTTTTTTATCTAACTCAACCTCAGCTGTTGTTTCTGTAAGATTTGTTTGCCATATACCATCTATAAGTATTTTCCCTTTAGACCCGTGTATGGTTCTTGAAGCATCCAATGCCATAAATTATCACTCCTATCTCAAATATCCTGTTCCATAGATACGTTTCATTACATTTACATACTTAGCATCCCATTTCCAGAATACTTCATCATTTTTCGCCTTAGCTTGTAATTCCTCATCTATCTCGACTGTAAAGTCTTCTATTACACCTTCTTTTTCTAAAACCTCAAAGTATTGTTTAAGAGCACATATTAATGCTAATCGACCTGTCCCCTCATTAGGTACTTTACCTATAAACTCTTTCCTTTTTAGTGCAGTATCTCCATCAACTGCATTCATGAACTTTATACCTCTGATATATCCCCAAGTTTCATTTTGTTCTTCACTATATTTTTTTAGTGTATTTACATCATCTACAACTATAACCTCATCATCTTCTTTTACTAGAATTAGAGTTCCTGCTTCTAAACAGTTCTCCACTTCTTCCTTACTTAAACGAGGTTCTACATCTTCAAATATAGTCTTTTCATTGCAGATACTCTCTTTTAACCTTTTACCTGTTGCTAATCCAGCTATATAGCATGCAGTTTCAGTGGGTGTATACTTTACACCTTCATAGTAACCACTAATACCTACATTAACTATCCCCTCAAAGTTAAATTCTTTACTCTTTGTGTTAGCTTGTTGAATAGTATCTGTGTCCTTAATTCCTAAGTAAGCAATTATATTGTTGCCTTTAGTCTTATTTCTTTTAACCCATGCTTTTACAGTGTTTTGTAATGATTCATCAGTTACACCATCTAAACAAAACCCATCAGCTTTATAGCCTTCAAGTATCTCCATAGCTTTAATATAATGCTCATTAGTTATAGATGTTGTACCATCATTACCTCCTGTAATGGTTTGATTTGCAACATTACCGAGTTTTCCATTGCCTTCATCTAATTTAGTAGCCTTAAGCCATGTATTTTCCACATTTTCATTAATAGATTTAGCTACTTCTTCTATAGTTCCACCAAGTTCAGAGAATGCATATAGCTGTTTAGTTGCTTCATATAAAATTAAATCTTTCTTAGTATCATCTACTATATTTGTTCTAATTGTTATATTAAAATCTCTAGTTGTAGGATATAAGGTTTCTATTTTTAGAATATCTGTATCTTCTGTATCCTTAAGCATTACGCTTGATATCTTTTCTGCACCATCTGTAAGCCTATATAGTAACAGCTCTTTAGGTTGTCCTAATAGCGATAATCTGCCTAATCTATACGCTGTATTGTCCTTACCAAACTTATTTATTAAGTCTTTTTCATCTTTTATACTTACTACTTTTTCTATAGGTCCCCAATTAGCTTTAACTGGCATGGCCAAAATGCCATGTATTCCAGTTCCTATTCTTTTTTCTGCTAATGCTTTAAATCGGTTGTAAAAACCCGGTATAGTAGGTCTATTATTTTCATTCCATACTCCTGTGGCCATTATTCCACCTTCTTTCCTAAGAACTTTTTAATTCTTCCTTCAAATTCTTTTTTACTCATTTCTTCTTTACCACAATCAAATAAAGCACCAACTGCTACCTCTTTTCTGTAACCTGTTAGTGCTTCACAATTTTCTATTAAATCTTGTACTGGATATAATTCCTCCTGGATTAAATTTGTTTCTTCCTGCATACTAATCCTCCTATTTTAAACTTCCTTTACCATAAATTTTATTTATAGTAGGAGTATCATCTTTTATCATTTTCTTTCTGCTAAAATCTACAGTTAATTGTCCTACTCCTAACATATCTGCATCTCTATCTTCCTGTATGCTTTCTATAGTTAAATACCTTCTATCTTTTAAGTCTAAAGGTATCTTTAAATCTGTTATGAGTTTATCTTCTATAGTATCTAATAACTTTTCTATATTACCTCTATTCCTATCAACTACATGGCATATAAGTGTTTTATTCTCTTTAATTAGGGCTCCATTAATACGTTCCTTACTTGTATTAGCCACTCTCCAAAGTATAGAAGGCACCTCAAAATCCTTTTTCCAATTGTTCAAATAAATTGGATAATTGATTATTTGTTTAGTGTATTCTTCTAAAGCATCTAACCATTCATCTTTATTAACTTCATCTTCTTCATGCAGAGAAATAACTTCAAATCTTAATCCTCTAGCTATAGCATTCCATTCCTCGTCAATAATGTCTTGGCCTATTGCTCCATTAAAAATACAAGTAAAAGTTTCATCTGCATTAACATCTTCTATAGTTTGTAAATCTAAAGATTTAATTACCTTCTCAGATAAAGCATCTAACTTTTGGAATGTAGTTCTTTTTTCGTATAACCATATCTCAATAGTCCTTTTAAATGAAGTTGGATTATTCTGTTCATCATCACTACCTTGCAGAATTACTGCATAAGGCTTTACTGTATCTTTAGATGGAACTGTAGGCTCATAACAATCTTTAAGTTCTGGAATACTATCTATTAACTTTTGTCTTATTCCTGCTCTCAATTCTAATCATCACTCCAATATTTAAGCACTGCTGACTTAATAACTTCTCTATTACCTTCTAAAGTGTTTTCTATTGTCTTAAATCCTTTCGTACCAGGATGATTTACTTTTTTAACTGGATGTGCTGCACCTTTCCAATATAAGGCCTTTCCATTCTTGGGAGCTATAACGTGAGGTTTACTTCCTTCTTCTAATATCTCTCCATATTCAACACCATGAGCCAAATATATAGAATAGTTATTTCCTCCACCTTCACATCCACCTTTTAAACCTTGTCTAGCATTAGAAGTTCTATCTGTCCATTTAGCATCATTTTTGGCTTGACTTTCTAATTTCCTAGCCATTGCATTACACAATATATTCATACCCACTTTTTTTCTTGCGATATATTCAATAGCTCTAAAATTCATATTAATCTACCCTCTCGAGATCACACATGTACCCACATATAGTATTTTCTATTTGTATAGGATAAGTTGCAGTAACTTTCATATGGCCTTCTAAACATTTAAACTCAATAGCTTCTTTAGGATTAATTTCTATATCTGCATCCTTATTAGCAATCATTTTGTATTTATCAGTACTGTAAGATGTTCCCTGTGTTTTGCTATCTATAACTATCTTATTTGAACTATCCTCAAGATATATAAGAACCTTAAGAGCTTTTATAGTTTCAACTTCTTCAAATGCTCCATCAACAATAAGTTTTTCAGTGTGTTTAAATTCTATTGTCGTAGGATTCAATTCTATTCCTTTATCAATTGTATCTATAATCTTTTTAGCTTTTAAAGTAGACATCTAACATCCATCTGCCCTTCTCATAGATGTTTTGTATCCTGTAGCTTTACTTGGATTTAAATTAGCCTGTTCTTGTAAATAATCAGCCTGATACATAGCGGCCAAGTTGTTCCAATAATCTGGATCAGCATTTTCCACTTCTATAGGTCCTACTTTTATTTTCTTATCAGTATTAGCTTTCATTAAACAACCACGCCAACTAGCTTTAAGAACATTATTGTCATTAACTACAAGTAAATTATTTAATTCTTCATCAGTAAATACAGGATATTGGCTTTCATTTAAATTAATCTTTAATATTTCTAAAGGTGTAAGTTCCATTCTTATTCACCTTCTTCTATTTCAGCATATTTTCTTAGCTCCCCTAAATCACATTCCTTAACTTCAAATTCTTCATCAATTTTAATATGTTTACCTCCATATTTTATATATTGCTTAGCCTTAGCTTTTAAAGTTTTTTCTTCTACTTTCTCATCTTCCATAGCATTTATATTTTCTTCTTTGGACTTTGCCATAATAAAAATCTCCTTTCTTATATAAAACTAAAGAGCAGTCATATTGACTACTCTAATTAATATACTGTTGCAAAGAATACTTCATCTGCCCTGTCAAATGAAACAATAGGCATAACTGATACTTTTGTATCTACAGTAACTGGATCCTCTTTTACCATTGTTGTTACTGCAATACCTGTGTCCACCATATAAGTATCTAATTTAGATGAACCTGATTGCTTGTCAAATTCTTCTGGAGTTGTACCATAAACAGTATTGCCCAAAGTTGTTCCACTCATAAGTGTTATTTTACCATCCACATAATATGGAACTGGATCATCACCTTCTGATGGAATATAAGTAGCATCTTCTAAGAATACAACTGTTAATTGAAGTACTTCTTTAACAAATTGAATATAATTCGCTTGAGATAAAATTAATGAAGTATTTAAATTACTGTTCTTAATATGATTTGTAATAGCTTTATTAACTAAAAATGTACTATCAAAAGTATTTTCAGTTAACAATAATGTTTTAGGCTTTGCATATTGGTCATTTGTAATAGCCTTCTGCCATGACTTTATATCTCCTATAATATCAGCATCAGGATTTGTCCACTTATCTGTTCCAGTTAATACTTCCCTATGATTATCTGGGACCCCATATTCTACTACAATATCGCCATCTTTTGAAGTAAAGTTTAATAAACCATTTTGAATTACTGATGATCTCATTTTCTTTGAAATTATATTTGCTCCATCTATTAAATTGGAATAATTCTCAAATACTTGTCCTAATAATGCATTTACAAAATTTTCATTATTTGCTCCTATTGCATTTTGCAAATCTCTTCTGGTTGTTTCATCAATCCCCATGCCTTCCTTAAAGAAAGGTATTTCTGTTGATTTAACTGTTAAATCAGCACTTAATGCTCTCATCTTTGTATTTGCATCAAAAGTGCTCATCCTTAAAGCTATTGGTTTTTTCTTAGCACCTTTAGCCATTTCTAACTTTGTTCCACTAACTTTTTTATCTGGGAATAGAGCCTTATCTATTGTTTGTTCTGCTGGTAACTCTTTAATATAAAGAGCTATGTTTTTTGAATTAATATAATCTCTTAAATTTGGCATATATATTTCCTCCTTATTCTCCAAAAATTATTTGTTTTAATGCTGCCATTTCAACTTTTTTAATAGCTTCATCTGAATTAAACTCAACTGCATCTTCATATAAAGCACCATGGACAAATACTGGCACTACTTCTGTTGCATCATCTCTATCTGCTGTTGGTGACATTGAACCTTTAAAAGATGTATCTTGATATACAACACCAAATGCATCTGTTTCACTTAAAGTTGAAGTTACTTTCTTACCATCTTTAGTAATTAAAGTACCTGCTAAAAGCACCTCATTTTCATCTAAAAGTGGTTTTACATCACCTTTTCTTATTTTGATAGGCAATGAAATAAAATGATCTCCAGCTATTAATCTTAATTTATTTTGTTTAGCACCTATTGTATAGCTTGATTGTCTCAAAATACATTCCTCCTTTATTTTTATTTAGCAAAGTCTGTTAAACTTTTTGCTTTCATATTTTCTGCTCTTTGCTTTCCTAATTCTGAAGCAAAGTTAGTTTTATTTGGTTGTGTATCATTATTACCACCAGTAACAAATGATCCTGTGCCTTTTATTTCTTTATCAAATAAATATTCATGACTTGTTTTAAGTGGCTCTATTTGTTCTTTAAGACCTATGACATTATCTCCATCTACCTTAAGCTTATCTTTGTCTATAAGTGTCATAATTAACTTTTTATCCTTAATACTAAAAGCCCCTAAACCTTTTTCTAAGGCATTATTAAAAGCTATATCTGATAATTGTTTCTCATAAGTTTCTTTTTGTGTTTTATTATCTAATTCTAATTGCTCAACTTTTTCTTTCAATCCATCAACATCTTTATATTCTTCTTTTAAATTATTTATTTGTTTATCTCTTTCACCAACTTGTTTTCTATATTCCTTTGCCTGTTCATTTACCTGATCAAATCTAGTTTTTGAAATGAATGAACCACTTGAAACATCTTCAAAATCTTTTTTATCTAATTCTTTTCTTTTATCTTCTGAGAGAGCATTGAATGCTTCTTCTCCTATAATATCTTTTATATGTGCCATTCTTTCTTTTCCTCCTTAATCTTAGGCATAATAAAAGCACCTACTATTTTTACTTAGTAAGTGCTTTTATTTTTCTATTTTATATGGTTCTGACATAAATTCTTTATATTCATCTTTTGCCCATTTAGGTGCATTCTCTTTAATTTGTAAACCATCATCTGTATAATACCCATAACCTTCTTTTAAAAATCTTGGCTCAGGTTGATCCATCTTTATCACCCTCTCATTTTTATATATTCTTTTAATTTCTTTTCTACCTTTTCTCCAAATACTTTAGCAAATTTTCTTGGATTTTCTCCACCAAAATATTCTGCAAATGTTTCTGCAAAAGCTTCTTCTGGCTTAGTTCCCCCATATCTGCTTACAAGTTCAGCTATATTTTTAAAACTAATATCTTCATTATATTTTTTATTATAATCTGAAATAGTATTTTCTATAAATTCTTTGCACCAATTATTGCTAGATATACCGCTATTCTTATCAAGCCATTTCATAGAATCAGCAATATGATGACCGTACTCATGTACAAATGTTTTATGTGGCTTAGCATTAGCTACTGTCCACTTACTTTTAATACATTGTCCTATATAACTATTATTATACCCTTTATCAGTAAAATATGCACCATTTAAAGCTAGTTCTACTGCTTGAGGTTTGTTGATGTAATATTGGTAATAGCCTACTGCATTCATCCTTGCTTTGATTTTTATTATTGGTAATTCAACTGGATCTATCTCCTTAAATCCTTCAAAATAACTATGAAACTTATCTAGCCAATTAACTGAATCTTGTAATATATCTTTATTTATAGGATATTTAGTACTGTCCGAAAACTTTATTTTATAATTATCTATTAGATGTTTCTTTATCTCTCTTTTATTCTTAAATTCAGTATAGTTTCCTTTAAAATCTTTCCATTGTATTTCTTTAGACTTTTTCTTAGGATATTCTATTATATTTAATTTCTTATTATCTTCATACCATTTATCTAGCTTAGAATTAGATTTTCCTTTATTCCATGCTTTAAGCTCTTTAATAGCCTTATTTATATCTTCATTTTCCTCAGTAAAGTAACATAAGCAATTAGGATGTTGTAATGGAACTTCATTAGGCTTAAATACCCTTCCATCATAATCATCACAAATATCTGTTTTACCATGCATCCTAAAACTATGACTAGCACTTAAATTCCACTTAATCCCTTTATTAAATGGATTATTCTTAGCATTTTCTATTGTTGTTTCAGCAAATGAATGAGTAATTGATGTTCTAGCTAATCTTTGAGCTTGATAAGATATACTTTTATTCATGCCAACTTCTAAAGTTTTAGCTTCTATTCTTTTAGCTGGATTTATATATCTTTCTAATTGCTGAGCTAATTTTCTAGCATTAGCACCTTTAGCTACATTAACTTTTATTAAAGTATCTATATCCTTAGCATTACTTTTAGTTACATTCCAAATTCTTTTATCTAATGTTTTACCATCTTCATAATACTTTCCTCGTATAAGTTTTTTTACTGTACTAGCTGACGTATTTATAACTGATTTATTAAACATAGATCTTAATTTAACATCATCAGTTATACTATCATAATAAGCTAAACTTGTTGTGCTAGCTATTTGTGAACTAGATTTAATGTTACTTTTAATAACATTATTTAATTTGTTATTTAATTCATTTATGTAAGCCTGGACTATTTCTTCCATTCCACTTAAATGTTGTTTGCTTGAACTAGTTTTACATGAAGAAATTTCACTTGATAATTCTTTAGCTAATTCTTTATATATTCTTAATAATTCTCTTTCCTGCTTCTTATTAAGCTTTAAAAATTCTTTTCTGGCATCTAATATCCTCTGTTGGTATAAATTCATTATTCATCACCAACAATTCCTTTATTATTAGACTTACCATCTAAATTGTCTAATTCATTATCTAAAGCCTTATTGTATTGATCTGATTCTGCATTAATCATCATTGCTTTTTCATCTAATATTTCTTCAAAAGCTTTTTCAACATCTTCTTCATCACTGTATTCTTTAATATAAGATTTCCTACTTCTAACATCTGCTTCTACTTCTTTCATAGCTAAAGTTTTCTTTTCATCTTCATCATTAGGAATAGGATAGTTTTGTTTTATAATCTTAGTATATTTCATTTGTACCCAAGCTTTATTGAATATCCCTGGATAGCACACTGACCCTACTTCAATAATGAAATTCATTAAAGATAATAAAGGCTTTTCCCAGTCATTAAATTTCTCTTCACATCTAGCAATTAAGTCATTATAAAGATATACCATAGCTTTGGCACTAGGTATATTATTTAAATCACTTATCTTAGGCATATCTAACGTTTCTTTCATATCACTATCTGCTCTATCAAGATAAGAATCCAGTGCTGAACTACTGCCTATATTGTATTCTTGTCTCTGGATAGTAGCTTGCTTCCCTTCTGTTAACGCTTCATCTCTAGTTTTTATTGCATGTACTGCATTAGGAGCTATAGTTAATCTATTTACATCATCTTCATTACCATCAATTATACTTTCAGAACCAAACATCTGGAATCTTAAAGCATCCGCAAAGTCACTATTTCTTTTATTATATTGATTTTGTGCATCTCTTAAGTCTGTAATGTCACTTTCACCAAACGTATTGTTTAATTCACCGCCATTTCGGATTAGCCAACATGGAATAATAGAGAATCCTGTGTCTTGATCTATAGTTAATTCCTTTTGTAGTTCAGTGTTTTTATACGTTTCTTTTCTATACCAGGCCTGAAGTGCCTTAGTATTTTCATCTGCATTGTAATAATAAGTATGCAAATAATAAATCTTATCCTTATCTTCTTCCTTATAAACATTCATTTCATCTTCTTCAAAGAAAATAGCTTTTAACAACTTTCCATTCTTTTCTTTATAAAAGAAATTTTCTATACTTTCATATTTGATTGTAACAGGATCTCCTGGATTAGCTTCTGCTCTAAGTAGTACCCTTTTCTTTATAGTAGCTTCTAAGAATGCTTTCCTAGTATTGTTCCAGAAATTATTGTTTTCAAATACATCTTCTATAAATTTTCTTAGTTCTTCACACTGCTCTTTATCCTTTAAATCATCTGCTTTAAATATCAATGTTGGCTTCTTACCAAACATCCATCTAGCTTGTTTCTTAAGAAGTGGCTTAACTTTATTTCTTATATCCTGTGTGGGTTTATAATCAACATTATCATCTACTGGCCAATTCTGACCATATAGTGCTGGATTTTGTTTTGCTTTTTCTAAGTCTATGGATTTTCCTTTGTAATAATAGTAATCAGTAAATACACGTTTTCTTTCAGCTATTTCATTATCCGGCAACTTTAATAATGTATCTCTTATAGTTCTTGCTTGTTTTTCCACTAGAATACTGTACCTCCTTTCCTTCCATATGGATCAGTAGTTGTCTTCTTAACAACACCTTTTCCTTTTCTATATATTGAATCGTCATATTCTTCAATTCTAAATCTTAATATTGTATATATAAAATATCTTATTGCATCCATACAATGGTCGTTATCTTTTAATACTTCTTCTACCCCATGATCTAATTTTTTAGGATCCCATACATAAGAACTAAACTCTTTTAATGTTTCTTTACATATGTCATTAACGTAAAATAAACTAAGATTTAAAGCACTCGCAACAGTTCTTATTCCATCTATTACATCATTTTTAGCTTTCAATATATTCTTAAATCCATCGTCTCTTAACTGTTTTATAAAACTTGCTGCACTTGGATCCACTATTATTTTTACTGGAACTATATCTCCTAAAAAATTCTTTAACTCCTTAGAATATTGAACATCTGACTTTTGTAAGCTTGTATCTCTACCACTGTAATAGTATTCTTTTATAATGTACCACTTGCCATTATATAATCCCCACAAAAGAAACACAGTAGCATTTTGAGTACCATAGTCTATTGACACATAATATTTTTCATACTTTTTAGGTATTGTTTTAACCTTATGAAAGTCCTCATTGAACATGTCATATATAACGCCTTCAGCTAAACACCATAAACCTAAGATATAACGTTTATAGAATATACCTGAGTACATTCTTTTGTACCTTTCTTTTACTTTTTCACTCAAAGATAAATTGTCATCCATAGTGAAATGTAAATGTACAGCGTTTTTTTCCTTTAGCTTATCTAAATATTCAATCTTAAACCAGTGATATGGTCCATCTGGGTTACAGTTAAACCACATCTTAGCTCTTTCTACTGAACATCTTGCAGTAGCTTGATTAACAAAACTTTGTGGCATTAATGCAACTTCATCAAATAAAACACCTGCTAATGTTATACCTTGTATTAAATCCTGTGAACCTTCATCTTTACCACCGAATAAATAAAAATCATTACTCTTACCATTTTTAGATATAGTAAGATAATTTTCATTAGATGCTCTATGGTCTTTACACTTATATCCTCTACCTCTTAACATTCTTTTAAGTGGTTTTACAACATTTCTTCTTAAAGACCCAATTGTTTTACCACATAAAGCAAAATTTTCACCGTTAAAAGTTGTGTTGGCCCACATTATAAAAGATAATGACATTACTATAGTTTTACCCGCTCTTACTGAACCATCTGCAATTAGTATATCGCTATCTTTTACCGGTGATGCCTCAGTCCACCAAGTAAGAACTTGAACTTGTTTGTCTGAAAAAAGTTTAAATTTAAATACCTTTTCTTTCTTCTTATTCATTATTCCACACCCCAGCGGCCCTGCCATTTAGTGCATCTAAGAATCCATCATCTTCAACCTCGGTTTCATCTCCATTAACTTTTGATTTTTCTAATTCAAGTTTTTCTCTAGCTTGTTTAACTTTTTCATCTTCTATCTTTCTCTTGAAGTTATCAGGAAATAAATCAAAGTATTGAGATAGTTTATCTAAAGCCTTCATCCTATCCTCAAATTTAATAGATACTCCATCTTTACCCTGCTTTACTTCACTTATTATTGTACCATCTACTATATTACTTTCTTTAAAGTCAACATAGTTTACTACCTTAGTAAGTTCATTACCTTCTTCATCTTTAACAGGCCCAAATGGTCCCATAATAGTAACTTCTTTTTGTCCAAATGTTAGATAATCTGTTATATCTGCAAATGCTATCTTTATATACTTATTCAATACATCCATAGCATCTATAAATATTTCTTCTGTCATTTTTCCTTTTAGTTCCTTAATATAAGCTTTAACCTTACTATTTCTTACTAATTCACTACCTGTTACATGAGCCCTTTCAGGTGAATATCCTGCTTTTATAGCTGCCATAGTCTGATTAAAGCTTTTAACATAATAAATACAAAAGAGCCTTTGCTTATCAGTAAGTTTGGTATCCTCTAATACCTCTTTTACTTCTTCTGCAATAGGCTCTTCTTTATTATTTTTATTCTTATTTTTTGTTGCAACACTCTTTCGTTGCGTTGCACTCTTTGTTGCAACATTTTCATTTATTTCATTGTCCCAGTTTTCTCTATTTTTCCTACTTCTTAAAGTTGAATATTTAACTCCATGTTTCTCTGCAAACTCTTTGAGCTTTACTTTTCCATTTAACTTTAAATATTCTTCTTTAATTAAGTTCCAATCTGGCCCTCTTATATTTTCCAT
Protein sequences of DBSCAN-SWA_5 >NC_017299|2449379:2473869|2461433_2461868_-|WP_003385475.1|DBSCAN-SWA MSEKIKDEEILNMTEEDIINRLMEPDEVPEATYFIERLGVPVTLKGLSEKEINKIKRQCTYTRKERGKRIKELDDEEFNAALIEAATVSPNWNNSKLLDALKASDGKQVIRKKFLAGETSAMGDKVLELSGFDNELEEIEDIKN >NC_017299|2449379:2473869|2454116_2455247_-|WP_014521141.1|plate|DBSCAN-SWA MERDLLIPEFLQEDADTIHERMLEKAPPNVSTIEGDFYWDNTRPTAEEKASLMQVQLQNMLRLAFPQTSYGVWLEYLGECKGVFKNLPTKSIGVIKVIGRKGTNIYKDKLIGTVATDDSESVVFKFTENKVIDETGVAYVKAECTKAGTIGNVLKNTITILMDRINGIESITNEEEFTGGTDLEDEEHYRERVLEEYKNEATSGNNEHYKKWAKEVDGVGYAYVIDEWNGPGTVKVLILDKNNKPATRELIDKVQNYIYEIVPREENRGGKAPIGAIATIDTPITLVIDIKANFKFKEDFNSEIVLNSLKENLSKYLSGISIGGTILYTAIHTIVGSMILTGEGIEDFKNLTVNGITENIKLIDQVAVIGEVTNIQ >NC_017299|2449379:2473869|2455252_2455705_-|WP_003385468.1|DBSCAN-SWA MPNLFPDNLEENNIEELEETIIDFKGSYLFDFKTGEFVTNPDGTIAKANDLEAYVQWCYKAMATPRYKLAYSDLYGQEFKNIIGQDISKDAMELEIKRMTEETLMVHPRTKDVDNFIFKWSENKEEVYYEFEIITIDEEKFMLHSELKVW >NC_017299|2449379:2473869|2465865_2466057_-|WP_003385482.1|DBSCAN-SWA MAKSKEENINAMEDEKVEEKTLKAKAKQYIKYGGKHIKIDEEFEVKECDLGELRKYAEIEEGE >NC_017299|2449379:2473869|2472951_2473869_-|WP_014521154.1|terminase|DBSCAN-SWA MENIRGPDWNLIKEEYLKLNGKVKLKEFAEKHGVKYSTLRSRKNRENWDNEINENVATKSATQRKSVATKNKNKNNKEEPIAEEVKEVLEDTKLTDKQRLFCIYYVKSFNQTMAAIKAGYSPERAHVTGSELVRNSKVKAYIKELKGKMTEEIFIDAMDVLNKYIKIAFADITDYLTFGQKEVTIMGPFGPVKDEEGNELTKVVNYVDFKESNIVDGTIISEVKQGKDGVSIKFEDRMKALDKLSQYFDLFPDNFKRKIEDEKVKQAREKLELEKSKVNGDETEVEDDGFLDALNGRAAGVWNNE >NC_017299|2449379:2473869|2464746_2465154_-|WP_014521148.1|DBSCAN-SWA MNFRAIEYIARKKVGMNILCNAMARKLESQAKNDAKWTDRTSNARQGLKGGCEGGGNNYSIYLAHGVEYGEILEEGSKPHVIAPKNGKALYWKGAAHPVKKVNHPGTKGFKTIENTLEGNREVIKSAVLKYWSDD >NC_017299|2449379:2473869|2451307_2451700_-|WP_014521139.1|DBSCAN-SWA MIFLGELKKIEENKIKAKFIHYIPFDNVYGLHKTKEELEQEGILIENIPEPKYIENKQAIMYWNPEDKQIFYEYEDVLKSDEELEQQKQQSLNAKLLKDNAEIQIELNKQKELNADLLLKIAQLGGNANA >NC_017299|2449379:2473869|2451192_2451315_-|WP_003360655.1|DBSCAN-SWA MLSYIKEYFLMGLYVEEDLDIFVQAKWITIEEKENIIKTQ >NC_017299|2449379:2473869|2468422_2470081_-|WP_014521151.1|DBSCAN-SWA MNLYQQRILDARKEFLKLNKKQERELLRIYKELAKELSSEISSCKTSSSKQHLSGMEEIVQAYINELNNKLNNVIKSNIKSSSQIASTTSLAYYDSITDDVKLRSMFNKSVINTSASTVKKLIRGKYYEDGKTLDKRIWNVTKSNAKDIDTLIKVNVAKGANARKLAQQLERYINPAKRIEAKTLEVGMNKSISYQAQRLARTSITHSFAETTIENAKNNPFNKGIKWNLSASHSFRMHGKTDICDDYDGRVFKPNEVPLQHPNCLCYFTEENEDINKAIKELKAWNKGKSNSKLDKWYEDNKKLNIIEYPKKKSKEIQWKDFKGNYTEFKNKREIKKHLIDNYKIKFSDSTKYPINKDILQDSVNWLDKFHSYFEGFKEIDPVELPIIKIKARMNAVGYYQYYINKPQAVELALNGAYFTDKGYNNSYIGQCIKSKWTVANAKPHKTFVHEYGHHIADSMKWLDKNSGISSNNWCKEFIENTISDYNKKYNEDISFKNIAELVSRYGGTKPEEAFAETFAEYFGGENPRKFAKVFGEKVEKKLKEYIKMRG >NC_017299|2449379:2473869|2467592_2468207_-|WP_014521150.1|DBSCAN-SWA MAHIKDIIGEEAFNALSEDKRKELDKKDFEDVSSGSFISKTRFDQVNEQAKEYRKQVGERDKQINNLKEEYKDVDGLKEKVEQLELDNKTQKETYEKQLSDIAFNNALEKGLGAFSIKDKKLIMTLIDKDKLKVDGDNVIGLKEQIEPLKTSHEYLFDKEIKGTGSFVTGGNNDTQPNKTNFASELGKQRAENMKAKSLTDFAK >NC_017299|2449379:2473869|2466113_2467166_-|WP_012705425.1|capsid|DBSCAN-SWA MPNLRDYINSKNIALYIKELPAEQTIDKALFPDKKVSGTKLEMAKGAKKKPIALRMSTFDANTKMRALSADLTVKSTEIPFFKEGMGIDETTRRDLQNAIGANNENFVNALLGQVFENYSNLIDGANIISKKMRSSVIQNGLLNFTSKDGDIVVEYGVPDNHREVLTGTDKWTNPDADIIGDIKSWQKAITNDQYAKPKTLLLTENTFDSTFLVNKAITNHIKNSNLNTSLILSQANYIQFVKEVLQLTVVFLEDATYIPSEGDDPVPYYVDGKITLMSGTTLGNTVYGTTPEEFDKQSGSSKLDTYMVDTGIAVTTMVKEDPVTVDTKVSVMPIVSFDRADEVFFATVY >NC_017299|2449379:2473869|2461891_2462302_-|WP_003385476.1|tail|DBSCAN-SWA MALDASRTIHGSKGKILIDGIWQTNLTETTAEVELDKKELNLVGDDWTRYKQGSKKGTGSMSGFKVSSAMIQRGFKRFEVISSLEDPEAYGHERIRLMNCMADKLNLINLKANELVEEETPFTFEGYELLDPIVVE >NC_017299|2449379:2473869|2468273_2468417_-|WP_003385486.1|DBSCAN-SWA MDQPEPRFLKEGYGYYTDDGLQIKENAPKWAKDEYKEFMSEPYKIEK >NC_017299|2449379:2473869|2463720_2463912_-|WP_014521147.1|DBSCAN-SWA MQEETNLIQEELYPVQDLIENCEALTGYRKEVAVGALFDCGKEEMSKKEFEGRIKKFLGKKVE >NC_017299|2449379:2473869|2462314_2463721_-|WP_014521146.1|tail|DBSCAN-SWA MATGVWNENNRPTIPGFYNRFKALAEKRIGTGIHGILAMPVKANWGPIEKVVSIKDEKDLINKFGKDNTAYRLGRLSLLGQPKELLLYRLTDGAEKISSVMLKDTEDTDILKIETLYPTTRDFNITIRTNIVDDTKKDLILYEATKQLYAFSELGGTIEEVAKSINENVENTWLKATKLDEGNGKLGNVANQTITGGNDGTTSITNEHYIKAMEILEGYKADGFCLDGVTDESLQNTVKAWVKRNKTKGNNIIAYLGIKDTDTIQQANTKSKEFNFEGIVNVGISGYYEGVKYTPTETACYIAGLATGKRLKESICNEKTIFEDVEPRLSKEEVENCLEAGTLILVKEDDEVIVVDDVNTLKKYSEEQNETWGYIRGIKFMNAVDGDTALKRKEFIGKVPNEGTGRLALICALKQYFEVLEKEGVIEDFTVEIDEELQAKAKNDEVFWKWDAKYVNVMKRIYGTGYLR >NC_017299|2449379:2473869|2456983_2457637_-|WP_014521143.1|DBSCAN-SWA MDVYLRNEKEKTTFQFPVNPLDNIVVNRSKKYDTADIVDYGEVDLSDKGKKIKELSFLTLLPKEYDTYCRYRNIPKPEKAIAKLEKWMEQEEPLRLIITDFNFNNLVNISSISEEERGGETGDKYITISFRTYRELKIQTLAPPKTTSTVKTVALTNNRPTTKSNSRIYVVKQGDSLWKIAKWWFGDSSKWNVIYQKNRNIIGPNPNIIRAGQKLVM >NC_017299|2449379:2473869|2458271_2461250_-|WP_014521144.1|tail|DBSCAN-SWA MAKKEIYRLDIKIGVEGDSEAKKKLTATERFAKQTEKRTKALDKIKASPSVRLKDKLSKPLEKMEGKLSKFSKAACSKLAAIATAGAVMIGGLGIAAAVRDFSNFEQGLANVKAISGATAQEMQVLGKEARRLGAETAWSAKDVTDAEMLLSQAGFKVQETIAALPGLLDMASAGDIQLAEATDIAAGTIRAFGMEAKQSAHVADVLALTASRTNSDISGIGESMKYVAPVSKSLGISFEETSAAIGMLADANIKGSQAGTVLRASFARLANPSEKAAEAIEKLGFKAFDSNGKMLPLSQVIGNLKTSMNGLTKQQKAQAISTIFGTEAMSGMMALVEQGPEKLQSLTKELEGSDGAARKMAETRLDSLQGQFTILKSAVEGMNIELGEKLAPYAKEFVSWFTAKIPDITQGIVKVVDTISNLAKKFNSLGTGTKKMFAAVAIGTVAFNPLTKYIKGTTKALTFLIELSPKLSAFFGITKKAAVAAEATEALATGTGLAAKGVGGLGLAAKGGALLLNPWTWAIGGATYAGIKLYRHFKKDSIPAVKEFGEEVSKSTAEAMNSYMKLDKHVGQSLMDIKINNKKITKEISQSVISDFNQMSDQLKGAIDKRYNEGYQTMQTFMSKKSGLKAEENQQILQKIREKQEAEKNIVQQGQQRIDEIVNQASQNHKKLTTQDLNEINTIRNNMTQTAVENISKSAEEQRVILEKLNFDSGNLTAQQAAKVVENSAKARDGSIQAAEEQYNRIVAEIIHQRDDLGIITSDQANQMLDAASRQKEDAVTKAQEMHTEVVSHAQQQAGEHVTEVDWETGRVRDNFDAMIAKIHEFNALTIKEKVIKITTWVNDFFKGDDKNGMDTYNGPGSIAGAGKALATGTNNATSGFHEVAERGFEILVGRQTRLFKGGERVLNNRESKKFLQSGLNEENNQITEEKPKPYFAVAQPQLAGVGGSNVNIDVDVENNFDNDADIDGMVQEAMKEFGYKLKEALKNIKK >NC_017299|2449379:2473869|2453484_2454120_-|WP_012705217.1|DBSCAN-SWA MIKSKKGKEMITYVSPIYEQSKVIQSIFEAIGYEWDTAGLLANDILKQFFPQTATWGLIYWEEAVNVVNNPTEEIERRRRKVIAKLQSRYAINPKRMALILKNYTGADILITEDIAPYTFEVKLTGREGFPKSLEDLYKEVKKIKPSHLSVKYKLISLTESNLYIGATSFSGETITVYPWTPNNIETTGNIEIALAQNAGLETITTYPKEG >NC_017299|2449379:2473869|2456013_2456982_-|WP_014521142.1|DBSCAN-SWA MANIILRNKYKIDNLIEGIQLSESIDGIAYTANINLVETEELKRLGIAKGHSIEIYDIDFETKKNKQVFKGVIWDIDKSRKSKKITLTCKERTIYIEESEDEYLFGEGTATQRIIKYCRDWGIPTASLVNTRAKLAKAVYRRDTILGMMIKDLKETAQKGGNLYKLRMLDKLNIIQLGSNKTVWRLETIAEDINFKSSLEGMITQVKILGKQEENKKTPVTGVYKKDTSKYGTIQKLVQDEKIKSSAEGRKRADALFNTGEETAHISGIDINSIRAGDKVSVNGQILYVIDVTHNLGSTGRMDLTLSNLNYIRRKFYSGDNI >NC_017299|2449379:2473869|2463922_2464744_-|WP_003385479.1|DBSCAN-SWA MRAGIRQKLIDSIPELKDCYEPTVPSKDTVKPYAVILQGSDDEQNNPTSFKRTIEIWLYEKRTTFQKLDALSEKVIKSLDLQTIEDVNADETFTCIFNGAIGQDIIDEEWNAIARGLRFEVISLHEEDEVNKDEWLDALEEYTKQIINYPIYLNNWKKDFEVPSILWRVANTSKERINGALIKENKTLICHVVDRNRGNIEKLLDTIEDKLITDLKIPLDLKDRRYLTIESIQEDRDADMLGVGQLTVDFSRKKMIKDDTPTINKIYGKGSLK >NC_017299|2449379:2473869|2455697_2456030_-|WP_003385469.1|DBSCAN-SWA METIFNEIAREIKGNTNRAVNEAISYIGLDLATITSSGLKLDNFKYEIQDYMMLDYLKMKNEYNTETAGEHSHSHNFKTPKELKPLGPGDRVLVALLKDEFVVVGRVVNA >NC_017299|2449379:2473869|2457705_2458218_-|WP_003385472.1|DBSCAN-SWA MKRRLTKISILLLFIFMFLLIGCGNETSKDNKETTKETKVENKKEENNKKTTEITKGELYDKINSIEKVKAISTIEDTEVGFINLNISINVAKGTAMEELESYTKKAANIQTNLEDYFIQKKFVRIAYVMYVDNEMKSVVVTYKKEDGKYILENTNIMDEKYKKAADALK >NC_017299|2449379:2473869|2449811_2450975_-|WP_014521138.1|DBSCAN-SWA MRTVKQVSDLTGISVRTLHYYDEIGLLKPSEITEAGYRFYDDEALKTLQQILFFKELDIPLKDVKEIMSSPYFDKMQALKNQKKLLLLKRKRLDGLIKLINKTLKGESTMNFKEFDMSEYFNVLEEFKTEHEDKVIRIYGSVDKYNECIEKCKSKEDEIAKMAMKKYGSIEKYAKALKKNLNSDILTLAEKYDVFKKDFLEDKHPKLRELYKKLVSDLSKDPSSKKIQQIAEEITNTAKKDYEIFKMDNGDDHWYYMVQMYLVYPGWIEVVDKKYGNGASKFIGEALKNYSGDKHPKVEELYEKLTSDLSKAPFSKEIQQIIEEISDESKKSQKLYKVDEGENHWGYMAELYLSDSMLQEVTDEKYGNGASKFIGEALKFYSENSKS >NC_017299|2449379:2473869|2471606_2472959_-|WP_014521153.1|terminase|DBSCAN-SWA MNKKKEKVFKFKLFSDKQVQVLTWWTEASPVKDSDILIADGSVRAGKTIVMSLSFIMWANTTFNGENFALCGKTIGSLRRNVVKPLKRMLRGRGYKCKDHRASNENYLTISKNGKSNDFYLFGGKDEGSQDLIQGITLAGVLFDEVALMPQSFVNQATARCSVERAKMWFNCNPDGPYHWFKIEYLDKLKEKNAVHLHFTMDDNLSLSEKVKERYKRMYSGIFYKRYILGLWCLAEGVIYDMFNEDFHKVKTIPKKYEKYYVSIDYGTQNATVFLLWGLYNGKWYIIKEYYYSGRDTSLQKSDVQYSKELKNFLGDIVPVKIIVDPSAASFIKQLRDDGFKNILKAKNDVIDGIRTVASALNLSLFYVNDICKETLKEFSSYVWDPKKLDHGVEEVLKDNDHCMDAIRYFIYTILRFRIEEYDDSIYRKGKGVVKKTTTDPYGRKGGTVF >NC_017299|2449379:2473869|2449379_2449604_-|WP_014521137.1|DBSCAN-SWA MDSNIQQEILERIVRIETKIDGYNSTREKADVAYNKACQNEKDITEMKDNQKWLWRTIAGAIILGILGAVIKFN >NC_017299|2449379:2473869|2465155_2465542_-|WP_012704063.1|DBSCAN-SWA MSTLKAKKIIDTIDKGIELNPTTIEFKHTEKLIVDGAFEEVETIKALKVLIYLEDSSNKIVIDSKTQGTSYSTDKYKMIANKDADIEINPKEAIEFKCLEGHMKVTATYPIQIENTICGYMCDLERVD >NC_017299|2449379:2473869|2467179_2467572_-|WP_003385484.1|DBSCAN-SWA MRQSSYTIGAKQNKLRLIAGDHFISLPIKIRKGDVKPLLDENEVLLAGTLITKDGKKVTSTLSETDAFGVVYQDTSFKGSMSPTADRDDATEVVPVFVHGALYEDAVEFNSDEAIKKVEMAALKQIIFGE >NC_017299|2449379:2473869|2451732_2453448_-|WP_041926603.1|tail|DBSCAN-SWA MGKAKIANSAGFGSKINFVKMKVGDGGGSYYNPREDQEDLINTVWEGNITHVAIDEKNPNWINVEMMIPANVGGFMIREYGVFDEDNNMLAIAKCAESYKPLAEDGSTKELIMKMVLTVSNTENITLKIDPTIIFAKKSEIEILENKIKNIKIPVTSVNSKTGAIELKASDIKTEDGKTIESQLADITTEIGTEELKTNAKDIKSSINELFISASNGKTKVATAITGKGIPASGSDSYDTLSNKIKNIKTGYTQNDLINIENVEFSIKNIFSKNMDSGMLFFIKDYIYVINWKDSIKKYSLDGNLILSKKIEHNGFSSGSYTYFDDIYKIFFHNNSFYIFNKGLKHSGKYYYRVYAETCDIERISTYGFGGQGAYSYYGYGGVAINNNGICCGYNEYSGEVFLFSLSYADVIWSKCLFGWNTKYDFSNIFSDGTDFYISSNYSSGSYYKINVNGDITELEKKSLPYESNSVMLGEYVYCYDSNKKIWRYNIKTNKTEQIGSNCKYIELDFLRKYLYIYTGSILHKIDKNGNIICSYNCTDDHFLGSDKDACIYFYNNNVINKIKLAYKVLV >NC_017299|2449379:2473869|2465542_2465863_-|WP_014521149.1|DBSCAN-SWA MELTPLEILKINLNESQYPVFTDEELNNLLVVNDNNVLKASWRGCLMKANTDKKIKVGPIEVENADPDYWNNLAAMYQADYLQEQANLNPSKATGYKTSMRRADGC >NC_017299|2449379:2473869|2470080_2471607_-|WP_014521152.1|portal|DBSCAN-SWA MEKQARTIRDTLLKLPDNEIAERKRVFTDYYYYKGKSIDLEKAKQNPALYGQNWPVDDNVDYKPTQDIRNKVKPLLKKQARWMFGKKPTLIFKADDLKDKEQCEELRKFIEDVFENNNFWNNTRKAFLEATIKKRVLLRAEANPGDPVTIKYESIENFFYKEKNGKLLKAIFFEEDEMNVYKEEDKDKIYYLHTYYYNADENTKALQAWYRKETYKNTELQKELTIDQDTGFSIIPCWLIRNGGELNNTFGESDITDLRDAQNQYNKRNSDFADALRFQMFGSESIIDGNEDDVNRLTIAPNAVHAIKTRDEALTEGKQATIQRQEYNIGSSSALDSYLDRADSDMKETLDMPKISDLNNIPSAKAMVYLYNDLIARCEEKFNDWEKPLLSLMNFIIEVGSVCYPGIFNKAWVQMKYTKIIKQNYPIPNDEDEKKTLAMKEVEADVRSRKSYIKEYSDEEDVEKAFEEILDEKAMMINAESDQYNKALDNELDNLDGKSNNKGIVGDE |
30 | uncultured_Caudovirales_phage(66.67%) | tail,plate,terminase,capsid,portal | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_6 |
2478528 : 2494617
Sequences of DBSCAN-SWA_6
Nucleotide sequences of DBSCAN-SWA_6 >NC_017299|2478528:2494617|DBSCAN-SWA ACTAAGATATTTTTTTGTATTCATATTTTACGGTTTCTTCTGATAATTGCGCATATATTTGAGTAGTTGCTGGACTCTCGTGACCCATTAAGTGTTGTATAATTGGCATTGGCATACCGCTATTAATCTTGTAGGTTGCAAAAGAGTGCCTGAATAAATGAGGATGTATTGACTTTTCTATTCCTGCCATATTCGCTATCTTTTTAATCTCTCTTTGTATAGATCTTCCACCCAATCTATTATGCGGACTTCTTGATGTAACAAACAATGCTTCGTTGTTATCTGCTCTAGTTAGTAAGTATTTTTTTAATAATATTTTAGCTTTTGTACTAAAATATACCTTACGTTCTTTATCCCCCTTACCAACTACAAATAAGCTCATTTCATGCCAATTAATATCATCTTTATTTACTTCAACAATTTCGCTTAATCTGCACCCAGTACTTATTAGGAACTCTATTAAAGCTTCTTCTCTATCTGTTTTACATGATTGTCTTAGTAATTCTATTTCTTCTTCCGTTAATGGTTTTCTCACTCTTTTAGGTTCTTTAGTTTGCTTCAACTTTTTAGCTGGATTCTTAGGTATATATTCCTCTTCATGCAACCATCCAAAGAAACTTTTTAATATAGAAATTTGTCCATTTACACTAGTTGCTTTCATGCTCTTACATCTAACTGTTAAGAACATCCTTAGATCCATTGTATTTATGGTTGATAAAGGTTTCCTTAAATGGTCCGCAAATATTAAAAGATTGCATTCATAATTCTTTAATGTCTTCCTGCTAAGCCCATCTAGCTTTTTTGTAGCTAAATATATCTGTAATTTCTCCTCTATATCGCTACTTACAAGAGCCGTCTCCTCTGGCAATACACGGTATTTATATAACACTTCCTCTACTATAGCTCTAGTCTTAAGTTGTTCTATTTCTGGAAATTCTAAAGATAACTTTCCTACTAACTTTATAACCACTTCATCTTTGCTTGTACTATACATATAAATACCTCCTTGTATATTGCCATCAAAGGCAGTTTTAATTTATAGATTTATTTTTGAGCTAATAACGTTATTGTTATATTTTTGTATTTTTGATATTATATAAATAAATTTGTATTTTTATATAATTATAAGGATGGTGTAAAATGAGTAAAAATAGAAAGAATAAAATAGGTTCAGTAATCTTATTTATTTTTCTAAATGTGTTATTTTTGATAACCATATATAAAACAACTAGACTTAAACTAAATTTTATGACTTTTATATATATGATTAGCTTAATTATTGTAGATTTAATTTTTTACTTATTACCATATAAATTACGAAATCATAAATAAGTACATCTAATTTTTGAATTACGACTTGCTTTTTAGCTTTTGTATTACTTGATTTTTTACATCATCTGCTCTTTGTTTATGAAGGTTATATAGTACTTGTATAACTTCTGATGCACATTTTTCACTACATACCTTTTCAAATGTCATTTTACCTTTTTCATCTATAACTTTTACTTGATATATTTCTTTACATTCACCACAACATTGGTAACAAGCTTGTTGTTTTTCAAATCTTCCACATTTATTACATTTAACACATATCTCTCCAAAACTTGATTCTAAATTCTTGCAATTATCTAATACAGAATAATCATCAAACATTTACTTTACTCCCTTTCTATTTGCATTATGACATTAATCTTCTACGCATTGATCATATTCTTCTGGAGTTATAAACTCTAAACATTTTCTATTAGTATCTAATTGACTTGCTAACCCTATTTTTAAATTTTCTGCAATATCACTTTTAAGTTCTTCTGGTATTTCTTTTTTGGTTTGCATTGTTGTCTCGATATAAGCCTCACAATAGTCTTTCAATTCTTCATCCCAACCTATTTCAGCTTCCTTAGCTATCCTATAGCAAAATCTATTATTATACATTTTATCTCCTCCATTTTTTGAATTGTAACTTATTCCCACTCAATACCTTTTAATATACTGGCTATTTGCATAAATTCAGTTATAGTTAAATTTTTATAAAAAGCTCTGCTTGTTTTATGGTCATAAAGCCTTATTTCTACTGTACTTTCTATATTAGCTTGGATTTCTGTATATCCACATAAACATTTATGGAAACCAATTTCTATTTCTTTTATATCATTTTTACATACTGGACACTTTCTCATTTTTAGCCCTCCAATCTTTGTATTGCGACATTAGATAGCATATTTACATACTAAATTGTCATTGTAAATTTTAAGACTTTCTTTTATTCTTTCAATCTTCTTATGCCTTTTATATAAAAATGTTTCAAAGTCCATACTTTTAAAGAAACTAGGTTGATTACAATATGCTGCATAATCAATATAAAAATTTCTTTCTTTACTATCCCAACAATTAATATCTCTCATAAAGTAAGGTAAACATTTATTTTTTCTACACCACTCAACTCTTTTAATAAGTAAGCCTATATTCATATCTTTATTTTGATAGATATAAAATTTAACTTTCCATTCCTTAGGAATATACTTCTTTATGATTTTTAATTGTTTTTCTAATAATGGTTGATACTTAGGATTATCAAAAGCAAATATATATTCACCCATGTAGTTCAATTCTGATAGTAACTTTGCATTATCCTCATTAATCAATCTAAAATCTAATCCCTGGTTAAATTCACATCTGATGTTATTCTCTATAAGATACTTAAATACTTCCATATGCTTGTCATATGCTAATATATTGTTGTCTAAAAACTTAACTTTTTTATGTTTAATAATGCTTTCTAATGAGTTATAAACTTTTAGTTTACCCTCATATTTTGGTACTTTACAAAAGAAACAATTTCTTATGCATCCTCTAGTAATAAAACCATAGCTTGTATCTTCATATTCATAGTAAAATGGCTCTGTGTTTTCTATTTCTATTGGTAACTTTAAATTAGGATCAACCGAACCTATTCCGCCATAAATAATATTATTACACCCAATTATTTCAAATCTATCTTGATTAATTTCAAAAATATTGCTTGAATATACTTTGTCATAACCAGTTGCATCAACTATTTTCTTTTTTCTATTTGGATAACCATCAAGTTTTAAATCTATCATTTTCACTTCATTATTATCTTTAAAATAGTTATACATTCTTCTTATTGCAAGGTTAAATTTAGAATCAACATTAACCAATAATATTTTCATTTCTTTCCTCCATTCCTGGAGGTGTGGCCACACTTTTTTATCTAGAATTACTCCAATTTTTTAATTTCAGTTAGTACACAATAATTTCAAATTACGTATTTTTAAGTTCTACACGCTCCCATGTAAGAAAGCTTCTATATGCTTCAAGTTCTAATCTCAAATTTCTCATAGCTTCTATACATACACTATAATTAGTTTCTGCTATATCTCTATTTAATCTTAATTTAGCAATCTCTTCTTTTCCTTTAGCTAAATCATTTATTAGTGTCGCTGGCTGTTTCTCTAACTGTCTTAATCTTAAAATTTCTTTTCTAAGAGCTACTTTGTAGTCATGTTCTGCTCTAGCTTTCTTTACTCCTAGAGTTTTTAATTCTGTATTTCCTCTAGTCAAAGCTTGCTGACATACTCCTATCTTTTGCATTATTTCTATTGGTGTCATATCTACACTTCCTTTAGTATCTTTAAATTTTCATCTGGATACTTAAGCTTAAATTACTTGTCCACTCTTAAGTATCCAGACACATTTTATATATCTTCTATACTAATTTGTTGATTTTTTATAGGAACTGCAATAAACTTACCATCTTCAAATTTGATATCTCTTTCTTCCTGGTATATTCCTTCTTGTTTAAACTGTTTCTTTAAAGTTGAGGTTACCTTATGTTCAAATACTGGTTTCCTATATTTATATGTTTCATTTATTAATTCACCAAATTCATTTGTTTTAGGAATAACTTTAAATGCTTCTGGAATTGATATATTTAATTTAAGCGATATCTCACCACTTTCAAATTCTTCATCATAAACTTTTTTAATGCATCTTTGGACCTCTTTATTTACATCATTCAACATTGCATAAAAAACAGGGCTTTCAATATCTATGTCTAAAACTTTCTTTGATAAATCAACTCTTTGATTTACCTTTTGCATTTTTTATTCTCCCTTCTAATCTTCTTTAGCTCATCATATTCTATCCATCCAGTTGAGCTATACTTTAAGGATCTCGCTACCCATGTAAGTTTTAAATCTGGATATTTATAATCAAACATTTTCCTTCTCATTTCTCCTTGTTGAGTACTCATACCCTTAACATCTATTAATTCTTCTTTACCATCTAAATGATATATTAAAAAGTCCGGTGCATATGTTATAGCTCTATATGTCTTTCCATTCTTCTTGAATCCTGGTTGTAATTCATACTTAGGCTGTAACTCAAAATTTAAAATTTTTTCTTGGGATTTAAGTTTTTTAAGATACTCATAATATTTCCCTTCATCCTTACTATCAAAAGTAATTCCATCTATGACAATTTTCTTAGCTCCATATTTGCTCCTATTCATCTCTGTCCCTCCAATCTAATATGCCTTTTACTGCTCTTCTTTCTGCACCTATTCATACTCTCAATTACAGCTGCTTTGTACTCATTCTCCCTTTTACGTCTTCTTTTGGCTTGTGCTTTTAATATGCTTTTTACAAACTCCTCTTTCCTTATTTTCATAAAAACACCTCGTATTACTGTTTTAGTATTGTAATACACAATAGGTATAAATATAGCCATAGTTAGCCTATACCTACAGTATTTAGTTATCTAAAATACTTTACCATGCTTATATGGTCTACTCCTATTCTTTTTCATTTTCTTTTTAATCTCTTTTTCAATATCAACTGTATCTCCTAGAGAAGTATCAGACGTTCTTAAAATTATATCTGCAAGCTCTTCAGCATAATTTTCTTTATCATCTTTTCTTAATGCATTAACTGCTTCTGATACTTCACTCACTATAAGCATTAATCTTTGACACATAAATGCTCTTTTTACGGCTTTAATTTCCTCATCTTCAAATTCTTTTACACACATTTTAGTTATTATATTCTGTTCTTCTTCCCAAAACCCATGATCTATTGCATTTCTATGTGCATCATTTACCATTTCTTTAATTTTTAAATTCACATAATCTTCAATACTCACTATTTGCCTAACTCCTTTAAACAGATTTTACAAATATTTTTACCTTTGAAGTTTATAACCTCTTTAGCTTCTCCACAAAATATACACGCTGGTTCATATTTTTTTAGAATTATTTCTTCTCCTTCTGTGTAAATTTCTAATGGCGTTTCATTGTCCTTAATGTTTAAAGCCTTTCTAAGTTCCTTTGGTAAAACTATTCTTCCTAATGGATCTATCTTTCTTACTATTCCTATATTTTTCATAATTACATCTCTCCCTTATTTTTATTTAATTCATATAACATTATTTCTTTTCCTACTGCTCTTAAAGCCTTGTCTAAATCTTCAGTTATAAAATACTGCTTGGCTACTTCATCTGCCCACATATTAGCTCTTATCTTTAAATTTGATACTTCTTCCTGATATTTTTCCAATAAATCCAAGCTTTCTAGTAACAAATCCTTATAGTCCATACTTTTCTTTACACATTCCTTTAGAAGAAACTTTAAAATTGTATTTTCTTCTTTAAGTGTTTCTTTGTTCTCCATTCCTTTAACTAATACAGTTATCATACTCATCCTCCCAATATTTATCATAGTAACTACATTACCTCTTTTAATGCTTTAAGCTCTTTTATAAAATCATCAATTTCATTAGCATTTAAAACTAGGTTGGTTGTGCCAGTAAGATTTTTTATAGAAAAACTATTCTCTTGAACTCTATATTCCATTACCTTACCTCTTAAAACTAAAGGTTGTAATATCTTATTATTGCTTGGAATTTCTTTTTTAAATTCCTTTGCTTCTTTATTTCCAGTATTTTTAGTTGTAGTAGGCTTTGTATTATTTAAATTATCCCTGATACCATACTTTCCTAAATAAGTATCTATAGTTCTTTCTGTTAAACCGTATTTTCTACTTATCGCTACTATAGCTTCTCTTCCAGTTCCAAGTATTTTAGCTTCTTTCATAAGTTGTGCCCTAGTTATTTTAGGTTCTTTTGTAAACATTTTATTTTCCCCCTCATATTTATTTTTAATGGTATTAGGTATCTTTTTGAGAATTCTACTTATATAACTTTGTTTTAACCCTATTTCTTCCCCTATCTGTTTTTGAGTTTTATTATTAAAATAGAACTCTTTAATAATTTTCTTATCTCTTTCATTTAAATTTTCTATTATTGCAGTTATTTCTTTGTACGTTACATTAAAAATACTTCTATCTTCATAATTTGTTTTATCTGCAACTAAATCTATTAAACTTAAGTTTTCTTTGTCTAGCTTTTGGCTTAATATAGGCTTATCTAAACTATCTACATCTACATGTTTTTCTTCTTTTCTGTTAAACATTTTTAATTCATTATTTACTACAGCTGCCAAGTATGTCATGAATAAAATATTTTTATCAGCATTATAAGCTGTAAATGCTTTAGTCATTCCTAAAAAGGCTACTTGAAATAAATCTTCTTCTTCAAATTTACGTTTCCATGACTGTATCAACTTATATAAGAATCTTTCAAACTTAAAATAAACCTCTTCTAAGCTCATTAATTTCAAACCTTCATCTTTGGTGAGAATTAACTTTTTCTCAGCCATCATAAAAATATGCTCCTATTTCTCTGGCATCTGAAATACAAAATCTCTAGTTGTTCTTTTCCCATTGTATATATCATCAAATCGGCTTCCTTGCATTATCCTATCTTGTATCATATCTAATACTTCTAATGCTCTTCCCTCTGTAGAATATTCTCCTAAAAAATAGTGTTCTCCGTATATACTTAATCCATCAGCCTCTATATTTTTACAACACACTAAAGTGTCTTTATTTTTACTTCTAATCCACATTTTTTTATCCCCCATTCTTTAACTTAATAATTCTTTTAATATTTGTGTTTTCTCTTTAGCCTTTTCTACTCTTATGCTCTTTCCATCATTAAATACTGGTGTACACATTTCTAATAACCTATCATAAGTTCTTTTATGATATTTTTCTTTAAGTTCTACTAAAGAAATATTTGTAGTAACTATAATTGGTAATCCATTTCTGTACCTGCTATCCAAGATGTTGTATATTTTAGTTTTGGCCCAATCTGTATCCTGCTCTGTTCCTAAATCATCTATAATCAATAAGTCGGCATTGCTCAAACTTTTTAATATAGTTTCTTCCCCTTCTTTGCCCCATGTGTTATATGTTTCTTTGATTCTATTTAGTAAACCATCTATATTTACACATATAACAGGAATCATTTTATCTATTAGTTCATTTGCTATACATGCTGTTGTATGAGTTTTACCATTGCCAGGATCACCGTGAATTAATAGTCCTATTGATTCTTTTTTCATTTCAGAAAATTTTGATGCATACTTAAAGCCTATATTGTACATTTTCTTAGTGCCTTTACTAAAGTCCCAGTTATCAAATCTACTGCTCTTAAACTTTTCATCCATTAATGAATTTTTAATTATGCTTTTAACTCTCAATTGTCTATCTTTGTTTTCTTCTTCAATTCTTTTGGCCTCATGCTTTGCTTTTTTACATGAACACATTATGGGAACAATTCTTTCTGTACCTAGTAAATTAATTATTTTTTCTATTGGTTCCCCACAATTACCACAAGTTTTTATTTTATATTCCGATACCTTCGGCTGTAAGTCTTTGCTGTTCATCAGTACCTGAGCTATTGTTTCCATTTTGTGATTTTGCTCCTTTCTTTTTGATGTTTATATTATTCCAAATTTTTAATATTACTGGTTTACAATAGTTAAATGAACTTATCTTTTCACCTTTAAAACTTGGTTTATAATTTTTAAAAGCATCATCTATACCCTTTTTTATTACATCTACAGGCACTTTTTGTAATAATTCTTCCACTGTTTCAAATTCTTTAGGTTTAAAATTAATTGATACTATACCAGCTTTAGAACAATAATAATCTATAATTTTTTCTATGTTATTTTCTATATAAAGAAGATTATTATCTTCTTCTATATCTATATCTTCTTCTTTATCTTCTTCTTCTTCTGTTCCGTTACTTAACGTTTCATGTAACGTTACACTCCTTTTAACCTCGTTACTCCCACAAGTTTCCTCTTTAGCAGCTTCTAATAATTCTTTTTTCTTTGCTCTATGTTTAGCTACTCTTTTCTTAGTTTGTTCCCTTACTTTTTCCATACCTTCTATATTTTGATGCTTTGACCAGTTAGTAATCTTAATTAAATGATTTTCAGCTAATTCTATCATTCCAAAATCATTCAATGTTTTTAAAGCTAACCTTACTGAATTTAATGGCCTATTAAAAATAGTTGAAAGCATTTCTTCTGTATATGGAACATTCTCATTTAAAAAAATGTATCCATTTGCATTTGTTTTTCCTGCTTGAACTAAAAGCCTTATCCAAATATAATGAATTGTATCTCTTTCCGGCATGGCATCTATTAATTTTATTTTTTCATCATCAAACATATTGGTTGTTATTTTTATCCATTTAACTTCTGCCATTGTATCAGCCCTTTCTTTTGTTTTATCTGTATATAAAATAAGACATTACTACAAAACTCCCAAATATTATTAATACTATTATTGCTAAAACTAAGTTAGCTAAGAACCTATATTTATACTCTTTACTTACTGCCTTCTTTGCTATTTTTAAAGCTTTTATGTCATCTACCCATATTGAGTCGTAGTCATCGCCACTTGTTATTAAGCTTTTGCTATTATCTATCAAACTGTCTAATTGCCATAAAACCTCTCTTCTTTTCATTTCTTCCATCCCCCATGTATATTTTTCTACTTTTGTCCATATACTATATTGAGAAACCATTGATATGTGTGTTATACTAAGGGACAAGAGCTTTGCAGAGCTCTTATCCAATTTTTAAATCAATCAATTTCTAATTGGTGCTTTGCAGAGCACCTATTTCCTTTCATCTTCCATAGTTTCAAATACCACCTCATCACTATCGCTGTCATATTTTACACCACTTATAAAATATTCTGGATTATCAATATCATATATTGAATATCCATTTTTATTTAGTACAGCCAGTTGTGCATTTATACTTTGTATTAAAGTTTTAAAAGAATTATCCACGCTCTCACCTCCTTTCTAAAATGGAACTACTAAATCATAATTCTCTATCTCGTCTAAAAGTTTTTCTGTTTCCTTTTTTATATCATCTACTCTTCCTTCCTCCGCATATTTACGAATCCAGTTTAGTCTATAAATTAAAGCTTCTTTATTCTTCTTATCCATAATTAATTCTCCTGGTCTTGTAGAAAAGGTGCTACATCTTCACTATCTTTATTGACTTTTATTATGTCCTCTTCGGTATCTATGCTATTAATCTCTACTGCATCAACATCAACATAATTAAAATTACTTAATTTCTCTTCTTTAGCTTCTGCTTTATAATCAAGATCTAATGCCTTAGCCATTTCAACACTTTTAGGTGCATACTTAAGAACATCTAACAATACTGTTTTCTTGGCCATACTATCAAAGTTTTTGAACCACACTGAATTCTTATTAACATTACCCTTGTAAGTGTAATTTTTTGAGAATTCTCTTGCATGATGTTCTACTCTTTCTCTGGACCATACTACAAAGTCAAATCCACCATTTTTAAGTTTATATACAGCATAGTAGTGAGTAACTTCATCACTAGGAATATCTGCAGGTTTATGCACCAAAGTTTTGTGTAATCCATATTCATACTCGAATTCATCACCTTTTCTAACTTCATGAGCATATATAGCTTCATATTCTCCAGTATTAAATGCCATCTTTAGAATGCCCTTGTATCCTACTTGGAAATTAACTTCTGTTATGCCTTGTTTGTTATTTTTATAAGGTATTACATAAGCTTCTCCAAGTACTGTGTTAGGTTCTAAACCACATTGTGCACTTTGCATTAATGCACTTAAGAAACTTGTAGTATCTGCTTCCCAAAACTGTGGATTCCCATTAAATAAACTTAATGCTATTCTTGAAAATCTTTCTGGTGTCATTGTTTTACCTACTGCCTTTTTTATTTCTGGTAGCATTTTCTCTAATGCACTTTTCATTTTTTTCTGTGGTGTTAATTGAATATCTTGTGTTGTTTGTTTATTAACAACTAAACCTCCGTTTACATTAGCCATTATTATTCCTCCTTATTTGCATTTAGTAATTCTCATATTTACATACTCTGTTTGACCATTTAATACTGCTGCATAAGTAACTGGATATTTTTCTTTAAATGTCTTAGTATCTAATTTATCTCTCTTCACCTCATATCTGCTTACTTTATAAAGTCCATCTGAACCCTTTTTACTATCTCCTAGATCTAAATATATAAGTTGTTTCAATTGTTCTTTTTCTTTTTCTAAGTCTTTAATCTGTGCAACTACTTCTTTGTATTTAGTTAGTTTATTTTCGCTTATGTTAGCCTCTAAATCATTATCCAATACTTGTTGATATAATATGTCTTTTGTTTCACATTGAAGGCCTACAGGTATCGGTGGTGCTTTTTTAAGAATATTGTTATTCCAAAAGTTCTCTCCTATTTCAAACAAAGCTTTTATATCATCATCACATCTAGGAATCACTTTCCATTTAACCTCTTTCCCTAATAAATAAATTATTAAGAAGTACTTAAGGCCTGTAATCCCCATATACCATTGACATTGGCAATAATATTCGTCTGGAATTTCTTCTCCCTGCCACATCTTTTTTAAGAACTCACTTGCTGTTTTTATTTCAATACCTATTAATTCACCTGCAGGTATTTGTTTAATTTCAGCTGTATCTCTATTTTCCCAATATGTGTAGCCTGCTTCTAATTTAGCTAAACCATCTATATTTGCACTAAAGTATTCATATTCTTTATGAATCATCATGTAAGGATACTCATATGTTTTTAACTTAATTTCAGTTTCTTTTTCAAAATCTTCTTGAACCCATTCTCTTATTAAAGGTTCCATTCTGTTACCAAACTTGGTGTGAATATTACCTTTGAATTTTTCACTTAAACCTAACTTTTCATTAAATACTGTAAGAGCTGAACCGTACTTGCTAAAACCTGCAACCTTTGCTATCTCACTACCGCCTATTGAATTACCTCTTTGACTTAACCATTGTGTTCTAGCTTCATCATCTTCCCTACTGTCAAATATAACTTTTACATTAGGGAACAAATTCTTATCTTCTATGAATTCAACCATTTACAATACCTCCTTATCTGCAAAGTCAAATACTTCTATTTCTTTTCCTTCAGGTGTAATTACTATTCTGCCTTTACCTAAGTTTCCAAACAGACCATAACCGGCCCAATTACAACCATGACCTTCATCTTTCCCTTTCATTCCATTAGTACCCTTGCCATTATGTCTACCTATACACTCTTGATATGCTGAATTTCCATCATCACCTAATTCTTTAAAGTCTTTAACACTACTAACATGACCACAAGCTGGGCATTTAAACTTCCAATTACCTGCATCCTCTCCGAATTTTTCTATAGCTTCTTCTCTCCATTCTTTTAATGTTTGCTTTATCATTTTTAATCCCCCTATCCTATTTTTTCTATCTCAAATTCATCTGACATAGTACTAGTTACAAAGTATTGATATTCGTCACTGGACATTTGTTCAATTAGTTTTTTCTGTGCCTTAGGATTTAAACTTTCAAACTTATCTAGACAAATTACTTTAAGTTCTCCTGCCTGTGCTTTTGCAATCCTCATAGCAAGTTCTAGCTTCTCACCATCACTCAATCCATCAATTAAAGTATTATTAATTCTTATAAAACCTTCTGCATCTACACTTATCCCTTCTATAGGCATTTTTGCAGTTTTTAAAAGTTCTCCTGGAAGTTCTCTAGCTTTATCTATCTTTGCAGTTAGATCATTACTATATCTTTCTTTAGTGGCTAACTTGCTATCCCTAATGTCTACCATCCTATCCCATTCCCTTAAATAACTTTGCATATCTGCTATTTCATCAGCTTGCTTCTGTAAAGGTTCAATATCTTTAACCTCATTATTCTTCAAGTATTCTGCAGCCTTACCAACCCTAATTTCTTCTTTTTCTATTTCAGCAGTTATTTTTTCATCTATTGCTTTTAATTCAGCCTTTTGTAAATCATCAATCCCTAAGAGTTCCTGTTCTTTCGAAGAAATTTTATTTTCATTTATAGAAATCAATTCTTTTTGCTCTTCTATCTGTAAAATATTATCTTTTTTAACAAGCTCTATTGATTCATTTAAACTATTTTCTAATTTCTTAACATTTGAGCTATATAAATTAACTAATTCTTTTTTTCTATTTTCAAATTCTTCTTCAAGCTTTTTTAGCTCATTATTATAATTTTCAGCTACTTTATTTTCTTGAGCTACATTTTCATTAGTTAGTTCTTTTATTTTTAATTCTAATTCACGATCTGAATTATTTATAAAATCCTTAGACTTATCTATCTTGGATTTAGAAAGTTCTATAATGTCTTTAATATCCTGTCTTTCATCCTTAAACTTAAGTTGTATCCTAGATTTTTCACTTTCTCCATTAGATTTTATAGCATTAACTTTATCCTCAAAATTTGTCTGTAATGTCTTAGCTTCTTCTATCCAATGATTAATCTTTTGAGCTTCTGATACTTTGTTGTAATAGTCTTGAACCTTTTTTTCTCTCCAAACTTCTCCATCATATTCTGCAGGAAGTTCATTTAAAATTACTTTTATCTGAGTTTTAAGCTCTCTTATATCTCTATTGACTTCTTCCCTATCTTTGTAGTATTTTAGTTCTATAGCTTTGAGTATTTGGAGAATGTGTTGGTCATAGTCTATATTGCTAGGAAGTTCGTCAAACCAATTAACAATATTCTCTTTGTTCCAGCCTATCTCCAACATACTTAAAATAGATTTTGTTTGCTCTTTAATGTTCATATTTACCCAATCTAAAGGTCTAAATATATCTCCATTTATAAGACTTCTTAGAAACTTTTCTGTAGATGGTACTACACTTTCTTCTTTCCTAACTTTTAAATAATCAGCTTTTTCAGTTCTAAGTCTTCTATCAATACTCAATCCATCATCAAGTTCTATATAAATAGTTGCTTCCTCTTCACCATGTTTAACTACTTCAGTACGTCTATTCTTATTTGTAAACCCTTTTTCTATAGATTCAATTATGCTACTTTTTCCACTTCCTTTAGGTCCTTTTATAAGATTAATTTTGCTACAATCTAATCCTAATTCTTCAAGTCCTAAAAAGTTTTTAATATTGAGTTTTTTAATTTTACTCATTTTTTAATTTCCTCCTTTATTGGTACTATTCTCTAACTTCTTACATATACATAGACTAGAGAAGTATATGTATATTTTCTGTAGTAAAATTTTTTAAAAAGGCTTTTCAGCCTTGCTTATCTATAGTTATTCTTTTTCTAACCCTTCTATAATTTTTTCTATAACCTCTGGAGGATGTTTTTTAACTAAGGCTCTAGCTAATATTTTCATAGCTTCATCTTGTATTTCTTCCATTACTTTTGGATCTTCTGGATAGTTCACTATAATTTTTTTAATTTTAGCCATAGCTTTCCTCCTCTCTTTACTTTGCTATTATTCATCTTATGAATAGTTGTATCTATTTGTTAAAATTATTTTTATTTATAGATTTAAGTGATGTTTCCATGCATTTATATTCCAAGACTTTTATAGTGTCCTCTAACAGTTTTTTAGTAAATACTGCTGTAACATCTAGCCCTTTGAATTCTTTTTCTACAAGCTCTAATATTTTATCTATTGTTTCTTCTCTTTTCTCTTGTGTAACAGTTACTTTTATATCTTCTACACTATTACCTCCTAAAGGGTTTTTTTACATTTTTGTCGAATATTAATAATTGAAAGGTGGTGAATATTATGAGTAATAATTCTGTCTCAGATCATGCCGCTTATTATCCTTCTATAACTCAGAAGTATCACGACTTAACCATGATGTACTTAGAAAAAAACTTTAAGTTCGCTAAATCTAGTCCTAGTGATTTAATAAAGGAATATATGAAAGTTTATGAGGATCTTAGATCTACTTATAAAGAATTAAAAATTAAATAATTTTGTAAGTTCTTTAGCTGAATCAATACTCATCCTCTCAAAAGTTGAAAGTATTGATTTGGCTTTTCTTATTCATTTTTTTAAATAAATTTTCTTCTATAAATCCCTCTGAATCATATTTTTTAAAATCCTTAATTTTCATCTTTCTTCCCCCACTATTTAGTGCAAGCTACTTCTTTTTCAGCTTGATATTTCATAAACTTATTTATAAAATATATCTGGCCTTTCCCAGTAATTTTTGGGGTCTTACTTATACTTATATGCCCATCTGAATGTGTAATGGATGTTTCCTTAACTTCAAATAATCCTAGATCCATACTGTACTGAGTTGGCATATTATAATCTGTTCCTTTTCTTCTAATTAAGTATCCGTTTTCCCTTAACCAAGCAAATAATCTTTTAGCTCCTATATCTATACCATTTTGCTTAATTAATTTTGCTAAATCTCCTACTAGAATTGATGTATGGGCAACTGATACTGCATCTGCAAACAATACTTTTGGTTTTTGCTTTTTCATTTGTTCCTGCAATAGTTTCTTTTCTTCACGTTCTTTTTTAAGTTCAGTTGCAACTTGAATTAATAAATCTGGGTTATCCAGCAATTCATCTTTTGCATACATACCGTATTTTCTTATGTTTGGTAATACTTCTGAAGTAACCCATCTCTTAAATTTTTTAGCTGCTGGTAGTTTTGAACTTAATACTAAACTATAAAGTCCACTTTCATTTATTATTGGTGTATTTTGATTTCTTCCCATGGAATCCTGAATTGGGACTTCATCCTTATCTTCATTATCTACTCTATCTTGTATTGCTTTTGTTGGTCTTTCATATCCTAAACATTTAGCTACATCTTTTCCTACAAACCAAATTTCATTTTTCTTTTTTATTGTTCTTACTGATCCAAATTCTTGGTTTTTAAAAATCTGTAAGTTACTCACCCTACATCCTCCCTTTTACTAATGTAATTTTTAAAGAACTACATAAACTATTATTAAGCAGTATTAGAAAAAGTCTTGTTTGTGTTAACTATTTCTGTAAAAAAAATTTCATCTACACTTTTTTTAAAATAATCTGCTATTTTTTTAGCTTCTGTAAGATTGAACTCACGTTTGCCAAGTTCTTTTCTATTGTAAGTTTGTATCGATGTATCAATTAATTCAGCCATATCTTGCTGTGTTAAATTATTTTGTGCTCTTAATCCTTTGAGAATTTGAGTACTAGCCATACAATCACCTCCTTTGTTTTGTTCGCGTTAACTTTATACTCTTATTATAATTAACATAAACGAAACTGTCAATACTTATTTTAAACATTTTTATAAAAATTATACCTTTGCTGTTAACTTTGTTTCTATTAGTGTTAATTTGTTTTAAAATTATAGTAATGAAAGAGGTGTTTAAATATGTCTTCTACATTTGGCAAAAGATTCAAAATGCTAAGATTAGAAAAGGGTTTAAATCAACAAGAACTAATAGATGACTTTAATAAAAAATATCATTATGGTTTTACTAAATCCGCTGTCTCTCAATATGAAAATGATAAACGAATACCAGAAATAGGAGCCTTAGATGCTTTTGCTAATTATTTCAATGTATCAATAGATTTTTTATTAGGGAAATCAGATATTAGAAATATGGATGATTCAGAACCTAGTAAACAACTAACTAAAAAAGATGAAAAAGAAATAGAAAAAATACTAAACGAAACAAAAGAAAGATTAGGAAATGCTGAAGGTCTAATGTTAAATGGTGAACTTGCTACACCAGAAGCCATACAAAGTATACTAGATGCTATGAAAGTTGGCATGGAAATAGCCAAAGAAAGAAATAAAAAATATACTCCTGATAAATATAAGAAAAATAAATAA
Protein sequences of DBSCAN-SWA_6 >NC_017299|2478528:2494617|2481809_2482157_-|WP_012704046.1|DBSCAN-SWA MTPIEIMQKIGVCQQALTRGNTELKTLGVKKARAEHDYKVALRKEILRLRQLEKQPATLINDLAKGKEEIAKLRLNRDIAETNYSVCIEAMRNLRLELEAYRSFLTWERVELKNT >NC_017299|2478528:2494617|2480213_2480459_-|WP_014521167.1|DBSCAN-SWA MYNNRFCYRIAKEAEIGWDEELKDYCEAYIETTMQTKKEIPEELKSDIAENLKIGLASQLDTNRKCLEFITPEEYDQCVED >NC_017299|2478528:2494617|2483931_2484237_-|WP_014521175.1|DBSCAN-SWA MITVLVKGMENKETLKEENTILKFLLKECVKKSMDYKDLLLESLDLLEKYQEEVSNLKIRANMWADEVAKQYFITEDLDKALRAVGKEIMLYELNKNKGEM >NC_017299|2478528:2494617|2483306_2483687_-|WP_014521173.1|DBSCAN-SWA MSIEDYVNLKIKEMVNDAHRNAIDHGFWEEEQNIITKMCVKEFEDEEIKAVKRAFMCQRLMLIVSEVSEAVNALRKDDKENYAEELADIILRTSDTSLGDTVDIEKEIKKKMKKNRSRPYKHGKVF >NC_017299|2478528:2494617|2490212_2491943_-|WP_014521185.1|DBSCAN-SWA MSKIKKLNIKNFLGLEELGLDCSKINLIKGPKGSGKSSIIESIEKGFTNKNRRTEVVKHGEEEATIYIELDDGLSIDRRLRTEKADYLKVRKEESVVPSTEKFLRSLINGDIFRPLDWVNMNIKEQTKSILSMLEIGWNKENIVNWFDELPSNIDYDQHILQILKAIELKYYKDREEVNRDIRELKTQIKVILNELPAEYDGEVWREKKVQDYYNKVSEAQKINHWIEEAKTLQTNFEDKVNAIKSNGESEKSRIQLKFKDERQDIKDIIELSKSKIDKSKDFINNSDRELELKIKELTNENVAQENKVAENYNNELKKLEEEFENRKKELVNLYSSNVKKLENSLNESIELVKKDNILQIEEQKELISINENKISSKEQELLGIDDLQKAELKAIDEKITAEIEKEEIRVGKAAEYLKNNEVKDIEPLQKQADEIADMQSYLREWDRMVDIRDSKLATKERYSNDLTAKIDKARELPGELLKTAKMPIEGISVDAEGFIRINNTLIDGLSDGEKLELAMRIAKAQAGELKVICLDKFESLNPKAQKKLIEQMSSDEYQYFVTSTMSDEFEIEKIG >NC_017299|2478528:2494617|2486289_2487162_-|WP_014521179.1|DBSCAN-SWA MAEVKWIKITTNMFDDEKIKLIDAMPERDTIHYIWIRLLVQAGKTNANGYIFLNENVPYTEEMLSTIFNRPLNSVRLALKTLNDFGMIELAENHLIKITNWSKHQNIEGMEKVREQTKKRVAKHRAKKKELLEAAKEETCGSNEVKRSVTLHETLSNGTEEEEDKEEDIDIEEDNNLLYIENNIEKIIDYYCSKAGIVSINFKPKEFETVEELLQKVPVDVIKKGIDDAFKNYKPSFKGEKISSFNYCKPVILKIWNNINIKKKGAKSQNGNNSSGTDEQQRLTAEGIGI >NC_017299|2478528:2494617|2493741_2493975_-|WP_014521189.1|DBSCAN-SWA MASTQILKGLRAQNNLTQQDMAELIDTSIQTYNRKELGKREFNLTEAKKIADYFKKSVDEIFFTEIVNTNKTFSNTA >NC_017299|2478528:2494617|2488815_2489865_-|WP_014521183.1|DBSCAN-SWA MVEFIEDKNLFPNVKVIFDSREDDEARTQWLSQRGNSIGGSEIAKVAGFSKYGSALTVFNEKLGLSEKFKGNIHTKFGNRMEPLIREWVQEDFEKETEIKLKTYEYPYMMIHKEYEYFSANIDGLAKLEAGYTYWENRDTAEIKQIPAGELIGIEIKTASEFLKKMWQGEEIPDEYYCQCQWYMGITGLKYFLIIYLLGKEVKWKVIPRCDDDIKALFEIGENFWNNNILKKAPPIPVGLQCETKDILYQQVLDNDLEANISENKLTKYKEVVAQIKDLEKEKEQLKQLIYLDLGDSKKGSDGLYKVSRYEVKRDKLDTKTFKEKYPVTYAAVLNGQTEYVNMRITKCK >NC_017299|2478528:2494617|2483686_2483929_-|WP_014521174.1|DBSCAN-SWA MKNIGIVRKIDPLGRIVLPKELRKALNIKDNETPLEIYTEGEEIILKKYEPACIFCGEAKEVINFKGKNICKICLKELGK >NC_017299|2478528:2494617|2482243_2482648_-|WP_014521170.1|DBSCAN-SWA MQKVNQRVDLSKKVLDIDIESPVFYAMLNDVNKEVQRCIKKVYDEEFESGEISLKLNISIPEAFKVIPKTNEFGELINETYKYRKPVFEHKVTSTLKKQFKQEGIYQEERDIKFEDGKFIAVPIKNQQISIEDI >NC_017299|2478528:2494617|2483054_2483216_-|WP_014521172.1|DBSCAN-SWA MKIRKEEFVKSILKAQAKRRRKRENEYKAAVIESMNRCRKKSSKRHIRLEGQR >NC_017299|2478528:2494617|2485526_2486330_-|WP_014521178.1|DBSCAN-SWA MNSKDLQPKVSEYKIKTCGNCGEPIEKIINLLGTERIVPIMCSCKKAKHEAKRIEEENKDRQLRVKSIIKNSLMDEKFKSSRFDNWDFSKGTKKMYNIGFKYASKFSEMKKESIGLLIHGDPGNGKTHTTACIANELIDKMIPVICVNIDGLLNRIKETYNTWGKEGEETILKSLSNADLLIIDDLGTEQDTDWAKTKIYNILDSRYRNGLPIIVTTNISLVELKEKYHKRTYDRLLEMCTPVFNDGKSIRVEKAKEKTQILKELLS >NC_017299|2478528:2494617|2489865_2490201_-|WP_014521184.1|DBSCAN-SWA MIKQTLKEWREEAIEKFGEDAGNWKFKCPACGHVSSVKDFKELGDDGNSAYQECIGRHNGKGTNGMKGKDEGHGCNWAGYGLFGNLGKGRIVITPEGKEIEVFDFADKEVL >NC_017299|2478528:2494617|2492069_2492228_-|WP_014521186.1|DBSCAN-SWA MAKIKKIIVNYPEDPKVMEEIQDEAMKILARALVKKHPPEVIEKIIEGLEKE >NC_017299|2478528:2494617|2478528_2479521_-|WP_014521164.1|integrase|DBSCAN-SWA MYSTSKDEVVIKLVGKLSLEFPEIEQLKTRAIVEEVLYKYRVLPEETALVSSDIEEKLQIYLATKKLDGLSRKTLKNYECNLLIFADHLRKPLSTINTMDLRMFLTVRCKSMKATSVNGQISILKSFFGWLHEEEYIPKNPAKKLKQTKEPKRVRKPLTEEEIELLRQSCKTDREEALIEFLISTGCRLSEIVEVNKDDINWHEMSLFVVGKGDKERKVYFSTKAKILLKKYLLTRADNNEALFVTSRSPHNRLGGRSIQREIKKIANMAGIEKSIHPHLFRHSFATYKINSGMPMPIIQHLMGHESPATTQIYAQLSEETVKYEYKKIS >NC_017299|2478528:2494617|2487918_2488803_-|WP_014521182.1|DBSCAN-SWA MANVNGGLVVNKQTTQDIQLTPQKKMKSALEKMLPEIKKAVGKTMTPERFSRIALSLFNGNPQFWEADTTSFLSALMQSAQCGLEPNTVLGEAYVIPYKNNKQGITEVNFQVGYKGILKMAFNTGEYEAIYAHEVRKGDEFEYEYGLHKTLVHKPADIPSDEVTHYYAVYKLKNGGFDFVVWSRERVEHHAREFSKNYTYKGNVNKNSVWFKNFDSMAKKTVLLDVLKYAPKSVEMAKALDLDYKAEAKEEKLSNFNYVDVDAVEINSIDTEEDIIKVNKDSEDVAPFLQDQEN >NC_017299|2478528:2494617|2492902_2493688_-|WP_014521188.1|DBSCAN-SWA MSNLQIFKNQEFGSVRTIKKKNEIWFVGKDVAKCLGYERPTKAIQDRVDNEDKDEVPIQDSMGRNQNTPIINESGLYSLVLSSKLPAAKKFKRWVTSEVLPNIRKYGMYAKDELLDNPDLLIQVATELKKEREEKKLLQEQMKKQKPKVLFADAVSVAHTSILVGDLAKLIKQNGIDIGAKRLFAWLRENGYLIRRKGTDYNMPTQYSMDLGLFEVKETSITHSDGHISISKTPKITGKGQIYFINKFMKYQAEKEVACTK >NC_017299|2478528:2494617|2480488_2480704_-|WP_014521168.1|DBSCAN-SWA MRKCPVCKNDIKEIEIGFHKCLCGYTEIQANIESTVEIRLYDHKTSRAFYKNLTITEFMQIASILKGIEWE >NC_017299|2478528:2494617|2485274_2485508_-|WP_014521177.1|DBSCAN-SWA MWIRSKNKDTLVCCKNIEADGLSIYGEHYFLGEYSTEGRALEVLDMIQDRIMQGSRFDDIYNGKRTTRDFVFQMPEK >NC_017299|2478528:2494617|2494152_2494617_+|WP_014521190.1|DBSCAN-SWA MSSTFGKRFKMLRLEKGLNQQELIDDFNKKYHYGFTKSAVSQYENDKRIPEIGALDAFANYFNVSIDFLLGKSDIRNMDDSEPSKQLTKKDEKEIEKILNETKERLGNAEGLMLNGELATPEAIQSILDAMKVGMEIAKERNKKYTPDKYKKNK >NC_017299|2478528:2494617|2482635_2483058_-|WP_014521171.1|DBSCAN-SWA MNRSKYGAKKIVIDGITFDSKDEGKYYEYLKKLKSQEKILNFELQPKYELQPGFKKNGKTYRAITYAPDFLIYHLDGKEELIDVKGMSTQQGEMRRKMFDYKYPDLKLTWVARSLKYSSTGWIEYDELKKIRRENKKCKR >NC_017299|2478528:2494617|2492555_2492747_+|WP_014521187.1|DBSCAN-SWA MSNNSVSDHAAYYPSITQKYHDLTMMYLEKNFKFAKSSPSDLIKEYMKVYEDLRSTYKELKIK >NC_017299|2478528:2494617|2484266_2485262_-|WP_014521176.1|DBSCAN-SWA MMAEKKLILTKDEGLKLMSLEEVYFKFERFLYKLIQSWKRKFEEEDLFQVAFLGMTKAFTAYNADKNILFMTYLAAVVNNELKMFNRKEEKHVDVDSLDKPILSQKLDKENLSLIDLVADKTNYEDRSIFNVTYKEITAIIENLNERDKKIIKEFYFNNKTQKQIGEEIGLKQSYISRILKKIPNTIKNKYEGENKMFTKEPKITRAQLMKEAKILGTGREAIVAISRKYGLTERTIDTYLGKYGIRDNLNNTKPTTTKNTGNKEAKEFKKEIPSNNKILQPLVLRGKVMEYRVQENSFSIKNLTGTTNLVLNANEIDDFIKELKALKEVM >NC_017299|2478528:2494617|2487769_2487916_-|WP_012721435.1|DBSCAN-SWA MDKKNKEALIYRLNWIRKYAEEGRVDDIKKETEKLLDEIENYDLVVPF >NC_017299|2478528:2494617|2487577_2487754_-|WP_014521181.1|DBSCAN-SWA MDNSFKTLIQSINAQLAVLNKNGYSIYDIDNPEYFISGVKYDSDSDEVVFETMEDERK >NC_017299|2478528:2494617|2487184_2487484_-|WP_014521180.1|DBSCAN-SWA MVSQYSIWTKVEKYTWGMEEMKRREVLWQLDSLIDNSKSLITSGDDYDSIWVDDIKALKIAKKAVSKEYKYRFLANLVLAIIVLIIFGSFVVMSYFIYR >NC_017299|2478528:2494617|2480734_2481718_-|WP_014521169.1|DBSCAN-SWA MKILLVNVDSKFNLAIRRMYNYFKDNNEVKMIDLKLDGYPNRKKKIVDATGYDKVYSSNIFEINQDRFEIIGCNNIIYGGIGSVDPNLKLPIEIENTEPFYYEYEDTSYGFITRGCIRNCFFCKVPKYEGKLKVYNSLESIIKHKKVKFLDNNILAYDKHMEVFKYLIENNIRCEFNQGLDFRLINEDNAKLLSELNYMGEYIFAFDNPKYQPLLEKQLKIIKKYIPKEWKVKFYIYQNKDMNIGLLIKRVEWCRKNKCLPYFMRDINCWDSKERNFYIDYAAYCNQPSFFKSMDFETFLYKRHKKIERIKESLKIYNDNLVCKYAI |
27 | Clostridium_phage(26.67%) | integrase | attL 2477081:2477095|attR 2503539:2503553 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_7 |
2694256 : 2737597
Sequences of DBSCAN-SWA_7
Nucleotide sequences of DBSCAN-SWA_7 >NC_017299|2694256:2737597|DBSCAN-SWA AATGTTAAAAGCTATTCGTAAGCATAAGGGAATTAAACAAAAGGATTTAGCTAATAGATTAGGAGTAAGTCAATCTTACTTAAGTAAATTAGAAAATTACTCTATATATGAAGTTACAGTTACTATAGATATTATAAAAAGTTTAGCAATAGAACTTAATATTTGTCCAATTGCTGTGTTTCTGTATTTTTTAAATGTAAAGATATTCTGTCCTTTTAGTTGTGAAAAGACATAATAACTGTAATTTTGAAGAGTATAGTTATCTCTGCTATAAACTTGTCTTATAAAAGTTTATAGGAGGGCTTACTTATGTTTGGGGATAGGTTAAAAGAATTACGGGAAGAAAAAGAATTCACACAAGAGGAACTTGGAAAGTTTTTAAATGTTTCTAGGCAAACCATTTCTGGATATGAATCTGGTGCTATAGAACCAAGTATATCTAATTTAGTTAAAATTGCAAATATATTTAACGTAAGTTTAGATTATTTATTATGTAGAACAAAAGAAAGATACAATTTAAATTTAGAAAATAAAAAGAATAAAGAATTACTACTAGATATAATAAAGGTAATGGAAAAGTATAAATAAAAACTACTAAAGGTTTGAACTGAACCCCATTAAGTAGACACAGTTAAAAAAACTAATGTAAAATCTACTTAATGGGGTGATTTTTATTGGCAAAGAAAACAAAAACATATTCAAAAGAATTAAGACTTAAAGCGGTAAGAATGTATATAGAAGAAGGCCTCGGCAGTACTGCTATTGCTAAAAAACTTGGTGTCACAACTTATAAACAAGTACTACTATGGGTTAGAAGATATAATGAGTTAGGATTAGATGGTTTAGAAGAACGTCGTGGAAAGTCCCAGGGAATCTTAAAGGGAAGACCACAAAAATCTAACTTATCTTTAGAAGAAGAAAATTTCAAACTTAGAGCTGAGGTAGAGTACTTAAAAAAATTAATGCAGATAGGAAGGGTGTGATAAGAGCACAAGATAAATTTGCTACTATTAATAAATTAACACATAAATATTCAATAAAATTAACTTTGTGAACTTGCCGACGTGTCACGTAGTGGATACTATAAATGGTTAAATAAATCTAAGAAACAAATAGATATGGATATTTGTAATAAAATTTTAGAAATATATAATACAAGTAAATTAGTGTATGGTTATAGGCGGGTAAAAGTTGCTCTGCGCCGTAAATATAATATGATAGTAAATCATAAGAAAGTTAGGCGTCTTATGAGGCTATTAGGAATTCAATCAATTATAAGAAAAAAGAAATTTAAGTATAGTACTCCTAAAAATTTAATTCAAGATAAATACTGAGGATAATATTCTTAATAGAGATTTCAGTACAACTGGTATGTATCAGAAATGGGTAACAGATATAACTTACTTATACTATGGTAAATCACATAATAGAGCCTATCTTTCTAGCAATAATGGATTTACATAATAATGAAATAATTTCATATAAATTAAGTATTTCCTTAGGAATAGAATTCGTAAGAGATACTCTTATTGAAGCTTTTTCTGGGAAAAAAGCCAACGATCTGAGAAAACTAATCATTCATAGCGATCAAGGAGTTCATTATAGATCATTAATATATAAAAACCTTATTAAGGAAATAAAATTACTCAAAGTATGTCTAGGAAAGGAAATTGCTACGATAATGCATGCATTGAAAACTTCTTTGGCCATATTAAATCGGAATTGATTTAATCCAAAATCATTTTAATACAAGAGAAGAACTGTTTAAAGCTGTTTCTGAATATATTTATTGGTATAACAATGAAAGATTCCAGACTGTGTTAAAAAACCGCACTCCAATAGAAGCACGAAGTGCGGCTTAGAAATAAGTAGTCTTTCTTAAAAATGTCTTACTTTTTTGGGCTCAGTTCAGGTTAGCCCTCTAGAGTTTTTTTGTGCTTAATTTATTTTTACCAATTTAATAACTTTATTGTTTTTAGGGTTACTTAAATAAAGAAACTTTTCTCCCTTTTCTACTTTATTTAATTCAACCCAAACAGGTTTTGCCTTATCTAGACAATACATATAGTATCCGTTTTCTTTTCCATTGTCCTCTGCCGCTTCAACTGCATTGGCTATACCAACAAATCTAGTTGAAGCTCCTATAACTAATCCTATTAATAAACTTATAACCATCTTTTTCATTTTTAAATCTCCTCTTCTATTCTTGTTTTAATAAGTCTTCTCTTTCTTTAATTAGTTCTTTTAATTCTTTTAAGTCTTCCGTAGTTGCTTGTTTTTTTATAAATCCCCTTGATGTGGATCTATTTCTTAAATACCTAGTTCTTTCCCTATTCTTTTCCTGCCATTTCTTATTAGCTTCTGTCTGTAAATTTTTATTTTCGTCCATTAATATCACCTTTCCAATTAAAATAATGATTTAACTGCAAATACTAATAGAGCTATAGCACCAATCAATTTTACGATATTAAATATTAAACTTAATGTTTCTTTGTAAATATCTCTCATTTGCTTTGAAGATGGTTATATGATATATTTTATTTAAGGGAGGTTTAACCCTCCCCTTGGGTTAGAATAGGCTTTCTATTACCATCTTAACGACGGCTAATAGAGTACCTATTTCAAGTATGAGTTCAATAAGTGCTGACACCACTTTTTTTGAACTCTTTTATTTTTTCTTCCATCTTCACTCCCTCACCTCCTAATTATATTATACTATCGATAGTATAATAAATCAATACCTTTTTTATGAAATATTTATATAAATCATAATAATTTTTCCAATAAAAAAGGTACTTCCATTACAGAAGTACCTTCAAAAATTTAATATTTTATATATTTTTCATATATATAACCCCCATGTGGTGGATAATAAATATGTATCCAATCTCCTTCTTTTCTATACAATCTAACCTTTGCCCCATTTACCAATGTTCCTAATATTTTAGAAGATGTAGATTTCTTTTCTCTTACATTTACACCACTTGGTGTATTTATAGTACCTGTTTTACCATCTAAATTAGTCCATCCATTATTATCAGTAGATGGTTTGCTTGGTGTTACATTTGAAGATGTACCTAAAACACCATTTACTATTGCTTTAGCAATTCCACTCATTCCATATTTATTAAGTATGGCTACATCTCCAGAACTATCTATAAAACATACTTCTATATAAATTGTTTTGGCTTTAGTTCTTTTAATTAGTGCTAAAGGCTGTTCTTTAATTCCTCTATTTCTAAAACCTAGTTTATTTAATTCTTTTAATACTCTATCTGCCTCTATTAAATACTTACCATTATAAGTATATACTTCTGATCCATATCCACCTACTGTTGTATTAAAATGTATACAAATATTTAAATCTGCATCTACTGAATTACATAAGGCCACTTGTTTATTTAAGCTTTCTTGTAATGTAGGCGCATAATCAACTCTACATATATTAGTACTATGTCCTCTATTTCTTAATTCTTTATCTATTTCTCCTACTAATTGCCTTGTTAATACCTCTTCTTTTAATCCATTTATTCCTCTGGTTCCTATATCTCCACCGCTTAATGTGTGTCCTGGATTCAAATTATATAGCATATTAAAATTACCTCCTCTAAATTTAATAAAAAAAGAACAGGTCTATTCCTGCTCTTTACTTTCCTTTACCGCTTGCCTAGCTGAACTTTGTCCAAAGTAAAACCCTATTATTAATGTAAATACACTCAAAAATTCTGTACTTGATAAGTTTCCTTTTGTACTTAAAATGCAAAATACTATAGTAGTTAATAATGCTATAATCTTTTTTATCTGTAAGAATTGTTCTAGAAATTTCATTTAGACACCTACCTTTCTATTTAAATAAATTGTGCTGAATTGCATAAAAAAAAGAAGCTTACTAAAGCTCCTACTGATAATCCTATATACCATTTTAAAACAGATACAAGTTGCTTTAATTGATCGCAAAGATTCTCAATTTTAGCATCTGTCCTGGATTGACTTTGTTCTATTTTATCTATTCTTTCCGAATGATTATTAAGACGTTTTTCATGTATTTCTATTTGATGACTGATTAATTCTTCATTCATGTTGCACCTCCGATTGTAAATAATAAGAGTTTGGATAACACCAAACTCTTATTATGATTTTATTTAAATATGTTTTAATAAAGTTGTGTTACATTTACTACATCTATGAACTATTACATCATGGTCCGTTTTGATAATATCTATATTATGTTCCAGCATATAATCATCATGATTTTCATAATAAGAATCACAATAAAATTCTTTATCTATTTCACTTTCTACAAATTCCATACAAATATAACACCATTCTTTATTATCATTTTTAGAAATTATTAAATCTTCACTACTATATACTGATTTTAAGTCTTTATCTCTAGCAGCTCTTATCAATAAGGCTTGAATATATTTTCTTTCATCCAAGTTCAGATTTTTCTTTAAAATAGTTCTTAATGCTTTTATAAGGTCATTTTTATTAGCTATTATAAAATAATCTTCTACAGTTTTTATTTTTTTCAAACAATATTGAGAACAAAAAAAATCTCACATCGTATATTCCTGTAGAATTAGATAGCGTAGCTATTATAAATTTATTATTTTGTATAGGTCTGCCACACCCTTTACAAAAATCAAGTACTTCCATATAACCCCTCCCTAATTATAATAATACCATAAAGTAATAATATAACTAAGAACCATTTATATATTTAAACACTATTTTAAGCAAAATAAAAAGACCTATATGGTCCATTACTTTGCCTTTATAAAATTATTTATGTCACCTTATTTTATCTATTGTGACTTAAACTTCTGGTGTATTTTGGAGTATATAATCCTCAATAGCTTTTCTATAATCTGTATTTGTTACATCATCTAAAATATAAGTTTTTTGTGTTTTGGGATTTAACCCATTATTTGTTATTCTCTCTGCACATATTCTTACTATTACCATATTAACTTCCATTATAAAATACCTCCATCTAAATTATTGTCTGCTTGAAGCATTAATTGATTTTCTAATTCTTGCTTTTCTCTTTTAAGTTTCTCTTCATTGGTTTCTACACGCTCCATATATTGTGTTATAACAATTAAATCTTTTAAATCTTTTAAATCTGTAGTTTCTTTATTCTTTGTTACATCTATATGATATTCTGCTGCTTCTTTAAAATTATTTTCATTATAATCGTAAGGTAAGTTTACAACACCTACTTCATTTGGTCTTAATTCCTTAATCATTTTATCGGTTAAACCACTATCGAATCTTTCTTGTATACAACCATTTAAAATTTTACCTGTTTTTTTATTATAAATTAACATTTTCCCTAGATACAAAATAATCACTCCTCTATAGCTATAGCTATCCATTTTAATCTAGAAGGTTTATCATATAAACGATCAAATATAGTAAACGAATTATTGGTAACTTCAATAGAGCCAATATCATAAGACAAACGATGCAAAATAGGAAAATCATGAGGGTTACCGTTCATACCATTCCAATGACCATATGTTCCCCATCGATTAATATTTTCTTCAAAGTTAACCTTGCTACCTGAATATATAAAAATCATTGGGTTTATATCAGATGATCCAATATAGCCATTTAAGCCATTTACATAGACAAAGTCTGGTCTAAAAGATAATCCTGAAACTGTTGCAGTACGTTCACCATTCTGGCGATTAAGTGTCCCCATTGCATATTTTAATCCTGTATTTATATTTAATATCTTATTGATTAAATTGCTTAAACCTTCTGTACTACTCGCACTTACTTTTTTGCTACTTAAATTACTAGCAAAAGTATTTTTTAATGTTTGTATTTTATCTCTTTGCTGCTGGAAAGTATCTGTAGCCAATAATGGATTTCCAACAACATCAGATATTAATTTTTTCCCATTACTGGCAGAGATAAAAAGCTCATTTATAGCTCCTGTGATTGTTTTGTCTTTAGTTAATCTTTTATTATCTGTCGTAATATCATCCAAATCCGACTTAATATTGGTTATATTTTCTTCATTTTTTGTTATTCTTTTGCCTAAATCGTCCATACTACTAGTTATTATTTCTATATCTTTTTTTGTGGCTAGTATAACTGTTGGATCTACTTTTAAAGTTACACTAGATGTATTACTTACTTCTAAAATTGTTCTTATAAGTATATCTTTACTACTTCCATCTTGTGTTAGTGGTTTATATGTTTCTGGATATTTAGCAATAGCTACAACATTATCTTCATCATCCAGTATTGCGGCTTCTCTTATCATAAACCCACCAACATTGCTAGGCAATAGTACCTCTATAATTATCCAATTGGGGTTATTTTCATCTATCGAAATAGAATTTATATTTCCCTCCCATACCTTATGTTTAAGCTCTGTCTGGTCTTCTGTTGGGTTATAATAAGTTCCGTTACTGTCTCCAACTTGTAACTTACAAAAATTAACCTTAGTTCCTAGCGCTGTTGAATTAGCTATTTTTGCTTTACCTATTTTAGTTAGTATTGTATAAAATTGTTCTGCCATTAATTAAGCCTCCTTTCTGGGGTATATTGTTATATTTTCTACTCCTGTATTGCTACCCATAGCTATATTAACTTTGCCCTTAGATGTTATATCTTTAGGCATCCATGGATAAACAGTTATTTCCTCACCACTTGTTATAGCACTAGCATAATAAATACTAGTACTTATTTTCTGGACTAAAGTAGAACTTAACATCATATTACATGGAATTATATATCTAAAATTGTCTATTATTTCATTAAACATACTCCAATCAAAAGTGCTTATTTCCACTTTTAATATATATTCATCATTAAGTACTTCAACTTTATAATTACCTTCACCAAATAAAGTTTTTAATTTATACTCCAAAGACCTATGAGTTATAGGCATCTTATCCATTTTTCTATTTTTAATTCTTAGCTTTCTAAACTCTAATGTATCATTTACTAAATCAGCTCTAATTTTGAATAGTGTTTCTCTATGCTTTATTCCATACTCTGTTGCTGTGTCAATAAAATTTTCTTTTAAGATTCTTTGCTGGCCTTTTTCAATTAATTCTAACTCTATATTTTCAGTAGCCATTATATTTTTAAATTCTTCTATATCAGATATTTGTGGTGGTAAAAAATCAATTAATTTCTTTTTCACTTAATACCACCTCTTTAAACATTGGAACTTCTTCAGTTCCTAACGTTAAATTTTCCTCTTTATCATTTATCTTAGTATTAAATAAATCGGCCACACCTTCCACATTTAAAATTCTGGCTTCAATTTGACTAATTCTAACTATAGTATTATCCTCTTCATGCCATTGTTTTCTAAGTTGTTTCAGATATTCATTTATAATTTTTTTAATATCTTCTTGAACTTGGCCAATAGTAAGTCCTCTCTTTAAAAGTATGTTTGTTTCTATAGTTATCTCTATATCTTTAGCACCTAATACAGTAACAGCATGACCTACTGGAGCAACACCGAAACCTTTGCCTTTATTTTGTACTGGATCTAAAATAGTTTGTACCTTATCTATTAATTCTGTTGTAGGAACACTATAATCACTATCCAAAAATACTATTTTTACAGTTCCACCACCATTCCATATAGGAAACACCTTTACGGTTCCAACACCTTCAATGGCCCTAGTATTAATTTTATAATCTGCTATATTACCTCCATAAGGTTTCTCATTTAAATGCTCTATATATCTATCATATAGACTCTCGTTACTTTCAACATCTTCTCCTGGCATAATAAGTTCTCCTAATGTAGCAATAGAAAGTTCTTCAATATATTCAATTGGTATTAATGGTCCTATTATAGAGTTTCCCTCTATACCTGTTGTTTCACATTGCATTTTATATAAACCAGTAGAAATTTTTTCTACTGCAATAAAATTAAAATCTTCTATAGAAAATCTACTATTCAAAGGAATGTCTATTAATTCATTTTCTTCGTTATAAAAGTATCCTTTTTTAATTGCATAAGTTGCTTTTTCTCTTTTAAGGCCTTCCTCTGCAACTCTTAAATCCAAAAGTTCATCTGGCATATCAGGGCTTGCAAAAGTACATTTTAAAAAATAATCCATATCTGAATACATTTTAGCAACTTCTTGAGCTGCTGGTGCTAAAGCATTATAAATTATAGAACCTTCTCTTTTGTCTAAATCATTAGATATTTTATTCATCATTCTATCTAAAATCACTTCTTCGGTTTGATTTTCAAACAACTACTATCTCACCACACTTTCAGTAAATTCTCCATAAATAGAAAAGACAGTGAATTCTACAAAAACACTGTCTCCATTGTATTTAAATATAAAATTATCAACATTATTAATCCTATCATCTTGGCTTAAAGCTTCTTTTATTCTACGTTTAAATTCACTTTCCGCTATTGATTTATCCTTTCCAATAACTCCATCAAGTTCACTTCCATAGTTCCAACTATAGATAAGATACTCATATCTTTCTGTATTTAAGATTAATCTTATTGCTTGTTTTAAAGCTTCTTTACCATCTATAAATCCCACTATTCTATTATCTTTAATTTTATAAGTCTTTGTTGGTTCGATTATTTCTTTCATTTCTAGATCATCAGATATAACTGCTCCTTGTGGTAATATACTAACATCACTCACACCTACACCACCTTATCTAAGATTACATACTGTTGGCCACCTTGAATTCTAAGCAATAAAACCTTATCTCCTTGTTTTAAACCTTCTCTAATTAATAATTTATCTAAAGATGTATTTAGGTTACTTTCAATAGAATTGTTTATATAAGTATGAGTATGTTTTAAATCTATTTCATATCTAATTAAACTTTCAGGAATAATAAAAAAATCTCTATCTAATATAAGCTTTTGATCCACCTTTATTTTTAAATACTCTGCATTTATAACTTCACCAAAAGTTATTTCTACAGGTTTGCCAGCTCCTACTGCTCCCATACTTGCTTTTTTAATTGTATCTATCATTCCCATATCTACACCACCTTTAAATCAAAGTCCATTACTAAATTGCCTTTTTGAAACTTATGTGTAGCTTCTTCTATAAGGTAATACTGTTTTATTCCCTTTTCTTTTATATCCACATACACACCACTACCAGCTCTTAATTTTAAATCCGCTGCTATATCTGTGCTAATAACATCTTTTAATTTTAAAGTTTTAGTTTCTCTATTTTTAAGCTTTAGTGCAGCGTTAACCATTTCTTGAATTTGTGCCTTATTCATTTTCTCATCTACTTTTTTAAAATACTGCAATCTTCCCCACTTAGCTATATTCCTACTATCTTGTGCTATATAAACATCTCTACCTTTAGTATCTTTATTATCTCTTACTATTTTAACTCTATTATAAGTATCACTATCTATACTATTTTTCCAATCATAATCTCCTAAGTTACTATCGTCACTAATGACTACAGGTTGCCTCATGTTATTTATATTTCTTAAGTTTAAATATCCAAAATCATCATATAATGTATAGGTTCTTTTATTACTCATTAAAGTTTTCTCTAAAGAACTATATATTATGTCTAATAATTTCTTATCATCCTCAAGAAGTTGAGGTATAACATACCCTGTATCTTCTATAGTTCCTACCCTCAATCCTATATCTTTAGCAATTTGTATTAAGATTTGGCTTGCTTTTTTATTTTTAAATACATAAGTATCATTAAACAGTAAATATCTCAATTGATCATAAGCAGTTACTTTTATAATTGGATTTTTATTTCCTCCATTTTCAAATGTATATCCATAAAACACTGGATTACCATCTACTTTAAAGCTTATTACATCACCATTATTTATAGTAATTTGCTTATCTTTTAATATTTCAAAATCCAAACTAGAAGGCTTATCTTTTCTTTTAGTTTTCCAGGTAACTTCACTTGTTAATTCAGATATATCAAATACATTCCCATCTTTATTATCCAGTAATAATTGTATATTCAACCTATCACCACCTATGGAAGCCTTAAAACTTGACCTGCATGTATTACGTTAGGATCTTTAATCTTATCTTTATTTAAATCATGAATTTGTGGCCATTTGTTGCCATTTCCTAAATATCTTTTAGCTATATGCCATAATGTATCATTATCAGTAACGGTATGTGTTTTAGGCTTATTAGTATTACTTGGTCTTGCAGCCTTGGAATTCGTTATTACTTTTTTCACAGATTGATTAGTGGCTGCAGTTTTTGGTGTTACTATAACTACTTTTTTAGCAGCATAGTTTTTATATCTTTTAAGTTCTATAGAATAATGTACGTCTCCAACTTCTCCGCCTTCTTCGCTTGGTTTAAAATTCTCTATAGTAAATAAATCATTAATTTCTAAAGGACTGCCTGTAAATATAAATCTTATCTTTTGCTTTTTATCTCTCCATTCTCTAATCTTTGCAATATAAAAGCTCGGTTCAAATAATTGTTCCGAGCTTACATAAGGACCTTTATGCTTGGGAAAGAAACTTTCAAAGCTTATTTCCATCAACTTAGGTTTATTTATTGTATTAATTTCACCTAAATTAATTATATCGTATGTTTTATTATTTCCATCTTCATCAAATTCAATTTTCTCTGGGAGTACAGGGAGTACGAAGCCTTCTTCACCATTATTAATTCCTAAATATATTTTGTAATCCATTTAAGCATATACCCCCTCCGCACTATTGAGTAATTCATTTTCCATGTAGTTCTCTATCTTAGATATTATTTTGTTTATGTCTGCTTCTTCTTTAATATCTCCGGTAGTAACTTGCACTGTTGGAGTTAAAGTTACAAAGTTTTGTATGCTTTCCATTTCTGCTAAATCTCTCATCATTTCTAAGTGTTCATTGCTAATGTCTATTTTATCGTCTATATTTTTAAGATGATTGTTAGCATCTTTCAATCCTTTGTTTCCACTTGGGGATCTACCACCTTTATTTTTACCATCGTCTCCTGCAGTTCCTAATGTTCCTGGTCCTTGTGCTTTATTCCATGCCGCCATATCTGGCATTTTACCCATGTCTGGAATATTACCCTTATTAAATATATTTCCTAAATCAAATTTATCACCTATGTTTTTACCAACGCCATACCCTGAATCATATGCCTTACCATATTCAAACCTATCTAGATGCATTGCAGAAGAATCCATCTTTTGAAATTGAATTTTAGGTTTACCAACTAATTTATCAACTGCACCTTGAAGTCCATTTTGCCAATTACCTACTGCATTGGCAAGATTAGAGCCGAATATCGTATCTATAGCAGATGCTATACTTTTAAGTATCCCTAAAACTTCATCTGCCATTGCTGCAAATAGCCTAATTATAGAACCTATAGGATCATTAAATACATTAGCGAAGAACTCCGCAAATGCAGTAAAATGATTATAAAACAAGGCTATAATATCAACAACTAAATTATAAAGTGTTACGAATAGATTTCCTATAAATGCAAGTGCTACCATAAATGATCCTGCAATAATACCTGTTGCTGAAACACTTGTGCCTGCAAAATGATTTACCGCCGCTACTGCTCCATAGAATAAAGCTATTAATATAATTATTGCAATAATAATCCATGTTAAAGGGCAGGCTAATAATGCTGCATTTAATCCATCTTGAGCTATTATTAAGGCAAGTATAGCGGCTGTTTCTGCCCAAGACGCAATAGTGTGGGCAATCTTAGCAATAGTAGTTTGTATAGTTGTTAACCATGCAATTCCCATTGTCGCATTATAAGCTATCATTGCAAATACAATTCCCCAAATGATAGGACTAATTATGCTCCAATTATCAATAAATGTTTGACTTAATGATGTAATAATATCCATAGCTTCCATCGTTAAATTCACAATTATATCTAATCCTACGCTTATGCCATTAAAAAAACCTTCAAAACTTCCATTTTTAAATCCTTCATTTATTCTACTAAGCAAAGGTTTTAAAACTTCTAACGCGGTTTCACTTGCCTGTGCAAACGCAGTTTCTATGTTTGATTTAAGGTTATTTAATTGTGCTACGGCAGATTGATTAAATTCTTCCAAAGCTTTATCACTGGCACCTTTTTTAGCTAATAATTCATCAAACTTGCTTATAAACTCATCCATACTTTTAGATGCCTTTAATATTTCTGCATCAGCTTTACCAAATCCAAATCTGGATTTTAAAGACATAAAGTCTCCTCCCAAAGCTTCTTTTAATGCAAATCCTGCACCTTCTAATCCCTGTGTCGGATCTAAGAACGCTAATTTTTCAGCTGTCTTATTTAAGTCCATAAGCTTATCTGTATTTTTTGTAAACTGTATAAATGATCGTGTTATGGTATTAAACTCTTTTAATCCATATACACTCTCATTTGCATATTTATTTAAGCTTCCAAAGAAAGCTTTTCCTACGTCTTTGTTCCCAAGCATACCACTTATGGTAATTAATTGTTGTTCTAGCCTTGCTCCTCCACCTATAGTTAAATCTATTCCTTTTTTAACAGCCTGGAACCCTAAATAAGCACCTATGAGATTTTTCACTTTACTTGTTAATCCATTTGCTTCATTAGACCCTTTATTAAATGAATTATTTAGTTGTTCTTGACTATTTCTAGATTTATCTTGTGTATTAGCTAATTCTTGTAACCCAGCAGAAGCTCTTTGAATTGCTCCCCTTGCAGTATTTAAAGAATTAGTTATTCTTATGTCTTTATTTGCAGCATTATTCATTTGGTCCATAGCACTTATAGTTAAATTTAAAGCTTGAGTAACTTGTTGGAGAGGTCTCGTCATTTGATCAAACATTTTGAGTGCAGTAGATACTGTTGCCATCTATTCACCCCGCTTTCAAACAATAATAAAAGCACCTACATTAAAGTAAGTGCTTTAAGTTCTTATTTATATATAGAAATAATTTTATTTTATCTAACAACGTATTTAAATTCTTTATTATTTGCGTTTATTAAAACAACTAATGATTTATTATCTTTCTCTATTTCTTCTGGAACTTCAGCTATAAAGTGAATCATTCCCTTTTTCAATGGTTCTATTGGTGTTATATTTGTATAAGTAAAATTTGTACCCTCATCTTTCTCTATTGCTGAAAATGTCTTGTACTCATATTTATTATCATAAATAACTTTAACTGATAAAAACTCATCTGACCTTTTCCCTTCTGTCAAAAGGCTTTTTACATCTATTACCGTATCGAAATAAACTGTTCCTGGTTCTTTTGCTTCATAATAAGTATACATATTCTTAGGATTAGGTGGATTTATTCTTTTACCAAATTTAGTATCAATAACTGTAAATTCACAATAATCTTTTATTTCATTTACTTTCCCTTTATCGATGATGTCTTTCTTATCATCCTTTTTACTTGTCTGAGCTTTTTTCTCTGTGTTATTTTTAGAAGCTGTTTCTGTAGAAACTTCTTGCCCACATCCGCTCATTGTTAATAAAAATACTCCAATAAAAATAGTGCTTAATATTTTTTTCATATGATTACAACCCCTTTATTAAAAATCACTTTAATAATAACAAATATTGGGGTTTGTTTCAATATTATCTTTTTCTTTTAGCTTTATCCACTTGTTTCTTTTCATTCTCTATATGCAAATCAATACTAGCGTATACGAAAGCTCTTTCTCCCCTTGACATTCTAACAAAAGTACTAGGAAGAATTTTTAATCGGTGGAGGGCATAGTGAGCATAATTAGCTTCACCATCCCCTCCCTTGATTAGTTTTTTGCTTCTTCTACTAACTCCTGTATACCTTTATCATATCCATTTATTTCACTTACAACGCTACCCCATTCCATGTATTCACCATCACTCATTTTAGACTTCATAGCCTTAAGTAATTGTTCAGCTCCCATAACACCCCAAGCCTTTTGTAGTTCTGCATTTTTTAAATCAGGATATGTTGTAGTCTCTATTATCTGATTAGCTATAAATTTATCTTGGTCAGTTTCACTCATTTTTTGACCTTTAACTATTGTTATCTTTTTACACTTCTTTCTAAGTTCGTCACCTTTATCAGCACTTATCGGTTTAAATTTCATTTTTTTCTTTTTGCCACCTATAGTTATTTCTCTTTCTATTTCTTCTACTTCCTCAAAGCTATCCATTAAAAAATCTTCAAAATTATTCATTATATACTCCTCCTATTAACCTAATACTGGTTTTCCAAATTTATCTAATAAATCCACGTCATCAAACGTGAATCCCATATCTTCTTCAAGTACCTCAGATTCTACATCAAACATTGCCATGGAAACTTCATCTAAATTACAATCTTTTAAAACTGTAGTTTGTTTCCCTATGCTACTTGTTGGATCTTCATTTGTAACACTCATATCAAAATACGTATCTACTCCAGTTTTCATATACTTAATCATTAATTCTCTAAACAAAGAAGTCACATAATATACTGTCAATGTACCAGAACCACTCCAACCAGCTGCTTTATGTTGTTCTCCTCTTTTTCCTAAAGTTTTCACTTCTGTTTTTTTCTTTTCTACTTTTGATTCTAATTTTTTAGCATAGAATAGTTCTTCATTTCTACCATCTACTGTTAAAAATGCTCTAGCCTCTTGTCCACTTATTGTATCTCCTGCTTTAAGAAATCCCATTTACTATTCCACCTCCACATCCATATATAACTTTTCCATAGCATCTATTGGTTGTACCCCCATTCTAGCTACTACAGAATCTTTATCTTGTCCTCTTTTAATTTCAACATCTTCTGGTACAACATTTTCAAGTGCACCAATTCCTTGTAGGCTTTCTAAAAATTTAATTACATCCTTTTTATATAAATTTCTTCCATCTTCCCCATTATCACCTTTACCAATATAATTGGTTTCCCACAATAACCTACTACCATTATTTACTTCAAAAAGTGTCCTTATAACTCTATTTTTTCTATAATCTTTTCTTTTATCTTCTGTAAAACTTTTAAATGTATTAATATCCTGTTCTATTACTACTTTTCTATTACTAATAGTAAAGACTATTTCTCCGTTTAATAAAGCTTCTTCTATTTCCCTGCTAGTGTATTTAACATCTACATCAATAGCACCTGGATATTCTAAATAAGTGTTTGATTGATTTACATTTGCTCCGGCAGTAGCTCCAGTTACAAATGCAATTGCTTGATTGGATTTTATTACTGTATTATCACTTAAAATTACACCATTCTTTACGCTAATAACATTTTCAGTATCAGCTTCTGGATAATTTTCTAATACTACTTGCACTTGTCTACCATCTTCTTTAAGTCTTTTTATAAATGTAGTTGCTACTGCTTTTATAGTAGGATCTTTAGTTGGAATACCAATAGCATGAAATTCATAAGGTTCAATAGTTGACAAATAATCTGTATAACATTGATTAGTAACAGTACCATCAACTCCACCTTTAAGCGGTAATCCAGCAGTAGTTTTCAATTCTCCAGTTCCTTTGAAATCAACATAATCATTAGACTTCAAATCTTCTATATTTTTAACTAATTGTTTATCCACTTTATTACCTTCAAATATAGTTATAACTTCAAAACTTCCTACAAAATCTATGCTGTTTTGAATCACTACAGTAATATTATTTCCTTTTGTTCCAGTGCATTTAGCATTTATGGTTAATCCTTCTAATGCAGCAGTGGCTTTAGTACCCTCATTAAGTCTATATAATAAAAGTGTCTTAGCTTTCTTTAATACTTCTCTAATAAGTAATGCACTTTCATCAGCTATATTTATACCTAATACTTTAGATAAATCATCATCAGCGTGTATTGTTAATACTTCCTTTTCTGGTCCCCAAGGTAACTCTAATGGTAAAGTTGCAATTCCTCTTTCACCTATTGGTGTTTGTCCTTGTTTTTTAGACTTAAAATTTATATAAGCCCCTGGTCTAATTTTATTTTGTCTTTCCCAAGTTCCACCAGCCATACTATTTCACCTCTTTCTTATTAAACTCTTCTAATATTTTTTTAACTTCATCCATACTATATTGTTCATCTTTTAATAAAGCTTTAAGTACATCTATTTCTATTACTGTAAACTGTTTTGAATTTACTATTTGTTCTTTGGTAAATTTAATTTCTTGTTCTTTATCTGCCATTTAAATATACCTCCTGTTTCAATTTATTCATTTTAGGAGCTTTTTCAATTTCCTTAATCACATGATAATTAAATTGCAACATGAAGTGTAAAACTCCATCTATAACCTCATGTGTCATTTTATTAGATCTATATAAACTATTATTTACTTTTACATATTCAAGCACCTCATAAAGCTTATCAACCATATCATTGCAATCATCATTCAAATCCTCTTTATCACTAAAATAATGAATGTTGAATGATATATTTTTCTTATACCTAACGTTGATCTCTTTATCTTGACCTGAACTTAAAACCTTAATAAAAAAACAGGGCTCTTCAAAACCTTGCTTAATCTCTTCACCATATATATTTATGTTAGGAAATTCTTTATCCAATGTTTGGTTAATTCCTATCCTTAAATCATTTATATTTGTCATTTTACAACCTACCATTAAGTATTTGATTTAATAATTCCACTTGTTTTCTTTCTAAAAACTTAGGCAACTGCCTTTCTATTTCTGCCATAGATATGGTTGCCATGAATCTACCTTCAACCCAGCCTTTATGGTTTTTAGTTCTATGTCCATATTCCGCATAACTTGCATATTCAGTATTATTAAATATTTCAACTATATATGCATCACCTTGCTTTACTACATTTCCTACTTGCCAGTTACGTCTTAAATGTCCTCCTATTTTAGAGCTACTAGTTGTAAAACTTACCTCTTTACCATCCTTTGTTGTAAAAGATACTTGATTACTATAAACACCTACTGGAGTTCTTTTTTTAATCTTTCTTTCAGCTCTAAATGCCATCTCCAACAAAAATTCTCTTATCCATCTTTCAATTACTCTTTCATCTAAAGCTTTTTGAAAGCTCTTGGCCATATTTTTAAAATCAGAGTAATCAAAACTAGCTAATCTAGCCATTAAGCTTTATCCTTTTTATTTAAAATGACTTCCTGGTGTGTATAATAAAAAAATCCTTCTCCAGCTTTATATTTAGCTTTTACATCCAATGCATTAGTAACTTCTATTTCATCACCTTGTTTGATTTCAACTTCAGGAGCTATAAAAAGCTTGAGCTCATAGTTTATATTATTTGTTGTATCAGTTTGATTATTTTTACTTAGACTTTGTTTTGATACTTTACAAGATTGTTTTTCATGCTTAGGAATTGGATTAATACCTGTTTTAGTTTCTTTAGTTACTGAATCTTTATATTTTTCATATCTATAAATATTACAAGTACAATCATACAGGCTTTCAATAGCTTTTTTTTGCTTGTTTTCTAGCCTTTTCTATACCTTTAAGCATATTACCAAACCAACTTTCTATATTTATTTAGTTGTGCTTTATAATCCTTTATTAAGCTATCTTTAAATTCAGCAATAGAACTTCTATAACTTACAGAAGTGTCTCCTTCACTTATAGAAGAAATAGAACCTAAGGTACTTTCTTCTTCTCCTAGGTTCTCATTTCTATACATATCCATAGCCATTTTTAAAATCGTAGTATTTAAAGCGTCTGGTATCTCTTTAATGTGGCAATATCCTTTTATTATTTGTTCTACATCTTCTAGTGCAAATTCCAATAAAAAATCCTTAGAATCATCATCTAAGGCTATACCTAAAAGTTTCTTTAATTTTTCTAACGGAGTCATTAAACTCATATCCAATCTATTAACCTCTTGAAATAATTCTAGCTATTGCAATAGCTTTATGATCTATATATTGTTTAGCACTTCCTGACCCACCATCATTAACAAGCTCCCAGTTAGCACCATTAGCAAGTTCTTCATCTGTTGGTGATAATGTTATTTGGGATTTCTTTATATAAGAAATTCCATAAGGAGCAAAACACTTTCTTTGTCTAGAATAAAGCGTATCTTGTCCTCCGTTAGTTTTTGGATCTCTTGACATTTCATACGGAACTTTAGCACCAATATTCTCATAGTCAAAAGCTCCATCACCTAATACATAAGTTGTATATTTTGTATATGCTTCTATATCACCTGTTTTAGGAACTTCTTCTACTGGCATTGAATCATCAATTAAAACAGTTCTTCCATTCCATGTTGCAAGTTGTAATTCCCTTTCAATACCTGTTTCATCTGTATATTTAAGATATGATAGTAATTTAAGGTTCTCTAAATTAGTAGCAACCGCACTATGCATAATAGCTAGGGTAAATTTAGACTTATTGTCACCACTAGACTTCTGAATAGCTGTATTTAATGTAGTTGGTCCCACAACATTTTTATCATCTGCTAATGTTGTTATATCTAATGTATGGTTATTAACAAACTCTAAATTTTTAGCACCTGTCATTGAGTATATACCCTTTAATATTGATAATAACGTACCTTGATCTATATCATCCCAATATTCTCCTACTTGGTTTCCTACATTATCCATGAAATTTACTCCACCAGTTATATCTTCTGAAAAATCACTTTCTACCCATGCTTTAGCTCTACCAACAACTACAACACCTCTTTCAAATGTAGTTGTGCTTGTAGCCGTAATATCTGTTTGTCCATCATAGTTTAATGCTGCTCCGTCAATTCTTCCATACATAGGTAATACTGCATATGCAGTTCCTGTTTGTGAACTGAAAGCATTTTTAATTTCTGCATTTCCTTTTAATGCTCTTGATTTTAATAATTCATTTTTCTTTAATTTTGGTGCTCTTTCTACATAAGCTCCAAATGCTTGTGGATTAAAACTTTTTGAATCAAATTTTGCCATATTATATTCCCTCTTTCTTTATTTAAATTTGTGCATTAGGATTTTCTTCTAGATAGTTGCATAATTCAGTATAAGACATTTTACTTGTATCTTTTGGTACTGGATCTTTTATTGAATTATCTGTTGGTTTTATTCCTGAAAATTGTGGTTTTTGTTCTTCAGTAAATAAATAACTATCACTTTTCTTTATTGCCTCTATTTGCTCATTAAGACCTATAAGGCTTTCACCTTCTAATTTAATGCCTTCTAAATTTAAAAGAGCTTTAACAGCCTTTGTATTTCTTACATTGGCACTCTTTAAAGCTCCTTCTAATGCATAATTAAATTGCATATCCTGTATTTTCTTTTCATAGTCTTTAACCTTAGTTTCATAATCAGTAACCTTAGTTTGTAGATCTTCATTATCTTTATTACTTTTCTTTAAATCAGTAATTGTTGTATTGGCAGTTTTAAGTTGCTCATTTAAAGCATTAAATTTATCTTTAGCTACATATATTGAACTATCCACTAAATCAACATCCTTATATTTAGTTTGTAGTTCTTCTGATATTTGAGAATAAGCTTCTCCTAATATTTCATTTAATTTTGGCATATTATTTACTCCTTTCAAAATTATTCTACTAATTCATATGTCTTTTTAAAAATATCTGGTTTACATGGATAAAACTCTCCATTCACCCCTTTAATAATGTAATCACCTTTATTTACAACCATAGTTCCTTCTAGTGTTTTAATTAATAAATTGTCCTCTTCTTCTCTAATAATTCCATTCATGTAAGCTTCATGAAATGACATATCTTCAATCTCAGTAGTATTTACATCTCCTGTATACTGCACAGCTTCTACTATAACTGGCTTCTTTTTATACTTAGCCATTACTATCACCTCTTAACTATTTATTACTAGTTCCCAGAACATCCCTTTCAATTCTATCTTCAACTCTTCTATTTAACCACATAAGGGCTTCTTCAATGTGAGTTAATGCACATGCATTTTCTCTGCTTGAATAAGGACCTTCTTGAAAACCTTGTAATCTATGTCTTACTATTTCTAATAAATCTGTATCTAGTATACCATTGGTTGAACTTCCTTCTTTACGAGGACCTTTTTGAAAATTTATATCTACTAGTACACTGTCTAAAATATCTTTATCTTTTTTACATATCATATAAACATGATTGGATTCACCATTACCTTTTTCATCTAAAACATATACATCATTTAGCTTTCCTTTCTTTTGAATGGTATTTAATTTTTTCATTTATATCATTCCTTTCTTAGCCCTTTAGTCCTATCTTTTTACTGTATAAACATTAATTTTTTCACCTTGTGGTATATGAAATTCATCATTAATTGGTTCTATGTCAATATCATATCCATTACCAATTAATGCTTCTGTTACTATATCGGCAATACGAAAATCTCCGCTAAATTTAAATATAGCTGCTTTTATTCTTTGTACTCCATGAGTTGACACATCATTCATTATTTTCACCTCACTTTCAAAACATTTGGTTATTATTTAGTAACTGTTAATTTTTTTAAAAGATTATCATAGTTTTCTTTAATCATGTCTTCTACAAGATTAAAATACTCCTTATTTGTATTAGGAAAATACTTTTCCAATAGTGCTATAGTTTCTTTATCCCCTTTTGTATATATTGTAGTTAGATTTGCAAATGTTTCTGCTTGTACTTTACCTTTGTCTTTAAAGTATTTTGCAGTATGTCCTCCTGAGCCAGTTAACTTTCCATTTGTAATTCCGACACATATATCAGATAATGATTCGTTCATTTTGCCATTTTGCCGAATATATTTCTTTAAATCATTGCATTCCTCATTGTTTATTAATTTAGCTAACATTCTTTTATCTTTTTTAGTTGCGTCTTTCATATAGTAATAACTAGAACTCATAGGTAAACTATTTTTCATATACTTATCAATATTTCCAACTGAATCTTTAAAGAATTTAAAATCTTCTCCATGACCAGTTTCGTGAAATAATGTTCCTATATACCCATTCCCTAACTTATTTCTTCTATTTATCATTTTGTTGGGTCTTTCCAAAGATATTCCACCAAATAGGTGATAAGAAGCATTTCCCTCTGAATATCTTAACTTATTCATTTGATTTTCATGTACCATTAATACTTTTTCATTACCATTTTTATAATATTGATTCATTTCATTTGTAAACTCATTTATATTTAGTTGCTTGGATACATTTTTAATTGTATTTTGTAAGTTATTTTCTGATTTAATATCATGGCATTTTTTACCGGAGTTATCATTAACATTTTCTTTGTACCATTGCCCATAATTCATATTTCCATCTACATAATAAATCTCACCTTCACTATCTCTGGCAATTCTTTCTTCATCTATAGCATCTGAGAAATAAGGAATTATTGTAGTTCTACAATTAGGATGAAACGGTGGAGCATTAACTCCTATTTCTTTTTCACTAATCTTAAATATCTTACCATCCAATGATCTACATATTTTACTCGTATGTAAGTCTAAAGTAGCAAGTATTTCATATTCTTTAACAACTCCACTTCCAATATAGCTGTTAAAAGTTGATTTAGAAATAATATTAGCACTTTCAGTATTAACAAGTGTCCTTGCTCTATTCTTTGCTACACTCATTCTTTCGGCTATTCTTTTACTTGTTTTATCTATAGAATCTCCTCGAATAAAAGATTGAGTAAGGTTGGTTTGCAACTCTATTATTAACTTTTCTTTATTATTCCATATCCTACTACTATAATTATCTCCATGCCATGGTTCTGTAATTACCTTATTTATTGTATTGGTATCTAACTTAGCAAAATTAATACCTATTCCTAAGCCTTTGTGTACTTCAAAGATATTCCTATAATAAGTATCCTCATATATTCCACTTAAAATATTAGTAGTATCATTTTGTTGTTTAGTATATAAGTTTTCTATTTGGTTTCTCATTTGAGTTTGTAGAGCTTGTAACCTAGTAACTCTTACCTTATAAGATACATTGTTTAATTCTCTTTCCCATTGTAGATTTTTATTATCTTTAGCTTTTCTAGTAAACTCTTTTAAGTCTATCTTAAACTCATGTAGTTCATTTGAATTTAATAGCCTTCTAGCTTCTTGTAAAGATATTTCATTATTCTGCGAAAATCTAGAATAGAATACCTCTATATCTTTTTGTATGCTACTTAAGGCTTCCATATATTCTAAGTGTGTAGATAATATATAATTATCTACTTTTTTAAATTGCTTACCAGCTACAACTTCTGAACGTTTCTTCCAATAGTCTTTACTCCTCATTCTCTTCATCCTCTGGTATTTCTTCTAAAGGAAAATTAGGATACATTAATTCACGTTCTTCTTTCTGTTTTTTTATCTTTTCTAGTTCATCCTTAGTGGCCCAAGGATGGTTAGCTACTATTGTTTCATCACTAATAATACCAACACTATTTTGACAATTATTAATACTATCAGTTTCATTTATAAGGGTATCACGATTGAAGATAAATTCTACATTTTCACCTGTATAATCTCCTTGTCCAGTATTAATTAAATGCTGATTCACAAACCACAATAGATATTCAAGTGATGCCTGGAACTCTGTTTCTATTATGTTGCAATCCATATCTAAATCATTATATAAAAACTTAAGAGCAATACCACTTGGAGAGTTTCCAAACTTATCTGATTGAGTATCTACACCTCTACCAAACTCATAAATATCTTTTCTCGTCTGTTCAATATGAGTTTTATAAGCTTCTACATTAATTTCTAGATTTCTTGTTTCTACTCCACCATCACCAGTAACTTTAACTGCTCGGTAAATGCTCATATTTCTTCTAAACTCTCCTAGGTTCTCACCATCATAATCCTTAAGAACATAAATAGAGTTTGGAAGATCCTCTAAGTTATTGCTATTGTCACTTTTATTTCTGTCATAATCATCTACTAAGGATTTAACAAATTTAATAAGCGGCTGCTCTTCATCATTATATTTGAAATACACAAAAGGCACTTTAGACCAGGTAAATGATTCTTTATTTCCTTTATCATCTACCATACTAAAATGCCCTTCATCTTCTGGAGCTTCAACATCAAGTATTAATTTACCATTATCATTAACATATCTTAATACCTGTTTTGTGTCCCAGTATTCAACTTTTTGCACTGTCTTTTTAGTTTTACCTTCATAGACTATAATCTCATACACTCTTATTAAAGCATCTAATTTAGTATGCTCCGAATCTTTCCATAATGGAATAATCTCTTCACTAGGTAATCTTTTAAATCGTAGTTCACCATCTGAATTATAATAGATTTGAGCCCATGCTACCCCTTTATTAATTGCGTCTTTGCCTAGATTCTTGAGTAATCTCATAAATGACTTATTGAATATATCATCTAATACATTTTTATATGTTTCATTATCAGTTTGTACACTTAAAGGCTTACTTAATAAATATCCTACTTTCTGGTCCGCAAGCTTTCTAACAAATTGATGTACTAGTTTATTATTTGCTAAATTCTTTACTTCTTCTAATTCTCCATCTTCACCTATAGCCATTCTTTTACGTTTAAGTATATCTGTATCACCTTTATAATATCTTTCTCCATCTAACATAAGTTGCCTTGCTTGTGAGCTATTCCATTCTTTTATTTCCTCTTTAATAATTTCTTCTAAGCTCATTACCGAATTAGATCCACTATTGAGTATTTTATCTATAAATATCATCTATAACACCTCCTTAGTCAAATGAAATTGACTTATTCTTTCCTACATTTTCTGCTACACCGGTTGTTGCATCTGGAGCGTCATCATGCTTATTCTTACCTTCACGTTGGTATTTGTTCATTGCCTTATAATATTCTGGCCATTTATCTCTCCAGTTAATTGGGTAATATATATGGTCCATAACCCAAGTGGCGTTTGAAAGTATTCTAGCCTTTTTATTCTTACTTTGATGAAACCACTTAACCTTTGTTTTATTGCTATTGAATTTTTCTTTTAATATTCTTTCTACACTTCTTGCAAAACCACGACCGCCATTATTACTCTCTATGTCTGCTATATTAACTCCATTATCATAAAGCATTTTAGCTGTTGCAGTTTCTGTAACTTCCATAGGCTCCTTAGTATATAAAACATCTAAAACATAAGCTTCTTTGTTATATTCACCATAAACAATACAACATAAATAGTCTGAACCTTCATCAGCAGTATCTATATAAGCCTTAATTCTAGTAAACAGTGGATTACCATTATTATCTTTAGGTATATATTTATATTTCTTAAAGTCACTATATAACCGTCCTTTTAAGTCTATAGGCTCCTGTTGATAGTTAGCGCTGGCTATATCCTCACCCATAGCTTTAACTTTATTTTTATAACTCCTATAACTTAATACTTCAGGACATAACATTTGCTTTTTTTCTTTATCAATTAGGGCTTTCATTGAGATATGTTTAACTTTTATTCCTTGTTCTTTATAATACTCTAATGCTCTACCAGCTAAATCACCACTGGCCCATCTAGTCATTATGATTATTATCTTTCCACCTTCTTCAAGTCTAGATAACATGGTATTAGTAAACCAATCCCAATGCTTTTCTAATACTGCTTCATTGTAAGCTTCTTCAGCGTTTTTAATAAGGTCATCTATAATTAGCAATGAAGCTCCAAATCCTGTAGCTGTACCTGTTGGAGAAGTGGCTAAATAGTTATTATATCCACCTTCTAAGGACCATAGGTTCATAGCTCCATCACCATGTTTTATTCTTACCTCTGGAAAAACATCAGAAAATACTGGTTTGTACTTATCTGCTTTTTCCTCTTGAATGGAGTTCCTTACATTCTTAGAAAACATAGTGGATAAAGTTTCATTGTATGATCCTGTCATTATCTTTCCATTCTGATTATTGCCAAGAACCCATTCAACAAATAGTCCTGCTGTTCTACTCTTTCCATGCCTAGGAGGTTCATTTACTATCATTACTTCTTCATCTGAAGAAAGAAACTCTTGAAATTCATTACATAATTCCACTAAATATTCTCTATCTTGCTTATAAAAGTTTGGCGCCTTTAAATTGCAATAAAAAAAGAACTTACGTCTTGCAAGTTCTATCTTTGCCCCTAATTGTACTAATTCTTTATCCATCTTCTACACCAGCTAGTTTTAATAATTGATCTGTAGTTAAATCTTCAAATGGATTATTAACTTTCATATTACCATTGACTTCTACTTTATCTTTAAACATTCCTAAATGTCTACCTAATAACTCTAAAGCTTTTACCTTATCCGCTGTTTCTACACTAATGCCAAACTTAGTATTTTTAATTGCTGTTATAGCTTTCTTTTCATTAGTTGTAAGGTCTTTCGTTTCTTTTATTTCTACATCTTTATAAAAAACTTCTTCTTCACCTATTTTATTTCCTTGTTCATCATAAACAGGTTTCATATAAGACTTTTTAACTACTTCCGCATAATTAGAACCATTAGATTTAGCTATAGCATAAAGCTCCTTTAAAACAAAGTCTTGAGTTATTTCTGTTCTTTTTTCTCTATCTTTCATTCTTTTATCAATGTACTCTTTAACCTTAGCATTTCTTAGCAATCTATTTCCATTGACCGCTGCTGTTTCATCTTTTTTAATATTTTTATAGGCCGTTTTATATGCTCTAGTGGCATTAAGATCCACTAGATATTCATCACAAAATATTTTCTGTTTTGGTGTTAGCTTCACAATGCCACCTCCTTTTATAAATATTAATTTTATAATACAACCACAATATATAGTATGAGTTGTACATATTATCCACAATACGTTGTGCATAACTTGATTTATTTCTGTCTTAATGCTCCTTTAATTCTTTTATAAGATCTATGATTCATACATTTATCTATATCTCCATAAGTATTTAATTTTAATTCCAATACTTCACATTTTTTATATCTATCACAGGCGGGATTGCCAAATAAACAGGCGCAAATTAAATTTTTACCTTTCCACCTAGTATTAAATTTATATCTCACATATAATCACCACTCCTGCAAATATTATTTCTTAGCCTTTGCTAAGTATGTAAAAAAGCACCCGTTAAGGTGCTCATCAGTACATATACACATTTAAGTAGGAGGATTTTCACCTCCTTATATTTTTCTACGATATTATTATACTACATATAATCTTTAATTGTATGTAGTATAAACTAAGTCTTATCAAAGTTTTTCCTTGATAAAAACTAAGTCGATAATTTTATTTATAGCTTTCCTTTTAACTTCACATGCATAGTTATGATCTATATTTAAAACTTGTCCTATTTGTTTATATTGTAATCCTTCAAAACATTTCATTTTGATTACTTTTTTTTCAGTATCATTTAATACATTAATTGCATTATCTATTTTTTTAATAAGTCTTATTTTTTTATTTAATTTATAATTTAATTTTTCTAAAAGTTTTTCTTTATTAATAATTTCATTCTCAACATTAGAATTAAAAGCATTGGTGGAAGTACTTTTTTCTTCATAACTCATTGCTCCTACACCTTTATATTCTAATTTAATATCTTCTATTTCTATTTGTAAATTATCTATTTCACTTTTAATTTTAATATAATCATTTAGCAAGTTTTCTGTCTTTTTATAATAATTCAAGCAAATTCACCTCTTTTTTAGTAATCTCTGTAACACTTTTAAGGGGTATCTGTAACAACTACTTTGGCTATATTATTAACTTTTAAGTGATTTTGTTACAGAAAAAGCGTTACATATATATAATAATTTCTTTATTATATATAATAAGTTATATTAAAAGTAATTTAATATATAAAGAAAATTATTTTATCTGTAACCTTGTAACACATTAGACTCAAAGTGTTGATATGACTACTTTATAAGGTGTTACAGATATTTTATTTTTATTTGTAACAAAGTGTATTATAAGATACTGTTGTAACTGTTGCTGTTGCTATGTTGGATGGGTGTTACAGATGAATAACCTATCTGTAACAAATAAATTAATTAAAATTTACCATTTAGGTAATCCCCCTTAATCTCATAATAAGTAAATCTTGAACTAACTTTAGTAGGTTCTTTAGCAAACATTTTAATTGCTAATGCAGAAATAGAATTCAATTCTTTAGTAGGAATTTTGAATCTAGTCCACGCTTCATTATCTTTTTTGAATAGCCTCATTTCCATATAATATGCTCCTTTACAATTATTTCACATTATAACTTCTTATAAACTCTCTTTTGTTTCCCATTAACTCTAATTACAGTGTCCGAATTATAACCTTGCTTTTTAACTTCTCTGCCAAATACAGGTTTGGAAACAGATTTTAAACCATTTTCACTACACCAAGCTGAATATCTTAAATAAACTTCTTTTACTGGTTCATTCTCTATGTCGTTGTCCTCTAAGAATCCAACTATAGGATTATTTATAGCTTCGTATTCTTCCCAAACTCGGTTACATACTTCAGCATGAGTAAAGCTGTGATTAATTAATACTCTGTTTAATCCTTCCAAAGCTAATTTAAGTAAGTATTCCATGGCTTCATGACTTGTGAGCTTATCTAGTATAAATGGGTCGTAGTCTTTATCCTTTTTGCTGAAAGTTGCATTGAATGGAATAAAAATTAATCTTCTTTTAAGTCCACCACTAAGGTCATTTATTCTTGGAAGTTCATTAGCTGAAAAAATTAATTTACTATAATTTTTAAAGTCAAATGGATCTCTTCCTTTTCTCTCTACATTTACTTTTTCCCCAGTAACTAATTTTTTAAAGGTGCTATTATCTTCAATGTACTTATTACTTATATCATCACCTATATTAGCCAACTTACCTTCCAACTGAAATGTTTTAAAACGGTGATTGAGTTCTTCTAAAGATACTGAAGCTATATTTTCCTCTCCAAGTAATTCATTTAGTACCTCCAATAGTGTTGACTTTCCATTAGCCCCTTGGCCAGTTAATATGAAAGCTTTACCCAATTCATTACGTCTAAATAATGTATAACCTATCATTTCCTCTATTAACAATCTGAGTTGCTTATCTTTGCAGCATATTTTGTTTAAAGTCTTGTCCATAGTTTCACTATAAGCATTTGGATTATATGACCATGAAATTTTATTCTTAATTATATGGCTGCTATTAAACTCCAGTAATTTTTTATTTTCTAAATCAAATATTCCATTTTCCAGTGTAATGTATTTTGGATTAGTCATTTTAGTGTTTTTACATAATAGATCTAGGTATCTTAATACTTCGGTTCTAGTACTATTAGTAGAATTATTTATATATTTAAGCATTGTTTTTTCAATCTCTTTTGTATCACTTGAATAATAATTATTTTTATAAATGTGTAATTCATCATTTATTTTTATTATTTTTTCTATTCTCACGTAGATAAGTAGCTAATTTCTCATATTGCAATTTACTTTTTATATAAAATGATTCTTTAAGAAAAGCTTCATCCCTTAATATAGTTTCTATTTCCTTTTCATCCAGTGGTTCCCCTAATATGTGTTTATTTATAATTTTTATAGTTTCTCTAATATCTTCCCTAGTTAATCCTTTCTGCTGCAAGGTCAATATATATCCATATAGACTACTATTTCTACCATCACCTTCCGCCATAGCGCTAAAGTTAATTTCTCTTTTGGTAAGAGGTATTAGCCACGCTGGTAATGTGTCTATATCCTCTATTGTTTTTAAAAATTTTCTTTTTCTACCTTTTACTTTTAAAGGCACTACTGCATTTTGTATTCCAAGTCCAACATCTATTTTTATTCCTAGCGCAGTATAATATCCTTGCTTTCTTCTTTCTATTCCTGGATTAAGAAAATAAAAATGTTTTCCTCGGGTAGTTTGTAAAACTGTAGTATTTATGTTTAATTCTTTTATTATTTTATAAAGAATATCTGATTGTTCTTTATCATCTATATCAATTTGTATTATGTTATCTTTTAACACTCCACCATAAGAATTTAAAGATTCTATATCCTCTAAACTGTAAAAATCTGTTCTATCTTTATATTCTTCCGTTGGTCTTTTACCATCCTTGCCACCTGTGGGAATGTATCCTTTAAACACTGTTTCTCACCTGCCTTATACAAAGGGAGCATTTAAGCTCCCTACTTCTTTCTATTAACACTATCTTCTACTCTAAAACACCCTTTAGGATATCTTTTTTCTAGCTTGTATATATTATATTTAGCTACATCTTCTAAATCTACATTTATAGCATCTGCAATTAAATTTATATACCATTGTACGTCCCCTAACTCATTAATTAATTTATCAATATTCAATGAATGACCTTGGTATAAATATTTTTAACTTATGTCTATAACTTCTCCAGATTCACCATTAAGTCCCATAACTCCATTTATAAGTTGATCTATATTATCTGTATAGCTACCTTTAGTTTTTAAAGCCTTTTCTTGATATTCTTTAAAATTCAATTATCTTCACCTTCCAATTCAATTAAAGTCATAATACAATAGTTGGCACAATCCATTAATGTATCTTTTATAGATTCATCTACCAGAGCATCTTTAGTACATAAACTTTGTAACCTATTAACTTTATCTGTAATTCTAGTAACCGCACTTATTATTCCTAACTTCTTATAAGTTTCTCCAAAACTATCTCCATAGTCATGATTCTTAGCTTTATAAATTTTATTAAGTTCATCACATATTTCTTGATGTCTTTCATATTTCTTTAATGTCTGACCAATTGTAGGTTTAGTTTCTTCTCTTGTGTAAACTCTTTTACACATCCATGGGTAAATAGACCCATCTATACCTTTTAATTCAGTAAAAACATCTATTCTATCAACTCTAAACTGATGGCCACAATATCTCTTCATTCTTTGTAGGAAATTAACGTCTTCATATGTTAATGCATTTGGATATATCTCAATATCCTTAATATTTTTCATTTCATCCCATTCCAATATTTGATATGTTGCTCCATTAATAAATTCTTTAAGTGGAATTATTTGTAGTTCAGTTTCAACCTCTTTACACATCCATGGTTGTACTGTATATTGCCCTGTGAAATACCTCGTTTCATTTAATGCTATAAAGTTTTTACCAATTAATTCGTCCATTTCATTAACAAAAGGTAAGTCACTTGTTTCGCTTTCATCGGGCAAATGTAAACCGTCATATTTTTCTAGTGCAAATTCTTTCATTTCATTCCAAGTTAATATTTCATACTTTTTACCTACCTTAAATTTATCTAACACTTTTGTTTCCTCCTAAAATTGACCTACTTTTCGGCGTGTTGTTTTCTCCATGCCCTTAATTTGTATATCCTTAATATTTGATTTTAATAATTTATCTTTATATTTCTTTTCTCTTAATCTTAAATCTACATATTCCATAAACTTATCTTTCTTACTTTTCATATTTACCTCCTTTGTATTAGTTTATTAATACTCTAGTACAGCTTGAATATAAAAATAGTTGGATTAATATTTATAGTTACTTAATATGTTTGTATTGCGACATTAGATAGCATATTTACATACTAAATTGTCATTGTAAATTTTAAGACTTTCTTTTATTCTTTCAATCTTCTTATGCCTTTTATATAAAAATGTTTCAAAGTCCATACTTTTAAAGAAACTAGGTTGATTACAATATGCTGCATAATCAATATAAAAATTTCTTTCTTTACTATCCCAACAATTAATATCTCTCATAAAGTAAGGTAAACATTTATTTTTTCTACACCACTCAACTCTTTTAATAAGTAAGCCTATATTCATATCTTTATTTTGATAGATATAAAATTTAACTTTCCATTCCTTAGGAATATACTTCTTTATGATTTTTAATTGTTTTTCTAATAATGGTTGATACTTAGGATTATCAAAAGCAAATATATATTCACCCATGTAGTTCAATTCTGATAGTAACTTTGCATTATCCTCATTAATCAATCTAAAATCTAATCCCTGGTTAAATTCACATCTGATGTTATTCTCTATAAGATACTTAAATACTTCCATATGCTTGTCATATGCTAATATATTGTTGTCTAAAAACTTAACTTTTTTATGTTTAATAATGCTTTCTAATGAGTTATAAACTTTTAGTTTACCCTCATATTTTGGTACTTTACAAAAGAAACAATTTCTTATGCATCCTCTAGTAATAAAACCATAGCTTGTATCTTCATATTCATAGTAAAATGGCTCTGTGTTTTCTATTTCTATTGGTAACTTTAAATTAGGATCAACCGAACCTATTCCGCCATAAATAATATTATTACACCCAATTATTTCAAATCTATCTTGATTAATTTCAAAAATATTGCTTGAATATACTTTGTCATAACCAGTTGCATCAACTATTTTCTTTTTTCTATTTGGATAACCATCAAGTTTTAAATCTATCATTTTCACTTCATTATTATCTTTAAAATAGTTATACATTCTTCTTATTGCAAGGTTAAATTTAGAATCAACATTAACCAATAATATTTTCATTTCTTTCCCTCCATTCCTGGAGGTGTGGCCACACTTTTTTATCTAGAATTACTCCAATTTTTTAATTTCAGTTAGTACACAATAATTTCATATTCCGACCTAACCTATAAAATCTTTTATCCTTTTCCAAGCCATATCTATATACCATTGCTTGTCTAATTTACGTGGTACTGTCTTATCACTTATGTCTGAATTATCTATAAAACATCTTAACGGTGTACTTGCTATTTTCTCTCTAGTTCCACCTTCAATTTTTACTTTAAATACTCCAGCATCACTACGGGACCTACTAGCAAATACTCTTAAAACTCTTTCATCTAATTTTGTATTTCCATGATAACCATATAAATATTTACTACTTATCTTAACTACCTTCTGGAACTCCTTTAGGTGATTACAACTTAAAATAGTTTCCTCTGGTGTAATTCCTTCTATAAAGTAATCCATTAAAGCTTGATTTACTATTGGTAAATCATAATCCAACTTATTTAATGATTTAACATAAGCACCTTTAGATTTAATTTTTCCGTTTTCCATCACTATGAGATAGTTATTTACATCCTTTTGCACTACTTTTTTAATATGGTCATGGTCCAATGTCATTCTTGTACGATTACACCACTCTTCACATATAAATTTATAAGTTTCTATATCTTTCTCACTCTCTAGCTTCCACATAACACCGTCTGTATTACTTTGTATCAGTTTGGCTCCTAGAACTCCTTCAATTACTTTTTCTATAAGGTCCAGCAACATTAACTGTCCGTTTATACAAACATTATTTGCTTGTAAAGGATCAAATAAATTATTATATTTATCTTTAGAAGCTCCATAGGTACTATTTAAAACTATTTTATATGGTTGCTGCTCTTTCTTTTTTCCTTCTCTTTTAAGCTGCATACGATAATCGTAAATTTCTTTATACTTACTCTTATCTCTTACATTTCGTGATAAAAAGTCATATTGTATCATCAAACTTGGATAAAAACTTCCTACGTCTGAATTAATAAAAATCCCTTCACCCATGTATTTATCTCTAGCACCATGTAAACCACCCCAGCCAAATATATGAGGTACTCCAGCAACTTCTATTTCAAGTGATTTTTTATAATCTCTATTTAGTGGATTCTTATACCAGTTTAAAATCTCTCTATATTTATTAATCTTTATAGTTGGTACTATATTTATTTCAAATTCATCTTCACGATCCTGTTTATTTGCACCTAATATAATTGCACTTAATTGAGCTTTGGTCTTACTTATATGTTTTAATGGTAATTTAAAGTTTTTAATTAATCCCATGTGGGCTTCAAACTCTTCTATTCTATTTATAAATACTTCTATAGTTTGCTCAACATCATGGTTACAATAGAAAATTACTTCTTGGAGTTCTTCCTCTGTAAGTTTTCTATCTATATCAAAAGATACTGTAGTTTCTCTTATGTCATTGCCCATAAACCCTTCTAATTGTTTAAGTCCATGGAAACTAGTCATAACGTCATAGTTATATAGTTGAATCTTAAATAATGTACTGCTAAATTTCCAAGCTGGCTTATGATCTACTATTATGTGGTCGTTTAACTCTTTAGGATTAAATCCAGCCATTATGGCTTTTAGGATCCATTGGTCATATGACCTAGAGTTGTAGCCACACCAAATATTATCTTTATTGGTTTCATAGAAGTTTCTTAATTCTTTAACATTATTTACTATGGTATGAGTTTTCTTAGTATCAGTATCTTTTATAACTACTAGCCAATCGTGTTTAAAAATTTCGAAATCGTAGAAAAGCATTAGTTATCACCTCTAAATAAATTCACTACATTTTCAGCATATTTAAATTGTTGCTTTACATAAGGAGCATCTTCTTTACCACCACTTGCTAACCAGTCTGCTATTCTTTTATCTATATCTAACAATGCTGATATAGGAATATATTTCGAATACTTTACTATATCTTCAACTGAATTAATCTTAATCATTTTATAACCTCACTTTATTAAGAAAGGGAGCTTGTACACTCCCCATCCCTTTTAAACTTCAAATATATCTTTTATTTCATACTCACTAAACTTATTATTTTTCTTATTAGCTGTATAACTAAGTTGATATTCCAATTTACCGTCTATAGCTTCAGCCATATCCATAAGCATATCGTTATATTTACTAAAACTTTCAAACTCTACTTCCACACCACTGTCTAAACTTCTAAGCATTTCATTAGCCTTGTGTAATCCAAATCCACTTGATAATACTTGATTATAGAATATCAAACTTCCTTTATATTCTCCTGTTAAAATCTTAAACCAAATACTTAACATTGGATCTCCTTTTTTAGATTCTCTTAGCTCTAACTTATTTACTTCAACTTCATACTCACCGTGTGGGACTTCTTTAAAGTCACCACCTCCGTTTTCAGCTGCCTCTTTAGCATCTGCTTTTAAACCCTCTACATCTATGTTCTTATCAAATTTATCCCATATGTTAGCCATTTATATTTCCTCCTTATAATTACTTAATATATTTAATACTTGATCTAAATCATCTGCATTAAGCCTTTTCCAATTAAATCTTAGTAATTTATTAACTTTTTTTCTTCTCTTTTCTCTTTCCACATATTGTTTTATATCTTTTATTAGGAAATCACTTATTCCACAGCCATCTTTTTGTTGTAGATTTTCTATATAAAACTTCTTTTTAGGTGAACACTCCACTGTAATATACTTTCTTCCTATACTTTTAATAGTAGTTTCAATTATATGACCTGAACGTCCTATATATTTACGTAACCAAATTTTATCCCCTACTTTCATTACTCTTCATCAGCCTTTCTTCTACGTCTTCTCTTAGGCTTTTCTTCCTTAGTTTCTTCTATTGGTTTATCTTCTTTTGGTTCCTCTGTAGGTTCTTCTTTAGGCTCGTTTACTTCTTCTAAAGTAGTTTCTTTAACTTCTTCCTCTTTCTTATCCTCAACTTTAGTTTCTTCTTTTTTAGATCTTCTTCTAGTTGGTTTTTCTTCTTTATTAGCCATAGAAGCAACACCACTCTCTTTTAAAACATCATGTACCATTGGGCTTTCAGATTCTCCCTCTCTCTTACTTCTTCTTGAAGGTTTATCTTCCTTAGGAACTTCTTCTTTTTTAGGTTCTTTCTTACCAGCATTAGCTTCATCATATACTTTCATAAGTTCATCCCAACTCAATGAAATACTTGTTTTAGTAATTCCTTTTAATCTACCACCACCAAAAACCACTTCATCTGACTTGAAATTTAACGTTCTATTATCACCATCAACTACTACTCTAGCAACTATATCAACCATACCAGCTAATTTATTAGCAATTTTTTCAGTTATGTTTGGCCTTATAGCAGTTATCTTATCACCAGTTTTTTTGGTGATATCTTTAGATTTATCTTCGTGTGATACAATTACTAAGTTTTCATATTCCAAATTGAAGAATCTTCTCATAGTACTTAGGAATTCCATCCTTACTTTATCCCACGCTCTAAATGCATCATCACTTTCGTGAGTAATTCCTAATTCATCATATTTATATAACCTACACATTTCGTAGGCATCTTCTGCTAAGTCTATAATAATTGTTTTATAATCATTATCTTTTTTCTCTAGTTCCTCTATAGCTTCAATAAAGAACTCCCATGAAAATTTTTTCTTTTGTATTCTTCCTTCCCACCACACTTTATCTGCCAGTTTTATATATTGCATTGTTACAAATTCAATGTTTCCATCTGTATTCAAGTTTAATGGATTAGGTGCATCATCCAACATAGTAGTTTTACCACTCATACTAGGTCCATATATCCATAATTTTTTCTTATTAATCTTTTTAACATCACGTCTTTCACATTTTGGTAATATCATATAATCATATCCTTTCAAACAATATTCTTCATATTCACACCAACTGCACAAATTAGTTGGATTTTTTTTATACTCTTTTACTTCCGTAGTATCTATAATGCTATCCATAAACTCTATAACCTTGTTAGGATTGTAAAGTACTTCTGCTATTTGTATTTCTGAAGCTTTAAGTTCCTGAAGTAGCCTTTTTCTAAATTGATATAAATCTTCTTCTTTCTTTTGTCTTATAGAAATCTTAGGAATAAATATGAATCCTAATTTTCTAACTTTAAATCCCTTCTGTTCCATGAAATATTTATATATGTGTAACTGAGGACTTTCCATATAATGTTCTATAGCATTGCTATATTTGAAATCAAATACATCTACTGTACCATCATCATTTTTAGTTATTAAATCCACGATGCCTTTGAACCTTTTAGTGTTAATTAAATACTCTTGAGCATATATATTGATATCTAGTAAAAGCTCTTTAAGTCTTGGTATTAAATACTCGAATTTTATAATTTCATTTATGTGTAAATCAGTTAGCACATAATAATTTGATTTATAAAATTCTAATGCTGCTTTTAAATTTTTCTCTGCTCCAGTATGAATTGTGTTTCCACATATAAGAGCATTGTTAGCATCTTGAGTTGGTATGGTCTTAAGCTTGTCTATATACCGTAATTTATATTTATAAGGGCAACCTTTGAAACTTTCCACCCTTGAATGTGAGTATTGCATTTGATCACCTCATATTAATTTCCTTGATTCTATTCCAAGGAATTAATGCAATATACATATCATCTTTAATTACCATCACATAAGCTATATTTTCTTTAGTTACAATTGTATAATCATCACATTCAATTTTTTCTATTTGCCCTGGAATATGAGAAAATTTTACTATAGTCATAACTTCTAGCCCTCCACATTAAAATTAACTTCTAACATCTTTCTACTAGCTAAGTAATCACATAAGTGAGTAAACTTTTGCATTTCAGTTTGTGGCTTAGGTAATATTTCTTCGCTTGTTTTATAATCTGTGTTCCATTGTCCCATGTGAGATTTAATACAACTCGCTATATCTTCCCATAAATCACATTCCATTACCTCTATAACTTCATCTGGAAGTGTTTCCTCTGGTACTTCAAAGTATCTATCTTCTAAATATTTAACAACTTCTATAGGATGTGCAGCTACTGTATATTCGCTCCCATCAGTTCCATGTTTCACTCCATCATGTAGTAATAAAGCAACCCTTATGATGTTTTTTTCTCTAAACTCAAATTCTTGTATAGTTTCACATCTAAACAACTCTTCTGCTATTCTTATTGCTGCTATAGTATGCCTTACTAATCCACCTTCACCCAATGCATAAGCTGGATGATATTTTCCTGTGGAGCTTGCTGCAACTTCATAAAAATAGTCTGGTAATTGCTTTAAGCACCATTCTACAAATATTTTTAATGGTTTATAATTTATGCTTTCTAATTCTTGCCTAAAATCATATTTAGGAGCTCTATAGTCTTGGTCAACATCTTCTGCTATATCTAAATCTGAAAATAATTCTTTTAACTTATGGATAGCTTGAAGTGGCATATCCCATGATTTACTATTTGGATTGTATTTTCTTCCTGGTATTGTTTTAACTTTAGATACTATGTCGGCGTCATAATCAAAACTTACATTTAAACTATCATTAATTTTTATAACTTTAATCACCTAAATACCCCCTTACATTTATGAAATGAACTTTAATATCTTTAGTAAGATCCCTCATATTTATATTCTTAATTCTTCCTTTGTTTACTCCATCAACTGTTTCAACTACATTTTCTTTAACAAGACCTTCTCTTTCAAAATTGACGAAATTAGCTTTTCCATTCTTACCTACAAACTCATTAACATTTTTACTTTCTAACAAATCAACTAATTCCATCTTTAATGAATCTAAATCTTCTTTATTTCTTTTTCCCTTTTCTTTTAAGTCTAATATTGCATCTACTAATTCATCAGCTTCCTCTTGCCATTTTTCTTTATTCATGAATTTACCCCCTTATTAACTCTTTCATATCCTTTTTAAACTGTAAGAAATCTTTAGGATATAATATATATCCAACTCCGCCGCTCTCTTGTATAAGCCTTATATTCCTTTTCTGTAACTCCGATGCCCGTCCATTTGGTGCTTTAACTTCTATTCCTACAAAGTGACCATCAACACAAGCTATAATATCTGGAATACCACTTTTACTATATGGACCACTCCAATTTTTATAAAACCATGTCTTTGGTAATTCACTTAAAAAATTTTTTATTTCATTTTCAAATTTCTTTTCTGCTGCCATTACTTAATGCTCCATTTGTAATTATTTTTATTTAAGAAATCTTCCAGCATATCAAGTTGTTTTTCAGTACCTTCTATCTCATAAGTATCCACAAATATTTCTTCATTTTTCTTAGGTGCTTGTACTACTGGAGTTACTAATTTGGGTGTATCATCTATTTTATTTTTAAGACTTTCACCATCTTCTAAAATTTTATTTAATATAGTGTCTATATCCTCATGCTCCAACATACTCACATAAGGCTCCTTAACCATAGTTACACCATATTTAGCATTAGCTAAATCAATTCTCCCTTCAATTAGTGATATATTTTTCTTATGATTAGCCTGTTTAAGTAACATTTGATTAGCAACACTTATTAAATCCTCTCTAATAGCTTTCAAACTCATTGATTTATTAAGATATTTTTCATCTAATGGCAGATCTTCAATGTGTTTAAGTTCACACACTATTTTTATAACTTTTTCAACTTCTATTTTCTTTTCTTCTTTTCTCTTAATTTCAAACTGTTCAGCCTGTTGATTTATTGGATTTATAACTTCATCAAACTTTCTGTTAAGTTCTTTACATTGGTTCTCAAATTCTGTTACTGATTTAGTAAGTTCTTTTTTAGTTTTCTTTCTAAATTCATCAAGTGATTTTTTTCCTTTTCTCAAGTCTGCTATAACCTTCTTACCATCTTTTATAGTCTCCTCTGTAACAATAATTCCTTGATATTTATTAAGTGTTGAATCTAAATAATTTGATATTTCATCAAAATTAAAATGTACTTCTGCTGGTTTATTTTCCAATACTTTAAGTTGTAATTTATTCATTTATATTTCCTCCAATTCTTCAAATAGCTTGTCTGTAAAATCTTTTCTTTCCTTAAGTGTTTCAAATATCTGCTCTTCAATACTGTTCTTAGTAATTAAGTACCAATACATACAGGTTCTTGTTTGGCCTATACGATGTGTTCTTTTTTTACTCTGTTCAAACAACTCTGAAGCTAGTGGTAAGCTGTAATAAACAATCTTATTACTAAGTTGTAAGTTAAGGCCCATGGCACCCGCCTGGTATTGAACTAACACCACTGCATTATCTTTAGTTTTATAATTTTCCAAGTCTTTAGTTTGTCCGTTTACTATTGATACTGGTTTTTCTAATCTTCCACATACCTCTTTAATTTGTTTCATTTCTTCTGTAAAGTTATAGAATATGATTACTCTATCTTCTGTACTTTCTAATGAATCTTTTAAAGAACTTAATTTATTAGGATTATATTGTGAAGCTAACTGCCTTAAATACAACATCTTAGTTAAACTTGTATCACCTACCAACTCCGTATTATTTATAGTTATAAGTCTATCTTTCTTAAACTTCTTATACTCTTTAGTGTTCTCAACTAAAATTGATATTTCTACTTGCTCTGGAAGGTCAAATACTTCCTCAGTTTTCATAAATATAGATCCATGGTCATGTAATTTTTGTTTAAGTCTTTCAACGTTCTTATAACCAACTACTTTAGGAACTTTAAAACCTCCAACATCCATATTTATAAACTTTATATACTGCTGCCAATAAAGTTTTTTAGATATATTCCAACCTAATAACTTACATTGAGTGTGAAGTTCTTCATATTTTCCACCACAGGGCGTGCCTGATAAAAGTATTACATTCTCTGCTTTAAGTTTTAATATAAATTTAGTTCTCTTAGATGTTGGATTCTTAATCATAGAACTTTCATCTAACATCAAAGTGAAATTTTCTATCTGTGATAATTTTGGTCTACGCCATACCAAATCGTAGTTTATTATTACAACACTATTGGATGGTATTTCTCTTGTTTTAGAGTATATAAATGTGTTATACTCTGGGTAATATGTTTTGAAGTGCTCACACCAATCTTGTAATTTTGATTTTTGGCAGATTATCAAATTTATATTGGTGTTGAGCTCTTTTAATTTTTCTGACCCTACAAAGGTTTTGCTAACCTAAGCCCATATCCAAGAAAAATCCAACTCTATTAAAATTTTTAACTTCTTCTAAAGCTTTAACTTGATGTGGATATAAGTTCATTGCCAACCACCTTCTTTCTAAGCACATTTGATAAGTGCTTTATTACATCTTTCTGTTATAATTAATAATTCTTCTATGCTTGTACATTTGTTAAATCTAATTTTGTTAAATTTAATATCTGCTATTACCATATCTGATAATTCTTTTGTTAAAATAACACCTCTTTCTGCAAGTAATCTTTTAAGCATTTATACAACCTCCAAATATTCATTACCATTGCGGCACTAAAGAAATGTAATATTCTAAAATAGAAGTGAATAGAATATACTGCGGAGTGTTTTTATCTTTTTTTAAGAAGTGCATGAGGGACTAACCCTCGGCTATCTCTTGTGCAATACTTTCTAATACTTCGATTACTCGTTTTAAGTTTTCTTCATTTTCCTCTTTTGAGATGTTCGGCTCTACTATAGTTACTTTAGCCATATAAACCACCTCTCCATATGTCTATTCATCTTTTGGATAAAATATTTCTGGAACAGTTTGTCCAAGCGCAGTTGCTATTTTATCCATAACATCTTTTGTTGGATTAGTTTTATACCCATTTTCTAAGTTATTAATATAACTTGGGGTTAACCCAGTTTCTTCTGCAATTCTATAAATACTTATTTTCCCTTTTTTTCTAATTTTTTTAATGTTATTCAATTTTCATCACCTCCTTTGTGTTCTGTGAGTACATATTATCATGTTCTGATAGTATACAGCAACTTTAGTATATGCTTATAGGACACGATTTGGGAAAATTATCATATTCTGTCAGCACATTTTCTCGCTTTTACTTTAATTTACTATTGACTTTATATTCTGATAGTATATAATGTATTCTATCAGTATATAATAATTAAAAAGATTAAGGAGTGATTGCTGTGTTCGGTAAGAATATTAAAAGAATTAGAGAATTAAAAGGATTAGGTGTTAATGAGCTATCTAGATTAAGTGGTGTTAATGCAAGTTACATAAGTGCTATGGAACGTGGAGAAAAAGAAAACCCAACTATTACAACATTGAAAAAATTGGCTGATACATTAGAAGTTACTGTAGATGAGTTGATAAAAGAAGATTCAATAACACATGAAAAATTAAAAGAATGGGATAACAAGTATACTGATCAAATTAAAGAAGAATCTACTTTATATGAAACCGGAGAATTTAAAACTGCTGAAGCTGCTATGAAATTTATTCTTCAACAACCTAGCATAATGGGTTTTGGTGGTTTTGATGCAAGTAAAATGAGTGATCAAGATATAATCGATTTTGCAAATGAATTATTAAATATAATAAAAATGCTAGGCCCTAAATATAATAAATAACTTAAATGGGGGTTAAAATATGTATTTAAATTGGATAGATAACATTTTAGATGGGCTTAAAGATACATATGATACAAATATTTATGAACTATATGATTATTTAGAAATAAAAATGATTAAATTAGAACCTAGCAATATTTTATTAAGGGGAAATGAATCTTTATATAATAGAAATTATTTTGGCAATGAAATAGTTCTTATTAGAAATGATTTAAATTTAGAATATGAAAAATTTATATTAGCCCATGAATTAGGCCACGCTTTATTACATACAGAAATATATAAAGCGGCATTTAATAAAGATTTAATTAATTGTGGCAAATTAGAAAAGCAAGCTAATTACTTTGCATTTGGATTATTGGATTTAGATATGGATCCAATACAGTTTGAAGGTTTTACTATAGACCAAATTGCCAGTAGTTTATATTTACCAACAAAATGTTTTAATGTTACAAATGAAAACATAGCTATATGAACACTTTGAATATATTTTGTTACAGAGTGTGACAACTAAATTATTTTATCTGTAACATTCTCAAAGGCTTGATATGATTACTTTATAATTAAACTTGTTACAGAGTTACAATTATTTTCACTTTCTTTATATATTAAATAAAATGAAAATAACTTTATTATATTATATAAAGAAATTTAATATATATTGTAACAGGTATTTGTCACAACAAATTAATATAAGTGTTGATATTATTGGATTTTATCAATTTAAAAATGTTACAAATAGTGTTACAGATGTATTAAAAAGAGGTGATAATTTGGATAGAATTTGCATTTACTTAAGAAAAAGTAGAGCCGATGAAGAGTTAGAAAAAACAATTGGTGTGGGTGAAACTTTATCTAAACATAGAAAAGCACTTTTAAAATTTGCTAAAGAAAAGAAATTAAATATTATGGAGATAAAAGAAGAAATAGTGTCTGCAGATAGTATATTTTTTAGACCTAAAATGATTGAATTACTTAAGGAAGTTGAAAATAATCAATACACTGGTGTTCTTGTAATGGATATTCAAAGGCTCGGAAGAGGAGACACAGAAGATCAGGGGATAATAGCTAGAATATTCAAGGAGTCTCATACTAAAATCATCACACCTATGAAAACCTATGATCTAGATGATGACCTAGATGAAGACTATTTTGAATTTGAAAGCTTTATGGGTCGTAAAGAATATAAGATGATTAAGAAACGTATGCAAGGGGGTAGAGTTAGAAGTGTAGAAGATGGAAACTATATAGCCACTAATCCACCTTTTGGGTACGATATACATTGGATAAATAAATCAAGAACCTTAAAATTTAACTCTAAAGAATCCGAAATAGTAAAATTAATTTTTAAACTTTATACTGAAGGTAATGGCGCCGGAACTATTTCTAATTATCTAAATTCGCTAGGATATAAAACTAAATTTGGAAATAACTTTAGTAATAGTTCTATTATATTTATTCTTAAAAATCCTGTTTATATCGGGAAAATTACTTGGAAAAAGAAAGATATAAGAAAATCCAAAGATCCCCACAAAGTTAAAGATACTCGCACACGTGATAAATCTGAATGGATTATAGCAGATGGTAAACACGAACCCATTATAGACGAAAAAATTTGGAACAAGGCACAAGAAATATTAAATAATAAATATCATATTCCTTATAAAATAGCTAATGGTCCAGCTAACCCATTGGCAGGTGTAGTTATATGTTCTAAATGCAATAGTAAAATGGTAATGCGTAAATACGGTAAAAAGTTACCGCACTTAATATGCAATAATAAAGAATGTAATAATAAAAGTGCTAGGTTTGATTATATAGAAAAAGCTGTTTTAGAAGGTCTAGACGAGTATTTAAAAAATTATAAGGTAAATGTTAAAGCTAATAATAAAACGTCCGATATAGAGCCATATGAGCAGCAATCAAATGCTTTAAATAAAGAACTTATTTTATTAAATGAACAAAAGTTAAAACTTTTTGATTTTCTAGAACGTGAAATTTATACAGAAGAAATATTTTTAGAACGATCTAAAAATTTAGATGAAAGAATAAATACAACTACATTAGCAATTAATAAAATAAAAAAAATATTAGATAATGAAAAGAAAAAAAATAATAAAAATGATATTGTTAAATTTGAAAAAATATTAGAAGGATATAAAAAGACAAATGACATACAAAAGAAAAATGAACTAATGAAATCTTTAGTTTTTAAAATAGAGTATAAAAAGGAGCAACATCAACGTAATGATGGACTTTTATATATCTATTTCCTAAGCTTTTGCGTTAGGTGTATATCATACCTAACGCAATTCATTTCCTTCTTTGTCTACCCCTATAGGATCTTGGAGATATACCTCACCTTTAGTTTTTTTATTATTTCTTATGAGCATTAA
Protein sequences of DBSCAN-SWA_7 >NC_017299|2694256:2737597|2728115_2728436_-|WP_014521348.1|DBSCAN-SWA MKVGDKIWLRKYIGRSGHIIETTIKSIGRKYITVECSPKKKFYIENLQQKDGCGISDFLIKDIKQYVEREKRRKKVNKLLRFNWKRLNADDLDQVLNILSNYKEEI >NC_017299|2694256:2737597|2710795_2711287_-|WP_014521328.1|DBSCAN-SWA MARLASFDYSDFKNMAKSFQKALDERVIERWIREFLLEMAFRAERKIKKRTPVGVYSNQVSFTTKDGKEVSFTTSSSKIGGHLRRNWQVGNVVKQGDAYIVEIFNNTEYASYAEYGHRTKNHKGWVEGRFMATISMAEIERQLPKFLERKQVELLNQILNGRL >NC_017299|2694256:2737597|2699234_2699603_-|WP_014521313.1|DBSCAN-SWA MYLGKMLIYNKKTGKILNGCIQERFDSGLTDKMIKELRPNEVGVVNLPYDYNENNFKEAAEYHIDVTKNKETTDLKDLKDLIVITQYMERVETNEEKLKREKQELENQLMLQADNNLDGGIL >NC_017299|2694256:2737597|2727656_2728115_-|WP_014521347.1|DBSCAN-SWA MANIWDKFDKNIDVEGLKADAKEAAENGGGDFKEVPHGEYEVEVNKLELRESKKGDPMLSIWFKILTGEYKGSLIFYNQVLSSGFGLHKANEMLRSLDSGVEVEFESFSKYNDMLMDMAEAIDGKLEYQLSYTANKKNNKFSEYEIKDIFEV >NC_017299|2694256:2737597|2735220_2735676_+|WP_014521360.1|DBSCAN-SWA MYLNWIDNILDGLKDTYDTNIYELYDYLEIKMIKLEPSNILLRGNESLYNRNYFGNEIVLIRNDLNLEYEKFILAHELGHALLHTEIYKAAFNKDLINCGKLEKQANYFAFGLLDLDMDPIQFEGFTIDQIASSLYLPTKCFNVTNENIAI >NC_017299|2694256:2737597|2719955_2720147_-|WP_014521339.1|DBSCAN-SWA MRYKFNTRWKGKNLICACLFGNPACDRYKKCEVLELKLNTYGDIDKCMNHRSYKRIKGALRQK >NC_017299|2694256:2737597|2707993_2708407_-|WP_014521323.1|DBSCAN-SWA MNNFEDFLMDSFEEVEEIEREITIGGKKKKMKFKPISADKGDELRKKCKKITIVKGQKMSETDQDKFIANQIIETTTYPDLKNAELQKAWGVMGAEQLLKAMKSKMSDGEYMEWGSVVSEINGYDKGIQELVEEAKN >NC_017299|2694256:2737597|2698746_2698914_-|WP_014521311.1|DBSCAN-SWA MEVLDFCKGCGRPIQNNKFIIATLSNSTGIYDVRFFLFSILFEKNKNCRRLFYNS >NC_017299|2694256:2737597|2698397_2698790_-|WP_014521310.1|DBSCAN-SWA MKKIKTVEDYFIIANKNDLIKALRTILKKNLNLDERKYIQALLIRAARDKDLKSVYSSEDLIISKNDNKEWCYICMEFVESEIDKEFYCDSYYENHDDYMLEHNIDIIKTDHDVIVHRCSKCNTTLLKHI >NC_017299|2694256:2737597|2703258_2704233_-|WP_014521319.1|DBSCAN-SWA MNIQLLLDNKDGNVFDISELTSEVTWKTKRKDKPSSLDFEILKDKQITINNGDVISFKVDGNPVFYGYTFENGGNKNPIIKVTAYDQLRYLLFNDTYVFKNKKASQILIQIAKDIGLRVGTIEDTGYVIPQLLEDDKKLLDIIYSSLEKTLMSNKRTYTLYDDFGYLNLRNINNMRQPVVISDDSNLGDYDWKNSIDSDTYNRVKIVRDNKDTKGRDVYIAQDSRNIAKWGRLQYFKKVDEKMNKAQIQEMVNAALKLKNRETKTLKLKDVISTDIAADLKLRAGSGVYVDIKEKGIKQYYLIEEATHKFQKGNLVMDFDLKVV >NC_017299|2694256:2737597|2730236_2730404_-|WP_014521350.1|DBSCAN-SWA MTIVKFSHIPGQIEKIECDDYTIVTKENIAYVMVIKDDMYIALIPWNRIKEINMR >NC_017299|2694256:2737597|2702501_2702909_-|WP_014521317.1|DBSCAN-SWA MSDVSILPQGAVISDDLEMKEIIEPTKTYKIKDNRIVGFIDGKEALKQAIRLILNTERYEYLIYSWNYGSELDGVIGKDKSIAESEFKRRIKEALSQDDRINNVDNFIFKYNGDSVFVEFTVFSIYGEFTESVVR >NC_017299|2694256:2737597|2697078_2697846_-|WP_014521307.1|DBSCAN-SWA MLYNLNPGHTLSGGDIGTRGINGLKEEVLTRQLVGEIDKELRNRGHSTNICRVDYAPTLQESLNKQVALCNSVDADLNICIHFNTTVGGYGSEVYTYNGKYLIEADRVLKELNKLGFRNRGIKEQPLALIKRTKAKTIYIEVCFIDSSGDVAILNKYGMSGIAKAIVNGVLGTSSNVTPSKPSTDNNGWTNLDGKTGTINTPSGVNVREKKSTSSKILGTLVNGAKVRLYRKEGDWIHIYYPPHGGYIYEKYIKY >NC_017299|2694256:2737597|2710202_2710373_-|WP_014521326.1|DBSCAN-SWA MADKEQEIKFTKEQIVNSKQFTVIEIDVLKALLKDEQYSMDEVKKILEEFNKKEVK >NC_017299|2694256:2737597|2724387_2724537_-|WP_014521344.1|DBSCAN-SWA MKSKKDKFMEYVDLRLREKKYKDKLLKSNIKDIQIKGMEKTTRRKVGQF >NC_017299|2694256:2737597|2731205_2731535_-|WP_014521352.1|DBSCAN-SWA MNKEKWQEEADELVDAILDLKEKGKRNKEDLDSLKMELVDLLESKNVNEFVGKNGKANFVNFEREGLVKENVVETVDGVNKGRIKNINMRDLTKDIKVHFINVRGYLGD >NC_017299|2694256:2737597|2717861_2719271_-|WP_014521337.1|terminase|DBSCAN-SWA MDKELVQLGAKIELARRKFFFYCNLKAPNFYKQDREYLVELCNEFQEFLSSDEEVMIVNEPPRHGKSRTAGLFVEWVLGNNQNGKIMTGSYNETLSTMFSKNVRNSIQEEKADKYKPVFSDVFPEVRIKHGDGAMNLWSLEGGYNNYLATSPTGTATGFGASLLIIDDLIKNAEEAYNEAVLEKHWDWFTNTMLSRLEEGGKIIIIMTRWASGDLAGRALEYYKEQGIKVKHISMKALIDKEKKQMLCPEVLSYRSYKNKVKAMGEDIASANYQQEPIDLKGRLYSDFKKYKYIPKDNNGNPLFTRIKAYIDTADEGSDYLCCIVYGEYNKEAYVLDVLYTKEPMEVTETATAKMLYDNGVNIADIESNNGGRGFARSVERILKEKFNSNKTKVKWFHQSKNKKARILSNATWVMDHIYYPINWRDKWPEYYKAMNKYQREGKNKHDDAPDATTGVAENVGKNKSISFD >NC_017299|2694256:2737597|2710362_2710794_-|WP_014521327.1|DBSCAN-SWA MTNINDLRIGINQTLDKEFPNINIYGEEIKQGFEEPCFFIKVLSSGQDKEINVRYKKNISFNIHYFSDKEDLNDDCNDMVDKLYEVLEYVKVNNSLYRSNKMTHEVIDGVLHFMLQFNYHVIKEIEKAPKMNKLKQEVYLNGR >NC_017299|2694256:2737597|2708422_2708887_-|WP_014521324.1|tail|DBSCAN-SWA MGFLKAGDTISGQEARAFLTVDGRNEELFYAKKLESKVEKKKTEVKTLGKRGEQHKAAGWSGSGTLTVYYVTSLFRELMIKYMKTGVDTYFDMSVTNEDPTSSIGKQTTVLKDCNLDEVSMAMFDVESEVLEEDMGFTFDDVDLLDKFGKPVLG >NC_017299|2694256:2737597|2711675_2712020_-|WP_041926696.1|head,tail|DBSCAN-SWA MTPLEKLKKLLGIALDDDSKDFLLEFALEDVEQIIKGYCHIKEIPDALNTTILKMAMDMYRNENLGEEESTLGSISSISEGDTSVSYRSSIAEFKDSLIKDYKAQLNKYRKLVW >NC_017299|2694256:2737597|2713129_2713699_-|WP_014521331.1|DBSCAN-SWA MPKLNEILGEAYSQISEELQTKYKDVDLVDSSIYVAKDKFNALNEQLKTANTTITDLKKSNKDNEDLQTKVTDYETKVKDYEKKIQDMQFNYALEGALKSANVRNTKAVKALLNLEGIKLEGESLIGLNEQIEAIKKSDSYLFTEEQKPQFSGIKPTDNSIKDPVPKDTSKMSYTELCNYLEENPNAQI >NC_017299|2694256:2737597|2731835_2732651_-|WP_014521354.1|DBSCAN-SWA MNKLQLKVLENKPAEVHFNFDEISNYLDSTLNKYQGIIVTEETIKDGKKVIADLRKGKKSLDEFRKKTKKELTKSVTEFENQCKELNRKFDEVINPINQQAEQFEIKRKEEKKIEVEKVIKIVCELKHIEDLPLDEKYLNKSMSLKAIREDLISVANQMLLKQANHKKNISLIEGRIDLANAKYGVTMVKEPYVSMLEHEDIDTILNKILEDGESLKNKIDDTPKLVTPVVQAPKKNEEIFVDTYEIEGTEKQLDMLEDFLNKNNYKWSIK >NC_017299|2694256:2737597|2704244_2704925_-|WP_014521320.1|DBSCAN-SWA MDYKIYLGINNGEEGFVLPVLPEKIEFDEDGNNKTYDIINLGEINTINKPKLMEISFESFFPKHKGPYVSSEQLFEPSFYIAKIREWRDKKQKIRFIFTGSPLEINDLFTIENFKPSEEGGEVGDVHYSIELKRYKNYAAKKVVIVTPKTAATNQSVKKVITNSKAARPSNTNKPKTHTVTDNDTLWHIAKRYLGNGNKWPQIHDLNKDKIKDPNVIHAGQVLRLP >NC_017299|2694256:2737597|2724639_2725623_-|WP_014521169.1|DBSCAN-SWA MKILLVNVDSKFNLAIRRMYNYFKDNNEVKMIDLKLDGYPNRKKKIVDATGYDKVYSSNIFEINQDRFEIIGCNNIIYGGIGSVDPNLKLPIEIENTEPFYYEYEDTSYGFITRGCIRNCFFCKVPKYEGKLKVYNSLESIIKHKKVKFLDNNILAYDKHMEVFKYLIENNIRCEFNQGLDFRLINEDNAKLLSELNYMGEYIFAFDNPKYQPLLEKQLKIIKKYIPKEWKVKFYIYQNKDMNIGLLIKRVEWCRKNKCLPYFMRDINCWDSKERNFYIDYAAYCNQPSFFKSMDFETFLYKRHKKIERIKESLKIYNDNLVCKYAI >NC_017299|2694256:2737597|2727416_2727605_-|WP_014521346.1|DBSCAN-SWA MIKINSVEDIVKYSKYIPISALLDIDKRIADWLASGGKEDAPYVKQQFKYAENVVNLFRGDN >NC_017299|2694256:2737597|2732651_2733752_-|WP_014521355.1|DBSCAN-SWA MIICQKSKLQDWCEHFKTYYPEYNTFIYSKTREIPSNSVVIINYDLVWRRPKLSQIENFTLMLDESSMIKNPTSKRTKFILKLKAENVILLSGTPCGGKYEELHTQCKLLGWNISKKLYWQQYIKFINMDVGGFKVPKVVGYKNVERLKQKLHDHGSIFMKTEEVFDLPEQVEISILVENTKEYKKFKKDRLITINNTELVGDTSLTKMLYLRQLASQYNPNKLSSLKDSLESTEDRVIIFYNFTEEMKQIKEVCGRLEKPVSIVNGQTKDLENYKTKDNAVVLVQYQAGAMGLNLQLSNKIVYYSLPLASELFEQSKKRTHRIGQTRTCMYWYLITKNSIEEQIFETLKERKDFTDKLFEELEEI >NC_017299|2694256:2737597|2730409_2731213_-|WP_014521351.1|DBSCAN-SWA MIKVIKINDSLNVSFDYDADIVSKVKTIPGRKYNPNSKSWDMPLQAIHKLKELFSDLDIAEDVDQDYRAPKYDFRQELESINYKPLKIFVEWCLKQLPDYFYEVAASSTGKYHPAYALGEGGLVRHTIAAIRIAEELFRCETIQEFEFREKNIIRVALLLHDGVKHGTDGSEYTVAAHPIEVVKYLEDRYFEVPEETLPDEVIEVMECDLWEDIASCIKSHMGQWNTDYKTSEEILPKPQTEMQKFTHLCDYLASRKMLEVNFNVEG >NC_017299|2694256:2737597|2712039_2713107_-|WP_014521330.1|DBSCAN-SWA MAKFDSKSFNPQAFGAYVERAPKLKKNELLKSRALKGNAEIKNAFSSQTGTAYAVLPMYGRIDGAALNYDGQTDITATSTTTFERGVVVVGRAKAWVESDFSEDITGGVNFMDNVGNQVGEYWDDIDQGTLLSILKGIYSMTGAKNLEFVNNHTLDITTLADDKNVVGPTTLNTAIQKSSGDNKSKFTLAIMHSAVATNLENLKLLSYLKYTDETGIERELQLATWNGRTVLIDDSMPVEEVPKTGDIEAYTKYTTYVLGDGAFDYENIGAKVPYEMSRDPKTNGGQDTLYSRQRKCFAPYGISYIKKSQITLSPTDEELANGANWELVNDGGSGSAKQYIDHKAIAIARIISRG >NC_017299|2694256:2737597|2707174_2707753_-|WP_014521322.1|DBSCAN-SWA MKKILSTIFIGVFLLTMSGCGQEVSTETASKNNTEKKAQTSKKDDKKDIIDKGKVNEIKDYCEFTVIDTKFGKRINPPNPKNMYTYYEAKEPGTVYFDTVIDVKSLLTEGKRSDEFLSVKVIYDNKYEYKTFSAIEKDEGTNFTYTNITPIEPLKKGMIHFIAEVPEEIEKDNKSLVVLINANNKEFKYVVR >NC_017299|2694256:2737597|2704925_2707085_-|WP_014521321.1|DBSCAN-SWA MATVSTALKMFDQMTRPLQQVTQALNLTISAMDQMNNAANKDIRITNSLNTARGAIQRASAGLQELANTQDKSRNSQEQLNNSFNKGSNEANGLTSKVKNLIGAYLGFQAVKKGIDLTIGGGARLEQQLITISGMLGNKDVGKAFFGSLNKYANESVYGLKEFNTITRSFIQFTKNTDKLMDLNKTAEKLAFLDPTQGLEGAGFALKEALGGDFMSLKSRFGFGKADAEILKASKSMDEFISKFDELLAKKGASDKALEEFNQSAVAQLNNLKSNIETAFAQASETALEVLKPLLSRINEGFKNGSFEGFFNGISVGLDIIVNLTMEAMDIITSLSQTFIDNWSIISPIIWGIVFAMIAYNATMGIAWLTTIQTTIAKIAHTIASWAETAAILALIIAQDGLNAALLACPLTWIIIAIIILIALFYGAVAAVNHFAGTSVSATGIIAGSFMVALAFIGNLFVTLYNLVVDIIALFYNHFTAFAEFFANVFNDPIGSIIRLFAAMADEVLGILKSIASAIDTIFGSNLANAVGNWQNGLQGAVDKLVGKPKIQFQKMDSSAMHLDRFEYGKAYDSGYGVGKNIGDKFDLGNIFNKGNIPDMGKMPDMAAWNKAQGPGTLGTAGDDGKNKGGRSPSGNKGLKDANNHLKNIDDKIDISNEHLEMMRDLAEMESIQNFVTLTPTVQVTTGDIKEEADINKIISKIENYMENELLNSAEGVYA >NC_017299|2694256:2737597|2695970_2696117_+|WP_080019262.1|transposase|DBSCAN-SWA MGIDLIQNHFNTREELFKAVSEYIYWYNNERFQTVLKNRTPIEARSAA >NC_017299|2694256:2737597|2720333_2720771_-|WP_014521340.1|DBSCAN-SWA MNYYKKTENLLNDYIKIKSEIDNLQIEIEDIKLEYKGVGAMSYEEKSTSTNAFNSNVENEIINKEKLLEKLNYKLNKKIRLIKKIDNAINVLNDTEKKVIKMKCFEGLQYKQIGQVLNIDHNYACEVKRKAINKIIDLVFIKEKL >NC_017299|2694256:2737597|2695373_2695589_+|WP_148265697.1|transposase|DBSCAN-SWA MDICNKILEIYNTSKLVYGYRRVKVALRRKYNMIVNHKKVRRLMRLLGIQSIIRKKKFKYSTPKNLIQDKY >NC_017299|2694256:2737597|2734757_2735201_+|WP_014521359.1|DBSCAN-SWA MFGKNIKRIRELKGLGVNELSRLSGVNASYISAMERGEKENPTITTLKKLADTLEVTVDELIKEDSITHEKLKEWDNKYTDQIKEESTLYETGEFKTAEAAMKFILQQPSIMGFGGFDASKMSDQDIIDFANELLNIIKMLGPKYNK >NC_017299|2694256:2737597|2714625_2716416_-|WP_014521335.1|capsid|DBSCAN-SWA MRSKDYWKKRSEVVAGKQFKKVDNYILSTHLEYMEALSSIQKDIEVFYSRFSQNNEISLQEARRLLNSNELHEFKIDLKEFTRKAKDNKNLQWERELNNVSYKVRVTRLQALQTQMRNQIENLYTKQQNDTTNILSGIYEDTYYRNIFEVHKGLGIGINFAKLDTNTINKVITEPWHGDNYSSRIWNNKEKLIIELQTNLTQSFIRGDSIDKTSKRIAERMSVAKNRARTLVNTESANIISKSTFNSYIGSGVVKEYEILATLDLHTSKICRSLDGKIFKISEKEIGVNAPPFHPNCRTTIIPYFSDAIDEERIARDSEGEIYYVDGNMNYGQWYKENVNDNSGKKCHDIKSENNLQNTIKNVSKQLNINEFTNEMNQYYKNGNEKVLMVHENQMNKLRYSEGNASYHLFGGISLERPNKMINRRNKLGNGYIGTLFHETGHGEDFKFFKDSVGNIDKYMKNSLPMSSSYYYMKDATKKDKRMLAKLINNEECNDLKKYIRQNGKMNESLSDICVGITNGKLTGSGGHTAKYFKDKGKVQAETFANLTTIYTKGDKETIALLEKYFPNTNKEYFNLVEDMIKENYDNLLKKLTVTK >NC_017299|2694256:2737597|2714398_2714593_-|WP_014521334.1|DBSCAN-SWA MNDVSTHGVQRIKAAIFKFSGDFRIADIVTEALIGNGYDIDIEPINDEFHIPQGEKINVYTVKR >NC_017299|2694256:2737597|2734338_2734536_-|WP_014521358.1|DBSCAN-SWA MNNIKKIRKKGKISIYRIAEETGLTPSYINNLENGYKTNPTKDVMDKIATALGQTVPEIFYPKDE >NC_017299|2694256:2737597|2719263_2719857_-|WP_014521338.1|terminase|DBSCAN-SWA MKLTPKQKIFCDEYLVDLNATRAYKTAYKNIKKDETAAVNGNRLLRNAKVKEYIDKRMKDREKRTEITQDFVLKELYAIAKSNGSNYAEVVKKSYMKPVYDEQGNKIGEEEVFYKDVEIKETKDLTTNEKKAITAIKNTKFGISVETADKVKALELLGRHLGMFKDKVEVNGNMKVNNPFEDLTTDQLLKLAGVEDG >NC_017299|2694256:2737597|2723580_2723862_-|WP_041926698.1|DBSCAN-SWA MGQTLKKYERHQEICDELNKIYKAKNHDYGDSFGETYKKLGIISAVTRITDKVNRLQSLCTKDALVDESIKDTLMDCANYCIMTLIELEGEDN >NC_017299|2694256:2737597|2731539_2731836_-|WP_014521353.1|DBSCAN-SWA MAAEKKFENEIKNFLSELPKTWFYKNWSGPYSKSGIPDIIACVDGHFVGIEVKAPNGRASELQKRNIRLIQESGGVGYILYPKDFLQFKKDMKELIRG >NC_017299|2694256:2737597|2700796_2701423_-|WP_014521315.1|DBSCAN-SWA MKKKLIDFLPPQISDIEEFKNIMATENIELELIEKGQQRILKENFIDTATEYGIKHRETLFKIRADLVNDTLEFRKLRIKNRKMDKMPITHRSLEYKLKTLFGEGNYKVEVLNDEYILKVEISTFDWSMFNEIIDNFRYIIPCNMMLSSTLVQKISTSIYYASAITSGEEITVYPWMPKDITSKGKVNIAMGSNTGVENITIYPRKEA >NC_017299|2694256:2737597|2696193_2696439_-|WP_014521305.1|DBSCAN-SWA MKKMVISLLIGLVIGASTRFVGIANAVEAAEDNGKENGYYMYCLDKAKPVWVELNKVEKGEKFLYLSNPKNNKVIKLVKIN >NC_017299|2694256:2737597|2694929_2695238_+|WP_014520407.1|DBSCAN-SWA MAKKTKTYSKELRLKAVRMYIEEGLGSTAIAKKLGVTTYKQVLLWVRRYNELGLDGLEERRGKSQGILKGRPQKSNLSLEEENFKLRAEVEYLKKLMQIGRV >NC_017299|2694256:2737597|2728435_2730232_-|WP_014521349.1|DBSCAN-SWA MQYSHSRVESFKGCPYKYKLRYIDKLKTIPTQDANNALICGNTIHTGAEKNLKAALEFYKSNYYVLTDLHINEIIKFEYLIPRLKELLLDINIYAQEYLINTKRFKGIVDLITKNDDGTVDVFDFKYSNAIEHYMESPQLHIYKYFMEQKGFKVRKLGFIFIPKISIRQKKEEDLYQFRKRLLQELKASEIQIAEVLYNPNKVIEFMDSIIDTTEVKEYKKNPTNLCSWCEYEEYCLKGYDYMILPKCERRDVKKINKKKLWIYGPSMSGKTTMLDDAPNPLNLNTDGNIEFVTMQYIKLADKVWWEGRIQKKKFSWEFFIEAIEELEKKDNDYKTIIIDLAEDAYEMCRLYKYDELGITHESDDAFRAWDKVRMEFLSTMRRFFNLEYENLVIVSHEDKSKDITKKTGDKITAIRPNITEKIANKLAGMVDIVARVVVDGDNRTLNFKSDEVVFGGGRLKGITKTSISLSWDELMKVYDEANAGKKEPKKEEVPKEDKPSRRSKREGESESPMVHDVLKESGVASMANKEEKPTRRRSKKEETKVEDKKEEEVKETTLEEVNEPKEEPTEEPKEDKPIEETKEEKPKRRRRRKADEE >NC_017299|2694256:2737597|2699073_2699235_-|WP_014521312.1|DBSCAN-SWA MEVNMVIVRICAERITNNGLNPKTQKTYILDDVTNTDYRKAIEDYILQNTPEV >NC_017299|2694256:2737597|2735818_2737597_+|WP_014521361.1|DBSCAN-SWA MKITLLYYIKKFNIYCNRYLSQQINISVDIIGFYQFKNVTNSVTDVLKRGDNLDRICIYLRKSRADEELEKTIGVGETLSKHRKALLKFAKEKKLNIMEIKEEIVSADSIFFRPKMIELLKEVENNQYTGVLVMDIQRLGRGDTEDQGIIARIFKESHTKIITPMKTYDLDDDLDEDYFEFESFMGRKEYKMIKKRMQGGRVRSVEDGNYIATNPPFGYDIHWINKSRTLKFNSKESEIVKLIFKLYTEGNGAGTISNYLNSLGYKTKFGNNFSNSSIIFILKNPVYIGKITWKKKDIRKSKDPHKVKDTRTRDKSEWIIADGKHEPIIDEKIWNKAQEILNNKYHIPYKIANGPANPLAGVVICSKCNSKMVMRKYGKKLPHLICNNKECNNKSARFDYIEKAVLEGLDEYLKNYKVNVKANNKTSDIEPYEQQSNALNKELILLNEQKLKLFDFLEREIYTEEIFLERSKNLDERINTTTLAINKIKKILDNEKKKNNKNDIVKFEKILEGYKKTNDIQKKNELMKSLVFKIEYKKEQHQRNDGLLYIYFLSFCVRCISYLTQFISFFVYPYRILEIYLTFSFFIISYEH >NC_017299|2694256:2737597|2733911_2734082_-|WP_003355976.1|DBSCAN-SWA MLKRLLAERGVILTKELSDMVIADIKFNKIRFNKCTSIEELLIITERCNKALIKCA >NC_017299|2694256:2737597|2725722_2727417_-|WP_014521345.1|DBSCAN-SWA MLFYDFEIFKHDWLVVIKDTDTKKTHTIVNNVKELRNFYETNKDNIWCGYNSRSYDQWILKAIMAGFNPKELNDHIIVDHKPAWKFSSTLFKIQLYNYDVMTSFHGLKQLEGFMGNDIRETTVSFDIDRKLTEEELQEVIFYCNHDVEQTIEVFINRIEEFEAHMGLIKNFKLPLKHISKTKAQLSAIILGANKQDREDEFEINIVPTIKINKYREILNWYKNPLNRDYKKSLEIEVAGVPHIFGWGGLHGARDKYMGEGIFINSDVGSFYPSLMIQYDFLSRNVRDKSKYKEIYDYRMQLKREGKKKEQQPYKIVLNSTYGASKDKYNNLFDPLQANNVCINGQLMLLDLIEKVIEGVLGAKLIQSNTDGVMWKLESEKDIETYKFICEEWCNRTRMTLDHDHIKKVVQKDVNNYLIVMENGKIKSKGAYVKSLNKLDYDLPIVNQALMDYFIEGITPEETILSCNHLKEFQKVVKISSKYLYGYHGNTKLDERVLRVFASRSRSDAGVFKVKIEGGTREKIASTPLRCFIDNSDISDKTVPRKLDKQWYIDMAWKRIKDFIG >NC_017299|2694256:2737597|2696455_2696644_-|WP_014521306.1|DBSCAN-SWA MDENKNLQTEANKKWQEKNRERTRYLRNRSTSRGFIKKQATTEDLKELKELIKEREDLLKQE >NC_017299|2694256:2737597|2701403_2702498_-|WP_014521316.1|plate|DBSCAN-SWA MFENQTEEVILDRMMNKISNDLDKREGSIIYNALAPAAQEVAKMYSDMDYFLKCTFASPDMPDELLDLRVAEEGLKREKATYAIKKGYFYNEENELIDIPLNSRFSIEDFNFIAVEKISTGLYKMQCETTGIEGNSIIGPLIPIEYIEELSIATLGELIMPGEDVESNESLYDRYIEHLNEKPYGGNIADYKINTRAIEGVGTVKVFPIWNGGGTVKIVFLDSDYSVPTTELIDKVQTILDPVQNKGKGFGVAPVGHAVTVLGAKDIEITIETNILLKRGLTIGQVQEDIKKIINEYLKQLRKQWHEEDNTIVRISQIEARILNVEGVADLFNTKINDKEENLTLGTEEVPMFKEVVLSEKEIN >NC_017299|2694256:2737597|2702911_2703256_-|WP_014521318.1|DBSCAN-SWA MGMIDTIKKASMGAVGAGKPVEITFGEVINAEYLKIKVDQKLILDRDFFIIPESLIRYEIDLKHTHTYINNSIESNLNTSLDKLLIREGLKQGDKVLLLRIQGGQQYVILDKVV >NC_017299|2694256:2737597|2721137_2721317_-|WP_041349352.1|DBSCAN-SWA MEMRLFKKDNEAWTRFKIPTKELNSISALAIKMFAKEPTKVSSRFTYYEIKGDYLNGKF >NC_017299|2694256:2737597|2694256_2694490_+|WP_014521301.1|DBSCAN-SWA MLKAIRKHKGIKQKDLANRLGVSQSYLSKLENYSIYEVTVTIDIIKSLAIELNICPIAVFLYFLNVKIFCPFSCEKT >NC_017299|2694256:2737597|2694564_2694843_+|WP_014521302.1|DBSCAN-SWA MFGDRLKELREEKEFTQEELGKFLNVSRQTISGYESGAIEPSISNLVKIANIFNVSLDYLLCRTKERYNLNLENKKNKELLLDIIKVMEKYK >NC_017299|2694256:2737597|2708890_2710201_-|WP_014521325.1|tail|DBSCAN-SWA MAGGTWERQNKIRPGAYINFKSKKQGQTPIGERGIATLPLELPWGPEKEVLTIHADDDLSKVLGINIADESALLIREVLKKAKTLLLYRLNEGTKATAALEGLTINAKCTGTKGNNITVVIQNSIDFVGSFEVITIFEGNKVDKQLVKNIEDLKSNDYVDFKGTGELKTTAGLPLKGGVDGTVTNQCYTDYLSTIEPYEFHAIGIPTKDPTIKAVATTFIKRLKEDGRQVQVVLENYPEADTENVISVKNGVILSDNTVIKSNQAIAFVTGATAGANVNQSNTYLEYPGAIDVDVKYTSREIEEALLNGEIVFTISNRKVVIEQDINTFKSFTEDKRKDYRKNRVIRTLFEVNNGSRLLWETNYIGKGDNGEDGRNLYKKDVIKFLESLQGIGALENVVPEDVEIKRGQDKDSVVARMGVQPIDAMEKLYMDVEVE >NC_017299|2694256:2737597|2716405_2717848_-|WP_014521336.1|portal|DBSCAN-SWA MIFIDKILNSGSNSVMSLEEIIKEEIKEWNSSQARQLMLDGERYYKGDTDILKRKRMAIGEDGELEEVKNLANNKLVHQFVRKLADQKVGYLLSKPLSVQTDNETYKNVLDDIFNKSFMRLLKNLGKDAINKGVAWAQIYYNSDGELRFKRLPSEEIIPLWKDSEHTKLDALIRVYEIIVYEGKTKKTVQKVEYWDTKQVLRYVNDNGKLILDVEAPEDEGHFSMVDDKGNKESFTWSKVPFVYFKYNDEEQPLIKFVKSLVDDYDRNKSDNSNNLEDLPNSIYVLKDYDGENLGEFRRNMSIYRAVKVTGDGGVETRNLEINVEAYKTHIEQTRKDIYEFGRGVDTQSDKFGNSPSGIALKFLYNDLDMDCNIIETEFQASLEYLLWFVNQHLINTGQGDYTGENVEFIFNRDTLINETDSINNCQNSVGIISDETIVANHPWATKDELEKIKKQKEERELMYPNFPLEEIPEDEENEE >NC_017299|2694256:2737597|2697888_2698083_-|WP_014521308.1|DBSCAN-SWA MKFLEQFLQIKKIIALLTTIVFCILSTKGNLSSTEFLSVFTLIIGFYFGQSSARQAVKESKEQE >NC_017299|2694256:2737597|2713719_2713983_-|WP_014521332.1|DBSCAN-SWA MAKYKKKPVIVEAVQYTGDVNTTEIEDMSFHEAYMNGIIREEEDNLLIKTLEGTMVVNKGDYIIKGVNGEFYPCKPDIFKKTYELVE >NC_017299|2694256:2737597|2713999_2714368_-|WP_014521333.1|DBSCAN-SWA MKKLNTIQKKGKLNDVYVLDEKGNGESNHVYMICKKDKDILDSVLVDINFQKGPRKEGSSTNGILDTDLLEIVRHRLQGFQEGPYSSRENACALTHIEEALMWLNRRVEDRIERDVLGTSNK >NC_017299|2694256:2737597|2695666_2695981_+|WP_014521304.1|DBSCAN-SWA MVNHIIEPIFLAIMDLHNNEIISYKLSISLGIEFVRDTLIEAFSGKKANDLRKLIIHSDQGVHYRSLIYKNLIKEIKLLKVCLGKEIATIMHALKTSLAILNRN |
60 | Clostridium_phage(60.47%) | tail,head,plate,transposase,terminase,capsid,portal | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_8 |
3084153 : 3093732
Sequences of DBSCAN-SWA_8
Nucleotide sequences of DBSCAN-SWA_8 >NC_017299|3084153:3093732|DBSCAN-SWA TCTAGTGTTTAAAATGTCTTATTCCTGTAAATACCATAGAAATCCCTTTTTCATTACATACCTTTATAGATTCTTCATCTCTTATAGAACCGCCTGGTTGAATTATAGCTTTTATTCCCCATTTTGCAGCTTCTTCTGCTACATCTCCAAATGGGAAAAAAGCATCTGAAGCTAAAACTACGCCATCTCCAGCTCTATCTAATGCTTCCTTTGCTGCCCATATTCTATTTACTTGGCCTCCCCCAATACCTTTTGCCATACCATCTTTAACTACTACAATAGCGTTGGACTTCACATATTTAACTACTTTCATACCAAATATAAGATCTTTCATTTCTTGCTCTGTTGGGGATTTTTCTGTAACTACTTTTGTATCTTCTAATAATTTATTATCACTCTTTTGTACTAATATTCCTCCATCTACCTTTGCCATATCTTTTCCTTCTGTAGATTTTTCTTCACATTTTATAACCCTTAAATTTTTCTTGTTTTTTAAGACTTCTAAAGCATCTTCATCAAAATCTGGTGCTACAACTATTTCTAAAAATATTTTTGCAAGATTTTCTGCTGTTTCCTTATCTACTTTTCTATTAAAAGCAACTATGCCACCAAATATAGATATAGGATCACATTCATAGGCCTTAGTATAAGCTTCCTGTACAGTATCCCCTATAGCCACACCACAAGGTGTATTATGTTTTAATGCACAACAAGCCACCTCTTCAAATTCACAAACGGTTTTCCACGCTATATCCATATCCTTTATATTATTGTAGGATAATTCTTTTCCATTTAACTTTTCAAAATTTTTCATAGGATATTTTCCAACAGTAGATGTGTAATAAGCTGCTGTTTGATGAGGATTTTCTCCATATCTTAAATCCATGTTCTTTTTATAGGATAGAGTTAAATATTCTGGATATTCCTCTTCTAATAAGAAATTACTTATAGCTGCATCATAGGCTGACATTAGATTGAAAACTTTTCCTGCTAATTTTTTTCTAGTTTGTATATTAACCTGATTATTTTCTTTTATCTCATTTATGACATTTTCATAATCCTTAGTATCTGTTAGTACTACTACATCTTTAAAATTTTTAGCTGCTGCTCTTATCATAGTAGGTCCACCAATGTCTATAAACTCTACTTTTTCATCAAAACTTAAATTTTCTTCTACTTTATTAAAGAAAGGATATAAATTCACTACTACCATATCTATAGGGTTTATGCCCTTTTCTTCTATTACCCTCATATGCTCTTCATTATCTCTTATAGCTAATATGCCTCCATGAATTAAAGGATTTAATGTTTTTACTCTTCCATCTAACATTTCTGGGAAACCTGTTACCTCTTCTATATCTATTACTTTTACTCCATTTTCTTTTAAATGTTTATAAGTTCCACCTGTAGATATTATTTCTACATCTCTACTTTCTAAAAACTTTGCCAAATCTAAAATTCCTGTTTTATCAAATACACTTATTAATGCTCTTTTTATCACTTAAACTCCCCCAGTTTCAATATTTTTTATTATCTTATTTATCTGTCATAAGTAACTGCCACCAATATACCTTCTTTCAAAGAAAACATATAAGTGGCACTATTTCAATTTACAAACTACAATTTTTTATATTTCAATAAATTTAATCTACTCTAAACACATTTTTCTATTAGTTTCATTTATATTAATAGTAATTTTTTCATTATTATAAATTTAGTATGTTTTAATAAAAACTTTTCTTCCTTGTAATTTTACTTTTTCTTCACTTATAAGTTTTATAGCTTCTGGTAATGCCTCATGTTCTTTTTCTAGAACTCTTTTTTGCAATATTTCTGCTGTATCTTCTGCAAAAACTGGTACAGATTTTTGTATTATTATAGGTCCACTGTCCGTACCTTCATCTACAAAATGAACAGTACACCCAGATATTTTTACTCCGTATTCTAATGCTTTTTGGTGCACTTTTATACCATACATTCCATCTCCACAAAAGCTTGGTATTAATGAAGGATGGATGTTTATTATCTTATTTTCAAATTTATTTATTAAATCCCCACTTAATATAGAAAGCCATCCTGCTAAAACTATTAAATCTACTTTTCCATATAAACATTCAAATATTTTATTAGACAAATTGTTTTTATATATTTTTCTATCTAAAGTTAAAGTTTTAATCCCCTTTTTCTCTGCTCTTTCTACACCATAAATATCAGGTCTATCCCCTATAACCATTTCTATCTTGCAATTTTTTATATATCCCTCTTCTATTTTATCTATTATAGATTGAAGATTGCTTCCTCCTCCTGAAACAAGCACTGCAATTTTAAACATCTTATTCTCCTTTAATTTAAAGAAAATTTTTCATATATATTCTATAAATAATTAATTCCCCAATTAATTATTTTAAAGCTCTTATCTATAAACTAATTTTTATTATAATTCTTTTAGCACTTTTTTTTAAATTAGTTCAACAGACTTATCTCCTTTTTTAACATATCCTATTTTATAACCCTTTTCTCCCATTTCTATCAGGTCTTTTATTATGTTTTCCCCATCTTTTTCATTTACACATAGTACAAAACCGATACCCATATTAAAAGTATTGTACATGTGATTTTCTTCTACTCCTAAACTCATTAAATGGTTAAATATATTTGGCAATGGATAAGATTTTTTATTTATAACTGCTGTAAAATCCTCTTTAAACATTCTAGGAATATTTTCATAAAAACCTCCTCCAGTTACATGAGCCATACCTTTTATATTATATTTTTCTAAAAGTTTCATTACAGGTTTTACATATATTTTTGTAGGAGTTAAAAGAGTATTTCCTATTTTATTTCCTTCAAAATCTTTATGTAAATCTTCTACTAATTTTCTTATAAGAGAATATCCGTTGCTATGAGGTCCTGAAGATGCTATACCTATTAATATATCCCCATCTTCTATTTTACTTCCATCTATTATTTCATCTTTTTCTGCTATACCTACAGCAAAACCAGCTATATCATATTCCCCATCTCTATAAAAGCCTGGCATTTCTGCTGTTTCTCCACCTATTAGAGCACATTCACTTTGGATACAACCATTGCTAACCCCTTCTACAAGCTGAGCTGCAACTTCTGCTTCCAATTTCCCACAAGCTATATAATCTAAGAAAAATAACGGCTTAGCACCATGACATAATATATCATTTATGCACATAGCTACGCAGTCTATTCCCACTGTATTATATTTTTTCATTCTAAAGGCTATATCTAATTTAGTTCCAACTCCATCTGTACCTGATACTAATACAGGATTTTTATATTTAGGAAGTTCAAACATTCCTGCAAAACTTCCTAAATTATTTAATACTCCCTTTGTAAAAGTTTTGGAAGCATGTTTTTTTATAAGATCTACAGATTTGTAACCTTCCTCTATGTTAACCCCAGCTTCTTTGTAAGATACCATGAATAACATTCCCTTCTTTAAATTATTAGTTATTCTACCAATAAAAAAACTATATTAAGTTATTTTAACTTTAGGATCATGAAAAAATAATCGATTAAATATGAATCGTATATTTAGTGTCAAACAAAGAAATAAATTTTTTCTACCTAAAGCTAAAACAACTTAAATCCTCTATTCCAAACTATCTTTAGGCATTTCTATAGGTGCAGATATAGGATATATACCATTAAAACATCCCAAGCAAAAACCTTTATCTTTATTAAGTGTTTCTACTAAGCCTTCCATACTTATATAAGCTAGACTATCTGCTCCTATTTTTTCTCTTATTTCTTCTACTTCTGAGTGAGCACCTATTAAATCTTTTCTATAAGGAGTATCTATTCCAAAATAACAAGGATATTTAACCACTGGAGATGATACTCTAAAATGAACTTCCTTAGCTCCAGCTTTTCTTAATATTTGTACTAATCTTTTACTAGTAGTTCCTCTTACTATGGAATCATCTATTATTACTACTCTTTTTCCTTCTACATTTATTTTAAGTGAATTTAGTTTTACAGATACAGCTTTTTCTCTTAATTCTTGAGAAGGTGCTATAAAAGTTCTTCCTACATATTTATTTTTTATAAATCCTATACCATAAGGTATTCCTGAAGCTTCAGCATATCCTACTGCAGCTGGTATACCTGAATCTGGAACTCCTATAACTATATCTGCCTCTACTGGATATTCTTCATAGAGTTTTCTTCCCGCTCTAACCCTTGATTCATAAACATTTATACCATCCATAGCGCTATCTGGTCTTGCAAAATATATATATTCAAAAGCACAGGTATGACATTTCGTTTTTTCTGCAAACTTAATTGAATTTATTCCACTTTCATCTATAATAACTATTTCCCCAGGTTCTATATCTCTTATAAACTCTCCACCTACACAATCAAAAGCACAACTTTCTGAGCTTAGTAAATAATCATCCCCAATTTTCCCCAGGCACATAGGTCTTATACCATGAGGATCACGTGCTCCTATTAACTTATCTTCTGTAAGTATAACAATAGCATAGGAACCTTTAATTGCTTGTATTGCATCTACTACTGCTTTATCTATACCTTTTTTAGCGCTTCTTGCTATTAAATTTAATAATACCTCTGTATCTATAGAAGTTTGAAAAATACATCCACCATCTTCTAAAAGTTCTCTTATAACTGCTGCATTAACTAAATTACCATTATGGGCTATGGCAATAGAGCCTAATTTATAAGTACCTACTATAGGTTGTGCATTATCTGATTTACTAGCTCCTGTAGTGGAATATCTAACATGCCCTATAGCAGAATTTCCTCTTAATCCTTCTATAGTTTCTTTGCTAAAAACATCTGATACAAGACCCATCCCCTTATGATATTTAAACTTTTCTCCATCAGATACTACTATTCCTGCACTTTCTTGTCCCCTATGTTGAAGAGCATATAATCCGTAATAAGTTATTTCTGCTGACTTTGATTCATTATCTTTAGAAAATACTCCAAATACCCCACATTCTTCTTTAAACTTATCTCCTTCTAAATCAAAGGGCATATTTTCATTTAAATCATCTAACATATAGCACATACTCATTTTTACTCCCCACTTATTTTCTATTTTTAAAGTTTAATCTTCTTTTAGATTATCCCAAGCTGCTGCAAAAATAATTTTAAACTATAACAATTTATTTATTGACTCTTTTCAATATTTCCATATAAGCTTCTTTTACATTTCCCATGTCTCTTCTAAATCTATCTTTATCTAACTTTTCTCCTGTGCTTTTATCCCATAATCTACAAGTATCTGGGGATATTTCATCTGCTAAAAGGAGCTCACCATTAAATCTTCCTATTTCTATTTTAAAATCAACTAAATTTATTCCTTGCTCATCAAAGAATTCTTTTAATGTATCATTTACTTTTTCTGCTATAGAATACATTTCTTTTAGTTCTTCAAAGGTTGTAAGTCCTATAGCCACTGCATGATAGTCATTTATAAGAGGGTCATTTAAATCATCATTTTTATAACTTATTTCAAATACAGTAGTATCTAATTTTCTACCTTCTGAAAGACCTAATCTTTTTGCCATACTTCCTGCTGCTATATTTCTAACTATAACTTCTAGTGGAACTATTTCTACTTTTTTGCAAAGCTGTTCTCTTTCATTTATCTTTTCTATAAAATGTGTTTTTACGCCCTTTTTTTCTAAAAGTTCAAATAACATTGCCGTTATAGAGTTATTCATAACTCCCTTATCTTCAATAGTTCCTTTCTTTTCCCCATTAAAAGCTGTGGCATCATCTTTATAATACACAACAACTGTATCCTTATCATCCGTTCTGAATATTTTTTTAGCCTTTCCTTCATATAACATATCTTTCTTTTCCATTATAACTCCACTCCCTCTTTGTTATCATTTATAAATTTTTCTTTCATATCTTTTCTATATTTTATAAGTTTTTCTCTTAACTTTTCATACTTTAAAGATAATATTTGTACCGCAAGCATTCCTGCGTTATAACTATTATTTATACCTACTGTAGCTACAGGTATAGATTTAGGCATTTGAACTATAGATAAAAGTGAATCCATTCCTCCAACTGCAGCTTCTATAGGCACTCCTATAACCGGAAGAACCGTATGAGAAGCTATAACCCCAGGTAAATGTGCTGCAAGACCTGCCCCAGCAATTATACATTCATAACCTTCCTTTTCTAAATCTTCAATTGTTTCCATCAACTTTTCTGGTACTCTGTGCGCTGAAAGTATGTAAGCTTTATATTCTATACTAAACTCTTTTAAAGCTTTAGCCGCTCCCTTCATTTTATCAGTGTCAGATTTACTTCCAAAAATAATAGCTACTTTCATGTACTAGACCTCCTTATATTTAAATATATAAAAAATTCCGCTAAGATTTCTATGGAGAATCCTAAAGCGGAACTTAAGCGCACTGCAAAAGCATAGCTAAGATTCATCCATAGACAGGGAATTTATGGTTCCCTCGTAGAGACTCTCAAACCTTATTATTGAGATTATATGGATGATATATTCATTTGTTTTATGTACTCATGGTAACATATAATTCTTAATAAATCAACATACTTTTATAAAAACATTCGTATTTTATTGGTATTTTATTTATTTTTTCATAATATCATTCGTAATGTAACGAACAATTAGTTAGGTGAGAAATTCACTCAAATATATATTATATTGTAATAGAAATAATTTATAATAGAAATTTATTTCTGAAAATAAAATAGATTTAATTTTCAGATATCAAGCAAAATAATATATGGTAATAAACATATGAATAAGTTTTAACATTTTCTAATCTTTTTAAATCGGGAGCTTTTGTTATTAATCAAAGAATGAAGGTGAAAAACCGATGGCCAAGCCACACATAGCTTTTCCACCGGGTAAAAAATTTTTAATGAAAAAATTTGAGATTCCTAGTCAAGTAAGTTATCTATCTATACATGTATTTTTTATATTTGCATGGTTAAAATTAAATCTATTTTAAAATAGTTTCATGCAAAAAAATTATTTTTTCCTTCTATAAGCAGTATCCTCAAGTGGAAGCTTTTTTCTAAAGTTTCCATCAAATTTATAGTAAGCACCTTGAGCTGCTGGGGCTGTTGGTATGGTTGTAATTTCTCCTATTCCTTTTGCACCATAAGCTAAATCATTAGTATTCTTTTCAATTATTGTTGTTTCAATTTCTGGTATATCAGTAGCTCTAAACAAACCTAATGTGCCAAACTTAGCAGTTGGGATAGATTTATTTAATGGATAATCTTCTGTAAATGCATACCCAAGTCCCATAACTATTCCACCTTCAATTTGTCCTTCTACATTAGTTAAATTTATAGCTTTTCCCACATCATGTGCTGCAACTACTCTTTCTACTTTTCCATCATCATCAAGAATAACAACTTGTGTTGCATAGCCATAAGCCACGTGACTTACCGGATTCTTTTTATCAGAATTAATAGGATCTGTAATACTTTGATATTCCCCATAAAATTCTTCACCTTCACACTCTTCTAATGATGTAGTTAATAATTTTTCCTTAAGCTTTAATGATGCCATTCTTGTGGCTTCTCCAGTAAATACTGTTTGTCTTGATGCTGTAGTTGTCCCTGAATCTGGTGCAAATTTTGTATCTGGTAAATCTAAAATTATCTGTTCTGGTAATAGACCTATTGTTTCACATATTATTTGTGTAAGAATTGTTCCAAGACCTTGACCTATGCAAGCTGCACTAGTTCTTATATGAACCTTTCCATCTATTACTATTAAGTTACATCTTCCAATATCCGGTATTCCAACACCAACTCCTGAATTTTTCATACAACAGGCTATTCCTGCACATTTACTCTTTTTATATACATCTTTCACAGCTAATATAGTTTCTTTAATTGCAGTTCCTTTATCAGCAATTTGTCCATTAGGTAGTGCATCTCCAGGTTCTACTGCGTTTTTAAATCTTATTTCCCAAGGAGATATACCAACTTTTTCAGCTAAAAGATTTAAGTTGCACTCTGATCCAAAAACTGATTGTGTTACTCCAAATCCCCTAAAAGCTCCTCCTGGGGGATTGTTAGTATATACAGCGGTACCTTTTATTTTCACATTAGGGCATTTATATGGGCCAGCTGCATGAGTACAAGCTCTTTGAAGTACAGGTCCTCCTAATGATGCATAGGCACCAGTATCTGATATAATATCTGCTTTAAAAGCAGTTAAATTTCCTTTTTCATCACATGCAGTAGTAATTGTCATCTCCATAGCATGTCTTTTAGGATGAATCTTTATACTTTCCTTACGACTTAAAGTTATTTTAACGGGCTTTTTAATAGTCCATGCAAGAAGAGCGGCATGATGTTGTACACTCATATCTTCTTTTCCACCAAAGCCTCCACCCACATATTTGCTAATAGTCCTTACTTTTTCTTTAGGAAGCCCTAAAAGCTCAGAAATCTCTCTCTGCTCATCATATATACCTTGGCTTCCTGTATAAATAATAACTCCATCCCCATCTGGCATAGCTAAAGCACTTTCAGGCTCTAAAAAAGCATGTTCAGTAAAGGGAGTAGAATAATGATTAGTAACCACATATTTAGAATTGGCTATTGCCTCATCTACATCTCCTCTATTAACTTTTTCCACTGTTAAAATATTTCCCTTAGGATGAATTTTAGGAGCATCTTCAGCTATTGCAATATTAGGATTAGAAATAGGTTCTAATTCTTCATATTCTACCTTTATTAAATTAAGTATTTCTTTTAAAGCCTTCTTGCTTTTTGATGCCACTAAAGCCACTGCATCACCAACATACCTTGTTTCTTCTCCTACGGCTATCATTGCTGGCCAATCCTTTACAATATGTCCTATAAGCCTATTTCCTGGGACATCTTCTGCTGTAAGAATAGCTTCAACTTCTGGATGTTTTAAAGCTACACTTATATCAATGCTTTTTACTAAAGCTCTAGGATATTTTGATCTTAAAGCAGAACCATAAACCATTCCTTCTATCTTCATGTCATCTACATATTTTCCTATACCTAAAATTTTATCTTTTGCATCTATTCTTGGAATATTTTCACCTATTTTTCCTTTATATTCTTTCGCAAATGGAAGTTTACCATTTCTAAATGCCTCTGCTGCCATTTCAATGGCTTTTATTATTTTCACATATCCAGTACATCTACATACATTTCCTCTAATAGCAGTTTTAATTTCTTTCTTATTTGGATTTAGATTTTTATCTAAAAGTGCCTTTGCACTTATTATCATCCCTGGAATACAATATCCACACTGTACTGCTCCAGCTTTAGAAAAAGCCCAAGTAAAAACATCCTTTTCAAATTCTGTTAACCCCTCTACAGTCTTAACATCTTTTCCATTCACCTTTGCAGTTGTACATATACAGGCTCTAAGTGCCTTACCATTAACAAGTATCATACAGGCTCCACAGGCTCCTTCTGCACACCCATTTTTTACTGAAGTTAAATCCTCATTATCCCTCAAATATTCAAGTAAATTAATATCCTCTGAAACAGATACATTTCTTTCATTTAATATAAATTCATACAC
Protein sequences of DBSCAN-SWA_8 >NC_017299|3084153:3093732|3086610_3087606_-|WP_014521597.1|DBSCAN-SWA MVSYKEAGVNIEEGYKSVDLIKKHASKTFTKGVLNNLGSFAGMFELPKYKNPVLVSGTDGVGTKLDIAFRMKKYNTVGIDCVAMCINDILCHGAKPLFFLDYIACGKLEAEVAAQLVEGVSNGCIQSECALIGGETAEMPGFYRDGEYDIAGFAVGIAEKDEIIDGSKIEDGDILIGIASSGPHSNGYSLIRKLVEDLHKDFEGNKIGNTLLTPTKIYVKPVMKLLEKYNIKGMAHVTGGGFYENIPRMFKEDFTAVINKKSYPLPNIFNHLMSLGVEENHMYNTFNMGIGFVLCVNEKDGENIIKDLIEMGEKGYKIGYVKKGDKSVELI >NC_017299|3084153:3093732|3091176_3093732_-|WP_014521601.1|DBSCAN-SWA MYEFILNERNVSVSEDINLLEYLRDNEDLTSVKNGCAEGACGACMILVNGKALRACICTTAKVNGKDVKTVEGLTEFEKDVFTWAFSKAGAVQCGYCIPGMIISAKALLDKNLNPNKKEIKTAIRGNVCRCTGYVKIIKAIEMAAEAFRNGKLPFAKEYKGKIGENIPRIDAKDKILGIGKYVDDMKIEGMVYGSALRSKYPRALVKSIDISVALKHPEVEAILTAEDVPGNRLIGHIVKDWPAMIAVGEETRYVGDAVALVASKSKKALKEILNLIKVEYEELEPISNPNIAIAEDAPKIHPKGNILTVEKVNRGDVDEAIANSKYVVTNHYSTPFTEHAFLEPESALAMPDGDGVIIYTGSQGIYDEQREISELLGLPKEKVRTISKYVGGGFGGKEDMSVQHHAALLAWTIKKPVKITLSRKESIKIHPKRHAMEMTITTACDEKGNLTAFKADIISDTGAYASLGGPVLQRACTHAAGPYKCPNVKIKGTAVYTNNPPGGAFRGFGVTQSVFGSECNLNLLAEKVGISPWEIRFKNAVEPGDALPNGQIADKGTAIKETILAVKDVYKKSKCAGIACCMKNSGVGVGIPDIGRCNLIVIDGKVHIRTSAACIGQGLGTILTQIICETIGLLPEQIILDLPDTKFAPDSGTTTASRQTVFTGEATRMASLKLKEKLLTTSLEECEGEEFYGEYQSITDPINSDKKNPVSHVAYGYATQVVILDDDGKVERVVAAHDVGKAINLTNVEGQIEGGIVMGLGYAFTEDYPLNKSIPTAKFGTLGLFRATDIPEIETTIIEKNTNDLAYGAKGIGEITTIPTAPAAQGAYYKFDGNFRKKLPLEDTAYRRKK >NC_017299|3084153:3093732|3089317_3090022_-|WP_014521599.1|DBSCAN-SWA MEKKDMLYEGKAKKIFRTDDKDTVVVYYKDDATAFNGEKKGTIEDKGVMNNSITAMLFELLEKKGVKTHFIEKINEREQLCKKVEIVPLEVIVRNIAAGSMAKRLGLSEGRKLDTTVFEISYKNDDLNDPLINDYHAVAIGLTTFEELKEMYSIAEKVNDTLKEFFDEQGINLVDFKIEIGRFNGELLLADEISPDTCRLWDKSTGEKLDKDRFRRDMGNVKEAYMEILKRVNK >NC_017299|3084153:3093732|3084153_3085653_-|WP_014521595.1|DBSCAN-SWA MIKRALISVFDKTGILDLAKFLESRDVEIISTGGTYKHLKENGVKVIDIEEVTGFPEMLDGRVKTLNPLIHGGILAIRDNEEHMRVIEEKGINPIDMVVVNLYPFFNKVEENLSFDEKVEFIDIGGPTMIRAAAKNFKDVVVLTDTKDYENVINEIKENNQVNIQTRKKLAGKVFNLMSAYDAAISNFLLEEEYPEYLTLSYKKNMDLRYGENPHQTAAYYTSTVGKYPMKNFEKLNGKELSYNNIKDMDIAWKTVCEFEEVACCALKHNTPCGVAIGDTVQEAYTKAYECDPISIFGGIVAFNRKVDKETAENLAKIFLEIVVAPDFDEDALEVLKNKKNLRVIKCEEKSTEGKDMAKVDGGILVQKSDNKLLEDTKVVTEKSPTEQEMKDLIFGMKVVKYVKSNAIVVVKDGMAKGIGGGQVNRIWAAKEALDRAGDGVVLASDAFFPFGDVAEEAAKWGIKAIIQPGGSIRDEESIKVCNEKGISMVFTGIRHFKH >NC_017299|3084153:3093732|3090021_3090501_-|WP_014521600.1|DBSCAN-SWA MKVAIIFGSKSDTDKMKGAAKALKEFSIEYKAYILSAHRVPEKLMETIEDLEKEGYECIIAGAGLAAHLPGVIASHTVLPVIGVPIEAAVGGMDSLLSIVQMPKSIPVATVGINNSYNAGMLAVQILSLKYEKLREKLIKYRKDMKEKFINDNKEGVEL >NC_017299|3084153:3093732|3085866_3086484_-|WP_014521596.1|DBSCAN-SWA MFKIAVLVSGGGSNLQSIIDKIEEGYIKNCKIEMVIGDRPDIYGVERAEKKGIKTLTLDRKIYKNNLSNKIFECLYGKVDLIVLAGWLSILSGDLINKFENKIINIHPSLIPSFCGDGMYGIKVHQKALEYGVKISGCTVHFVDEGTDSGPIIIQKSVPVFAEDTAEILQKRVLEKEHEALPEAIKLISEEKVKLQGRKVFIKTY >NC_017299|3084153:3093732|3087777_3089226_-|WP_014521598.1|DBSCAN-SWA MSMCYMLDDLNENMPFDLEGDKFKEECGVFGVFSKDNESKSAEITYYGLYALQHRGQESAGIVVSDGEKFKYHKGMGLVSDVFSKETIEGLRGNSAIGHVRYSTTGASKSDNAQPIVGTYKLGSIAIAHNGNLVNAAVIRELLEDGGCIFQTSIDTEVLLNLIARSAKKGIDKAVVDAIQAIKGSYAIVILTEDKLIGARDPHGIRPMCLGKIGDDYLLSSESCAFDCVGGEFIRDIEPGEIVIIDESGINSIKFAEKTKCHTCAFEYIYFARPDSAMDGINVYESRVRAGRKLYEEYPVEADIVIGVPDSGIPAAVGYAEASGIPYGIGFIKNKYVGRTFIAPSQELREKAVSVKLNSLKINVEGKRVVIIDDSIVRGTTSKRLVQILRKAGAKEVHFRVSSPVVKYPCYFGIDTPYRKDLIGAHSEVEEIREKIGADSLAYISMEGLVETLNKDKGFCLGCFNGIYPISAPIEMPKDSLE |
7 | Synechococcus_phage(42.86%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|