Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NZ_CP028842 | Clostridium botulinum strain DFPST0029 chromosome, complete genome | 9 crisprs | DEDDh,csa3,DinG,WYL,cas3,cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10,cmr1gr7,cas6,casR | 0 | 11 | 6 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_1 | 1901547-1901764 | Unclear |
NA
Consensus repeat of NZ_CP028842_1
|
3 spacers
spacers of NZ_CP028842_1
>1.1|1901570|43|NZ_CP028842|CRISPRCasFinder CCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTA >1.2|1901636|40|NZ_CP028842|CRISPRCasFinder TATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAG >1.3|1901699|43|NZ_CP028842|CRISPRCasFinder GTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTA |
cas3 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_1
The CRISPR arrays of NZ_CP028842_1 >merge|NZ_CP028842|1|1901547-1901764|CRISPRCasFinder ATAATAATATAGAAGATATATCTCCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTAAAAATAAAGTAAAAGACATATCTTATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAGATAATAAAATAGAAAATATAGAAGTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTAATAATAGTATTAAGGATTTCTTA >NZ_CP028842|1|1|1901547-1901764|CRISPRCasFinder ATAATAATATAGAAGATATATCT CCTATTAATAATATGGAAAAACTAAAGGATATAAATTTATCTA AAAATAAAGTAAAAGACATATCT TATTTAAAGGATTTAAACTTACATCATTTAGATCTAAGAG ATAATAAAATAGAAAATATAGAA GTCTTAAAAGATAAAACATCCTTGCAACATTTGTATTTAGCTA ATAATAGTATTAAGGATTTCTTA
>NZ_CP028842.1|WP_011986369.1|1896053_1900511_+|DUF5050-domain-containing-protein MIRGVFAIFSKKFVAKFLLYSSIVIIPMFNHNYVQAASSKQYETKYNVSLDKVWKIRFSREVDKATLNPENIKILDNQGKEMPIDLSLDVDKHYVKIALKSGTYNGVHYSGKYEKDKKYSLIVKEGLMSEPSKNKKSKNLAYETMMDFNTIGDNEYPGLPIEDGLIVIGDKAYSVGYLSKHSSIANEITSNGNYYIAYISKEYGEKIKQVLGNNTTKGNQERANKILYYAPNGNQYEYEWNEAFGEYKIVLPKAYVDVTPGVINGVVNLAVKQVKAVPGAKYFKLAHSNTIKPIGESISYSMTYPTEKLTILSADETPLATALVDVYLPKTGYVSLSSVNETLGNTAGNISNNGSAAMDLDFYVYYVNSADKNSLYRKTLTGRMDTQISLDKAQYINVIGDWIYYSNYNDNGKIYKMKKDGTKKQILCDDTATYITVSGGVVYYANQSDKGRLYKINTDGTIDGGASNRDPAGKVHGMPVMDDYGNYNKATDQANFINVVGDWIYYSNFSDGHKIYTVNKDGNIRRKVNDEWADGIQIVGAWAYYCSGSGAISKVRVDGTGSVIPLRGTTRKVDKGYHLNIVDGWLYYSNAEDGGKLYRIKEDGSGEKKKLADLATDYINIVGDTMYLISGGKTYTLPLNTDGTIKPTLVTKDNNGNTVVDVKDLNITVAYEDANKTIGELEAKYLPQKVAVFMKDDTVQQLPVDWDIKNRKYNGQGIYTYTGTVLGHGKQIKCTLTIPSEMLNATSIIEVYNNGPKNGSIMIKERSFGPSKQDQELKEKLKLAKRVEIGDVIKVYDNPNSEKPLGNIKVDANNANGPLVKSLDLDMYGRSFWITITRKNKAESKPTEVRQLGAAVLSGDVLDEDGEALGVDGRDFTVKGWNNPSIRDDGFISDTTEIAAQGTKSIYVIPGTGKLNMENQGVIPAGITSANYWNGGNARALLTNYDLLTNDSLKNKLKEGNYSIYVVVGYDGKAEEDVNGFGSPLVIGKTASIPKAMKATEEKIPKAPSVTKQYAKSGDTVKISGVTNEDEIYLAPEGASYIAKDITNKPYKSHDNLFFEDQSKSKEEREKEYEKSGKPSIEDGYQCKLVNGKIPQGVRSGKYKVYMVNAIGSSSPASGEIIVDNEDPVVRLDSAKQEDVIKTVTQNGTTTQETTGQKFKVNFAAFDNSFDNSIKEGITVSMARLDSPKSAIKAQEIKDKGNKTFEVIINDPHANLNDYAIYAEDKAGNIGQVNLKVQDPPANINNISLAIRTSNEGVDLVKSRLVGRTKYMTKDLTRASDNYEVTVDGVKYVLQEEALRNLGTSPSIDAFMNALMQAKQWDIANNKPMEDKPKLSSKVSIYKVNDVIYIEGNDNTPIQIEDKTKIDSDTAIVSNMIGLNPNENNTGENSKNQQYVINVTGTAQKNGKLKVCLAGKCFDINMVAGDSRTNIAAKIKEAINNNTILDSYQYPGTNVESNGSEVRLTRKSPGAVVPTFTVEYFNYDN >NZ_CP028842.1|WP_011986368.1|1894454_1895900_+|DEAD/DEAH-box-helicase MNKLTFENYKLSDEILKSLGKLGYKNPSEVQKQVIPLILKDKDIIVKSETGSGKTAAFSIPICEKLELEEKDPQVLVLTPTRELALQIKEEISSIALYKRLRCTAIFGKQPMSLQKRELKQRVHLVVGTPGRTLDHIERENLNLKKIKYFVLDEADEMLNMGFIDQVEAVIKRLPKNRVTMLFSATIPEKVENLCKKYMNNPENININPENITTGTINQCYYEVEDKDKFYLLQKIIYKEVVDNSIIFCNTREKVDEVLKHMKKKGLNAIGLHGGMEQKDRLETMKKFKEGEFQFLVCTDVAARGIHIENISHVINYEMPYEKESYVHRIGRTGRAGKEGVAITFIEPNKVRFLKDIEDYIEKEIPKRKEPSSEEVAKGKKIFEENIKNRIKTKVPKDNKKQKDITKIYISAGRKKKIRPGDIVGAITSIEGINVDNIGIIDIQDNHSYVDILERKGDIVLKASEDMKIKGKKVRIQRAVK >NZ_CP028842.1|WP_011986367.1|1893439_1894276_+|S1-RNA-binding-domain-containing-protein MIKLGEIQKLEIIREAPMGVYLNSKEDKSENDILLPGKQVPKDAKIGDEVEVFVYRDSEDRMIATINRPKITIGEIATLKVIEKTKMGAFLDWGLERDLFLPFKEQTYGIQEGMECLVYLYIDKSDRLCASMNVYRVLSTESPYKEDDEVKGFIYDIKREIGAFVAVDNEYHGLIPKNELYGKFRYGDIVEARVTKVKEDGKLDLSIRKKAYKQMDEDVDTILEKLNSNGGKLYLNDNSDPRAIKELLNMSKNAFKRAVGRLLKEGKIEFIEKGIKLK >NZ_CP028842.1|WP_011986366.1|1891851_1893117_+|DEAD/DEAH-box-helicase MNNSFDTLNLNPKLVQGLKKLNINIPTEIQAEAIPLAMENKDIIGQSETGTGKTLAYLLPIFEKITTEKREMQAIILAPTHELAMQINNEIKNISSNSNMDVKSMAIIGEANIKRQIEKLKEKPHIIVGSPGRILELIKKKKITAHTVKTIVIDEGDKLLDKNNLKVVKEVIKTTLRERQLMLFSATITESTLNIAKDLMKDSVIVKVKEKNTVNENIKHLYITGEHRERIEILRKLIAATNPKRAIVFINRNEEIELTTLKLQYHKIKAYGIYGAAEKEQRKKALEDFRSGKVQILVSSDLSARGLDVKDVTHIFNLDLPENPKEYLHRVGRTGRASKEGIAISIITEKEKALIRKYEKEFNINIEEKKIYKGTLISSKGERSSQPKSKNKSTSAHKDNNKKKRSSSINKSKNNHKKKKY >NZ_CP028842.1|WP_003403172.1|1890589_1891483_-|chemotaxis-protein-CheV METNILLESGTGEVEIIEFLVNNKHYAINVIKVKEVIEVDNVTKVPQSDPAIEGLILCREKIFPLIDLSYILGQKNTSKKKFKTIICEFNRVSVAFKIDEIVAVHRIGWDKILKPDDIAANPLVIGNILLKDKIILLLDFEKIVTDINPSTGISEERIVNVDYKDRSHIKVFLADDSSLIRKLLKDTLTKAGFKKLTIFDDGKQVLDKLLELVEKKGEDFTEDVQILITDIEMPQMDGHTLTRKVKEHPILKRLPVIIFSSLITKDLKHKGTSVGADEQLSKPDIGELVNIIDNYIE >NZ_CP028842.1|WP_011986365.1|1889595_1890450_+|4Fe-4S-binding-protein MKMISKNEIAKLKGEGFLAQKQEGYFSVRILSRAGNFTSKQIIKLAEIADNYGKGYLGVTTRLATEIPWIRYEDIEAVKKEIVSSGMSHGGTGKRVRPLVSCKGTVCVHGLYDTQKLCGELHDKYFGYELPSKFKITLVGCPNNCAKASINDIGIMGQAYVEFDEEKCKVCGICTKSCRQKAVTVENKKIVYKKDLCVNCGKCATVCPFEAMTIKEQGLQVYLGGRFGREYRMGNRLKGLYKEEEIPALVQKIFDVYSEMGNPGERLAKMIERVGFDKVEEAIL >NZ_CP028842.1|WP_012047671.1|1888566_1889025_+|YbaK/EbsC-family-protein MSLEGVKKQFTDENLNLKILEFDESTATVELAAKALGVEPGQIAKTLAFHVKGENMLIVAKGDARIDNKKFKAYFNGKGKMMAPEVVLEVTGHAIGGVCPFGLENPINIYLDQSLKEFEKVYPAAGNANTAVEVTLDELEGITKGLWIDVCK >NZ_CP028842.1|WP_011986363.1|1886647_1888228_-|ABC-F-family-ATP-binding-cassette-domain-containing-protein MITVTNLSLRYGDKKLFEDVNLKFTPGNCYGVIGANGAGKSTFLKILSGEIEANTGDVSIQPGVRMSILKQDHFKYDEFPVLETVIMGNERLYEIMKEKDAIYAKTPFTDEDGIKASELEGEFADLNGWEAEAEASSLLQGLGIGTELHEKNMKDLSGSEKVKVLLAQALFGNPGVLILDEPTNHLDIKSVNWLEEFLINFEGTVIVVSHDRHFLNKVCTHMADVDFGKIKLYVGNYDFWYESSQLALQMAKDQNKKKEEKIKELQEFIARFSANASKSKQATSRKKLLDKIDLDNIQPSSRKYPYIAFKPERKVGNDILRVEGLTKTIDGTKILDNISFIIGKDDKIAFVGDELSITTLFKIISGELEPDSGEYKWGITITNAYFPKDNSEYFNDVDLNLVDWLRQYSEEKSESYLRGFLGRMLFSGEEALKEVKVLSGGEKVRCMLSKMMLNNANVIILDQPTNHLDLESITALNNGLMDYKSNILFTSHDHQFIQTIANRIIEVSEAKFVDKKVTYDEYLESK >NZ_CP028842.1|WP_011986325.1|1884363_1886367_+|methyl-accepting-chemotaxis-protein MKFKTMKGKMLTYFLSLFLIICIAISFMAYFMSKRMIERKASSLMSEVSRQAVQNIEARLNGTLDSIETVANMPTIKDPKLGWDKKKTILDEEIKLHGHVKMGIVGKDGQSIQTDGTTVNIKDRNYFKETMEGKRTISEPIVSKVDGKVVIIYTVPIKNGNTIMGALTAVREGNDISNISNSIKVGESGGAYLIDSTGTVIAHKNKESVIKRENSIKDAQSNEELKPIAAIEKSMIEGKEGIGQYKYKGAEKYISYSPMKSTGWSLAIYAPKNEILKEVSEITRNIIIVSILGIGIALVCIWFISTQISNNLISMRDSLNIVATGDLTTNVDSKIEKEKDEIGHMARALSKTVLSIGNMINSLKGSSFNIDDKANNLAAISEEFTATTENVSTAIQEVATGATNQAQALTEIVSMLNDFSDKINSTVNNIEEIDGMSKEIDEKANVSNKDMKELLNSIENLTKVFENFETKIWTMESNVQKINEITNLINDIAEKTNLLALNAAIEAARAGESGKGFAVVAEEIRKLAEMSRKSSEDIYTIVNGVLEDTKDMVKSSNEVNEKLNGQRSTADEAMNSFMEISKSVTNMIPKIRNINNSANIIEKNKNEILNKSETIASISQEISASAEEISASSEEMSASSEEVANTAQSLNDMTQDMLDEMNKFKTE >NZ_CP028842.1|WP_011986324.1|1883778_1883988_+|cold-shock-domain-containing-protein MSMHTGTVKWFDNERGYGFIAGNNGKDVYVHSMQIKEKTLNKDLHEGEEVLFDIVEKEKGPIAINVQKL >NZ_CP028842.1|WP_011986371.1|1905394_1906324_+|glucosaminidase-domain-containing-protein MKKATGLILKLMILVLLAFTIFIMFNSLILNKKNERFLPENAMNIYIKAADEVSENKLQVNWKYIAALDGVKNKEDFSKANIEDSKVLGEKFLEISKSTKFKNTNYRLLTLDEVISKMSFTEEEKKNVHKYLDKLNNIYPITPDEYKRQFIDELIPISKELYDEYGILPSVTIGQAILESDWGRSELSKKGNNLFGIKATPSWQGKVLNMETSENYNDKIKDNFRYYSSKEDSIKDYANFLVKNKRYRENKVFRATEYKTQAKAIEKAGYSTKKDKDGNLLYSSLLGKIIREYNLQLIDSKTQEEISKK >NZ_CP028842.1|WP_003403076.1|1906449_1906965_-|ferritin MLSEKLLEALNNQINFEFYSSYIYLAMASYAESEDLAGFANFFRVQAQEEIFHAMKFYDYVNQMGGRVILEKIDQPKAEYKNILECFEDGFNHEKIVTSRIYNLTDIATEEKEHATISLLKWFIDEQVEEENNFNTIIRKLRRAESNPAVLYMLDDELSARVFTPPTNTGA >NZ_CP028842.1|WP_011986372.1|1907126_1907309_+|hypothetical-protein MYSIKYYLRYIKSKVLWETIYDKFFIQETIKKFFINLKKLIILMKKIHINCLNFKKNILK >NZ_CP028842.1|WP_011986373.1|1907369_1908224_+|response-regulator MKDTKVVIVDDSPFSISIIKDILEENGLTVVGEAGNLEEVINVVKDKKPDIVTMDMTLPGTDGIECIKAINKINKNVKVIVISSMMDEEIVKKANKNKVCGYIQKPIDPEELIATIEKVVMKEELFLQLENDYFQIFKESFKDALNKFTKTTAEFSEDTKCTISETSRGMVVVIGIIGNFSGRMILDLSQETANSMVNFMLKREPKDMNEVLNVIGEFSNIVAGNACSMLNRKSKVFGLRIAPPSIFYGKSLNISQSLIKSLSVESNTEFGQIYMNVGFKRGES >NZ_CP028842.1|WP_004450459.1|1908223_1908685_+|chemotaxis-protein-CheX MDAKYINPFIDSFYNVLPQLGFSNVTREDVAIKNNVESLGILINLGIVGDIRGNIVYNIQGENGKKIASKMMMGLPVEELNEMAQSALSELSNMLTANASINFSNIGVNVNISTPTLMYGQDIKIKLNTDKILNIKIVADDIPIDVNIAFEKI >NZ_CP028842.1|WP_011986374.1|1908867_1910226_-|YjiH-family-protein METQKNNKYSFSELFKFICPSLIGFILFIIPISYDGEITIPIAVLSKIVLAGLGSILPQLMGIIICITFICTAITKIFKPKAILENKFFNNLFNVSPVWVLARILGFIFIVSTFFKIGPEWMWSKNTGGLLLYDLLPILFSVFIFAGMLLPLLLDFGLLEFVGALLTKVMRPIFNLPGRSSIDCMASWLGDGTIGVLLTSKQYEEGYYSEREAAVIGTTFSAVSITFSLVVISQVKLAHMFVPFYLTVCLSGIIAAILIPRIPPLSRKPDTYLNGGESKNSEALPEGYTPFTWGLEKAVAKAGSNGDPLNFIRQGLQNVLDMLLGVTPVVMAMGTSALILAEYTPLFKWLGLPFIPLLNLLKIPEAALASQTIVVGFADMFLPSVIAATIQSEMTRFIIACLSVTQLIYMSEVGGLLLGSKIPVSLKDLVIIFLERTLVTLPIITLVAHILF >NZ_CP028842.1|WP_003403080.1|1910963_1911167_+|alpha/beta-type-small-acid-soluble-spore-protein MPSNKNSNNLVVPEAQQGLNQLKMEVANEVGIANYDSMDKGNLTSRQNGYVGGNMVKKMVEAYERNL >NZ_CP028842.1|WP_003363259.1|1911227_1911428_+|alpha/beta-type-small-acid-soluble-spore-protein MANRNSNNLVVPEAKHGLNQLKMEVANEVGIANYDAVDKGNLTSRQNGYVGGNMVRKMVEAYERNL >NZ_CP028842.1|WP_011986375.1|1911631_1911961_-|HesB-like-protein MILVNMSDLAYKEFKNFIKENNVNSNIFRIFLAGNGUGGPVFNIVLDEQTSEDLLSPIGELSFLVHKDLFSEFGGFIIKCAEENGKGGFTIDPIIQSENISCSTCSSCS >NZ_CP028842.1|WP_012047672.1|1912479_1912692_-|hypothetical-protein MKHAKLLIIVYLRRYSLASGLYYGRNRILRLPSLSSLIAYQLIMNINYLAMHNSIFIHSNLSTTCVKKWY |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_2 | 2305986-2306345 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_2
|
5 spacers
spacers of NZ_CP028842_2
>2.1|2306016|36|NZ_CP028842|CRISPRCasFinder,CRT TTATATGGTATTTAAGGTTATAGATAAATTAACTGG >2.2|2306082|35|NZ_CP028842|CRISPRCasFinder,CRT CTTAAATATATAGGTATAGATCAAGACGCTAAAGA >2.3|2306147|36|NZ_CP028842|CRISPRCasFinder,CRT TCTTAACCTTTAATTACATTATATATTATAAGTTCA >2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT ATTTCATCAAATCCGCATCAATAAATGAGATAAACT >2.5|2306279|37|NZ_CP028842|CRISPRCasFinder,CRT TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA |
CRISPR arrays and Neighbor proteins around NZ_CP028842_2
The CRISPR arrays of NZ_CP028842_2 >merge|NZ_CP028842|2|2305986-2306345|CRISPRCasFinder,CRT GTTTAAATACATCCTATGTTAATGTTCAACTTATATGGTATTTAAGGTTATAGATAAATTAACTGGATTTAAATACACCTCATGTTAATGTTCAACCTTAAATATATAGGTATAGATCAAGACGCTAAAGAATTTAAATACATCTCATGTTAATGTTCAACTCTTAACCTTTAATTACATTATATATTATAAGTTCAATTTAAATACATCTTATGTTACTGTTCAACATTTCATCAAATCCGCATCAATAAATGAGATAAACTATTTAAATACATCTCATGTTAATGTTCAACTAAATTATACCTTAATGCTTATCAATATAGTCTTGTAATTTAAATACATCTCATGTTAATGTTCAAC >NZ_CP028842|2|2|2305986-2306345|CRISPRCasFinder GTTTAAATACATCCTATGTTAATGTTCAAC TTATATGGTATTTAAGGTTATAGATAAATTAACTGG ATTTAAATACACCTCATGTTAATGTTCAAC CTTAAATATATAGGTATAGATCAAGACGCTAAAGA ATTTAAATACATCTCATGTTAATGTTCAAC TCTTAACCTTTAATTACATTATATATTATAAGTTCA ATTTAAATACATCTTATGTTACTGTTCAAC ATTTCATCAAATCCGCATCAATAAATGAGATAAACT ATTTAAATACATCTCATGTTAATGTTCAAC TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA ATTTAAATACATCTCATGTTAATGTTCAAC >NZ_CP028842|2|1|2305986-2306345|CRT GTTTAAATACATCCTATGTTAATGTTCAAC TTATATGGTATTTAAGGTTATAGATAAATTAACTGG ATTTAAATACACCTCATGTTAATGTTCAAC CTTAAATATATAGGTATAGATCAAGACGCTAAAGA ATTTAAATACATCTCATGTTAATGTTCAAC TCTTAACCTTTAATTACATTATATATTATAAGTTCA ATTTAAATACATCTTATGTTACTGTTCAAC ATTTCATCAAATCCGCATCAATAAATGAGATAAACT ATTTAAATACATCTCATGTTAATGTTCAAC TAAATTATACCTTAATGCTTATCAATATAGTCTTGTA ATTTAAATACATCTCATGTTAATGTTCAAC
>NZ_CP028842.1|WP_011986659.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NZ_CP028842.1|WP_011986658.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NZ_CP028842.1|WP_011986657.1|2302869_2303604_-|hypothetical-protein MDKFRNMKKSHIALLVIMYMVLMGSFPRFTGWATIFSAIAVGGYFLKNKKDLKGLTRKNKNFIFAGIIILAIIGSLNVAVGNNIQNEKLMADKAKQEQEIKQEEQKKVEEKKLAEEQKRVQEEEAKKKAAEEKRKQEEEAKKKAAEEQKKQEELKRKQEEENKIKAENEQAQAAFAQSTGKGDSNSQSNESQNADDNQNYTVYKTRTGSKYHSSGCRYLKKSCYETTVSQARNEGLTPCSVCNP >NZ_CP028842.1|WP_011986656.1|2302127_2302532_-|membrane-protein MNILMLTCSIAIPVLMILIGILFKCNSYKKIDRTLDLIIPIATFFTGFSERDREHLYKNTNNLASVNRKCSLIWSISGVCTLLLTIISLILNKSDIYNTSVILLEPELLILVIVFISVEYILKRNFNKKISEQY >NZ_CP028842.1|WP_011986655.1|2301176_2301893_-|transaldolase MKYNDLKIKIFADGADLNGMLDAYNKGIVKGFTTNPSLMKKAGITDYKEFAKEVLAKIKDMPVSFEVFSDDLETMEKEAEVLGNLGENVYIKIPVTNTKGESTAPLIKKLSEKGYHLNVTAIFTIDQVKEVVGALKSGVDSIVSVFAGRIADTGEDPVKIMKEASKICKTKEGVELLWASCREFYSIVEADKCGCEIITVTNDVLKKMPNMGKDLKEYSIETVRGFYKDASSLGFSIL >NZ_CP028842.1|WP_011986654.1|2300715_2301153_-|PTS-sugar-transporter-subunit-IIA MLKNYINDQVVEVNVEVKNWEEAVRLGGKLLEEDGAVEHSYIDAMVDTVKNMGPYIVIAPGIAMPHARPEAGAKNIRIGLLKLKNPVNFGNEEHDPVDMVIFLCAVDNKAHIEVLGELVQLIEDDDFLKIVRNASTKKEILDYIK >NZ_CP028842.1|WP_003361919.1|2300402_2300687_-|PTS-sugar-transporter-subunit-IIB MNILTVCGNGIGSSLMLAMKIEEICKENGIAANVESTDFNSAQGKKADLIVTVKELAEQFEGRDVAVVRSYINKKKITEDVLEIIKQKDEELKK >NZ_CP028842.1|WP_003358211.1|2299025_2300390_-|PTS-ascorbate-transporter-subunit-IIC MLGLLQFLRDVLKQPALLMGIMALVGLVALKKPGHKVLTGTLKPILGYLMLGAGADFIVANLEPLGGMIQTGFNITGVVPNNEAIVAVAQKVLGVETMSILVVGLLINLVIARFTKYKYVFLTGHHSFFMACLLSAVLGTSGMKGTELILFGGFLLGAWSAISPAIGQKYTLKVTDGDEIAMGHFGSLAYYVSAWVGSKVGKPEESTENIEIPEKWGFLRDTTISTAITMMVFYIVAAVAAGPEYVSKLSDGMSPILFAIMSSLKFAVGVTIVYNGVRMILGDLIPAFQGIATKIIPDAIPAVDCAVFFPYAPTAVIIGFVSSFIGGIIGMVLLGVAGGVLIIPGLVPHFFCGSTAGIFGNATGGKKGAVIGSFVNGLLITFAPALLLPVLSTLGFKNTTFGDFDFGVLGIIIGKTSNLAGKTGIIIIAMLMLVALIVPNFIKTKSKALNNIEE >NZ_CP028842.1|WP_011986653.1|2296720_2298814_-|transcription-antiterminator MLNKRCSNILQMIVNNEKPITIKEISKKVNKSPRTVRYDLDKIDDYLTEIEFPKLERKSNLGISLDLKDEEIKKLFKIIGKINNYDYVLSQKERVFYIIYELLNKSEFVTINMLSDRMMVSRSTIINDLIEVKKWLSENKITLESSKGQGIKILGRERDLRRAAVKLFFQSMDSINFFNVTTLKLFNDIDIDFIRNTIKIAEEQMETSFSDDAFNNLVIHIAIAIKRIELSKDIIMDSEELKNLRKTAEYAIASGIAKMLEDRFKISIPEDEIGYITIHILGSNTSTLENIVKDDWIYLHLIVFKLIENVENITGINFSKDNKLFDSLAQHIRPAIYRLKHDIKVKNPLIEEIKEKYSYIFESIEEGVKFIEEDIGDSVNQEEIGYLTLHFMASIERSKNKKHRKPNVLIVCATGIGTSKFISNKLKSIFDINIIDTISSHTMEKILKYNKNIDLIVTTIPLKVKGIKCIEVNTFLTEKNISELGLYFAKFIRNNSEECNGSCKYEERDKVQEILNIVKENCTIHDYYKLRNKLALYLNIKDPTLTEDHKPSLKELLKPDFIKLNEEAENWEDAVRKSGEILMNNGCVKESYIDAMVNTVKNMGPYIVIAPGIAMPHAAPEDGVLKTGISMLTLKDPISFGNSEHDPVSVIISICSIDKVNHMKALKELMSIMDQEDFISKVKNIKASSEIDSILYS >NZ_CP028842.1|WP_011986652.1|2296041_2296395_-|zinc-ribbon-domain-containing-protein MIIWGWGKVTKKIIGAVFQRTCNYCNTDEVWNLCVVRTWFTLFFIPIIPYKKQYCIACPKCWSYIELTQEEFEKIKIDITSSSNNINEKVVTDNIKYAGKTETQINYLKQMEEYANK >NZ_CP028842.1|WP_012047734.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NZ_CP028842.1|WP_011986661.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NZ_CP028842.1|WP_079995891.1|2308101_2308464_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NZ_CP028842.1|WP_021134338.1|2308547_2308721_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NZ_CP028842.1|WP_011986662.1|2308794_2310201_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NZ_CP028842.1|WP_011986663.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NZ_CP028842.1|WP_011986664.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NZ_CP028842.1|WP_011986665.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NZ_CP028842.1|WP_011986666.1|2314726_2316724_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NZ_CP028842.1|WP_011986667.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_3 | 2312982-2313277 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_3
|
4 spacers
spacers of NZ_CP028842_3
>3.1|2313012|36|NZ_CP028842|CRISPRCasFinder,CRT TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT >3.2|2313078|36|NZ_CP028842|CRISPRCasFinder,CRT ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT >3.3|2313144|38|NZ_CP028842|CRISPRCasFinder,CRT TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA >3.4|2313212|35|NZ_CP028842|CRISPRCasFinder,CRT GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA >3.5|2313014|36|NZ_CP028842|PILER-CR TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT >3.6|2313080|36|NZ_CP028842|PILER-CR ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT >3.7|2313146|38|NZ_CP028842|PILER-CR TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_3
The CRISPR arrays of NZ_CP028842_3 >merge|NZ_CP028842|3|2312982-2313277|CRISPRCasFinder,CRT,PILER-CR GCTTAAGTACATCTCATGTTAATGTTCAACTGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTTATTTAAATACATCTCATGTTAATGTTCAACATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGTATTTAAATACATCTCATGTTAATGTTCAACTTAAGTATGATAATATAAAACCTTGGTAAATATATTAAATTTAAATACATTTCATGTTAATGTTCAACGAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGAATTTAAATACATCTCATGTTAATGTTCAACC >NZ_CP028842|3|3|2312982-2313277|CRISPRCasFinder GCTTAAGTACATCTCATGTTAATGTTCAAC TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT ATTTAAATACATCTCATGTTAATGTTCAAC ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT ATTTAAATACATCTCATGTTAATGTTCAAC TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA ATTTAAATACATTTCATGTTAATGTTCAAC GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA ATTTAAATACATCTCATGTTAATGTTCAACC >NZ_CP028842|3|2|2312982-2313276|CRT GCTTAAGTACATCTCATGTTAATGTTCAAC TGAACTTATGAAAGAACTAGAGTGTGGAGAACCCTT ATTTAAATACATCTCATGTTAATGTTCAAC ATTAGGTTTGCCACCACATTCCGTTACTGCAGTAGT ATTTAAATACATCTCATGTTAATGTTCAAC TTAAGTATGATAATATAAAACCTTGGTAAATATATTAA ATTTAAATACATTTCATGTTAATGTTCAAC GAAAAAGGTAAATTAGCAAGTGCAAAAGATTTAGA ATTTAAATACATCTCATGTTAATGTTCAAC >NZ_CP028842|3|1|2312984-2313211|PILER-CR TTAAGTACATCTCATGTTAATGTTCAACTG AACTTATGAAAGAACTAGAGTGTGGAGAACCCTTAT TTAAATACATCTCATGTTAATGTTCAACAT TAGGTTTGCCACCACATTCCGTTACTGCAGTAGTAT TTAAATACATCTCATGTTAATGTTCAACTT AAGTATGATAATATAAAACCTTGGTAAATATATTAAAT TTAAATACATTTCATGTTAATGTTCAAC
>NZ_CP028842.1|WP_011986665.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NZ_CP028842.1|WP_011986664.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NZ_CP028842.1|WP_011986663.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NZ_CP028842.1|WP_011986662.1|2308794_2310201_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NZ_CP028842.1|WP_021134338.1|2308547_2308721_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NZ_CP028842.1|WP_079995891.1|2308101_2308464_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NZ_CP028842.1|WP_011986661.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NZ_CP028842.1|WP_012047734.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NZ_CP028842.1|WP_011986659.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NZ_CP028842.1|WP_011986658.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NZ_CP028842.1|WP_011986666.1|2314726_2316724_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NZ_CP028842.1|WP_011986667.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NZ_CP028842.1|WP_011986668.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NZ_CP028842.1|WP_012047736.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >NZ_CP028842.1|WP_011986669.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NZ_CP028842.1|WP_011986670.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NZ_CP028842.1|WP_011986671.1|2319405_2319840_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NZ_CP028842.1|WP_011986672.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NZ_CP028842.1|WP_011986673.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NZ_CP028842.1|WP_011986674.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_4 | 2313557-2313653 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_4
|
1 spacers
spacers of NZ_CP028842_4
>4.1|2313587|36|NZ_CP028842|CRISPRCasFinder ATGTTGTAAATGTTGTGGTATAACAGAATGTAAATA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_4
The CRISPR arrays of NZ_CP028842_4 >merge|NZ_CP028842|4|2313557-2313653|CRISPRCasFinder GCTTAAATACATCTTATGTTATTGTTCAACATGTTGTAAATGTTGTGGTATAACAGAATGTAAATAATTTAAATACATCTCATGTTAATGTTCAACC >NZ_CP028842|4|4|2313557-2313653|CRISPRCasFinder GCTTAAATACATCTTATGTTATTGTTCAAC ATGTTGTAAATGTTGTGGTATAACAGAATGTAAATA ATTTAAATACATCTCATGTTAATGTTCAACC
>NZ_CP028842.1|WP_011986665.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NZ_CP028842.1|WP_011986664.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NZ_CP028842.1|WP_011986663.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NZ_CP028842.1|WP_011986662.1|2308794_2310201_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NZ_CP028842.1|WP_021134338.1|2308547_2308721_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NZ_CP028842.1|WP_079995891.1|2308101_2308464_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NZ_CP028842.1|WP_011986661.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NZ_CP028842.1|WP_012047734.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NZ_CP028842.1|WP_011986659.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NZ_CP028842.1|WP_011986658.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NZ_CP028842.1|WP_011986666.1|2314726_2316724_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NZ_CP028842.1|WP_011986667.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NZ_CP028842.1|WP_011986668.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NZ_CP028842.1|WP_012047736.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >NZ_CP028842.1|WP_011986669.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NZ_CP028842.1|WP_011986670.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NZ_CP028842.1|WP_011986671.1|2319405_2319840_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NZ_CP028842.1|WP_011986672.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NZ_CP028842.1|WP_011986673.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NZ_CP028842.1|WP_011986674.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_5 | 2313770-2314067 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_5
|
4 spacers
spacers of NZ_CP028842_5
>5.1|2313801|36|NZ_CP028842|CRT TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTA >5.2|2313868|35|NZ_CP028842|CRT AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAA >5.3|2313934|37|NZ_CP028842|CRT ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAA >5.4|2314002|34|NZ_CP028842|CRT GATAAAACCAATCTATTAACCTGTATAACTGCCT >5.5|2313801|37|NZ_CP028842|CRISPRCasFinder TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTAT >5.6|2313868|36|NZ_CP028842|CRISPRCasFinder AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAA >5.7|2313934|38|NZ_CP028842|CRISPRCasFinder ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAAT >5.8|2314002|35|NZ_CP028842|CRISPRCasFinder GATAAAACCAATCTATTAACCTGTATAACTGCCTT |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_5
The CRISPR arrays of NZ_CP028842_5 >merge|NZ_CP028842|5|2313770-2314067|CRT,CRISPRCasFinder TGCTTAAATACATATCATGTTAAGGTTCAACTGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTATATTTAAATACATTCTATATTACTGTTCAACAAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAAATTTAAATACATCTTATGTTACTGTTCAACACGAATAGGGGGTGATAAATATTGTTATTTGGACAAATATTTAAATACATCCTATGTTACTGTTCAACGATAAAACCAATCTATTAACCTGTATAACTGCCTTATTTAAATACATCCTATGTTACTGTTCAACC >NZ_CP028842|5|3|2313770-2314066|CRT TGCTTAAATACATATCATGTTAAGGTTCAAC TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTA TATTTAAATACATTCTATATTACTGTTCAAC AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAA AATTTAAATACATCTTATGTTACTGTTCAAC ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAA TATTTAAATACATCCTATGTTACTGTTCAAC GATAAAACCAATCTATTAACCTGTATAACTGCCT TATTTAAATACATCCTATGTTACTGTTCAAC >NZ_CP028842|5|5|2313771-2314067|CRISPRCasFinder GCTTAAATACATATCATGTTAAGGTTCAAC TGGTAAGCAAAGCATATCTTCAGAGTTGTTTATCTAT ATTTAAATACATTCTATATTACTGTTCAAC AAATGTAGATAGGCAATTTTTTAAAGAAAATAGAAA ATTTAAATACATCTTATGTTACTGTTCAAC ACGAATAGGGGGTGATAAATATTGTTATTTGGACAAAT ATTTAAATACATCCTATGTTACTGTTCAAC GATAAAACCAATCTATTAACCTGTATAACTGCCTT ATTTAAATACATCCTATGTTACTGTTCAACC
>NZ_CP028842.1|WP_011986665.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NZ_CP028842.1|WP_011986664.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NZ_CP028842.1|WP_011986663.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NZ_CP028842.1|WP_011986662.1|2308794_2310201_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NZ_CP028842.1|WP_021134338.1|2308547_2308721_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NZ_CP028842.1|WP_079995891.1|2308101_2308464_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NZ_CP028842.1|WP_011986661.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NZ_CP028842.1|WP_012047734.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NZ_CP028842.1|WP_011986659.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NZ_CP028842.1|WP_011986658.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NZ_CP028842.1|WP_011986666.1|2314726_2316724_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NZ_CP028842.1|WP_011986667.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NZ_CP028842.1|WP_011986668.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NZ_CP028842.1|WP_012047736.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >NZ_CP028842.1|WP_011986669.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NZ_CP028842.1|WP_011986670.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NZ_CP028842.1|WP_011986671.1|2319405_2319840_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NZ_CP028842.1|WP_011986672.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NZ_CP028842.1|WP_011986673.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NZ_CP028842.1|WP_011986674.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_6 | 2314341-2314436 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_6
|
1 spacers
spacers of NZ_CP028842_6
>6.1|2314371|36|NZ_CP028842|CRISPRCasFinder AGGTGGAGTATTAGAAGATATGCATCTATATAAAGA |
cmr6gr7,cmr5gr11,cmr4gr7,cmr3gr5,cas10 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_6
The CRISPR arrays of NZ_CP028842_6 >merge|NZ_CP028842|6|2314341-2314436|CRISPRCasFinder GCTTAAATACATCTCATGTTAATGTTCAACAGGTGGAGTATTAGAAGATATGCATCTATATAAAGAATTTAAATACATCCTATGTTATTGTTCAAT >NZ_CP028842|6|6|2314341-2314436|CRISPRCasFinder GCTTAAATACATCTCATGTTAATGTTCAAC AGGTGGAGTATTAGAAGATATGCATCTATATAAAGA ATTTAAATACATCCTATGTTATTGTTCAAT
>NZ_CP028842.1|WP_011986665.1|2312241_2312763_+|DUF4825-domain-containing-protein MKNKLKILIPLVLILSLNLIGCGVNSEKKSKENVKNSSKIETYDLIKHKGTYVGDNSSVGSIIKNLPANEYSAGFSLQTTKEPYEITVNYKTNKNLGEENYNKFWKDKKVEELLEKNAVILLSLIPNAEIIKFNVENIGEESYKYDRKNLGQKYGNLKDLFKDNDSLNKFLNN >NZ_CP028842.1|WP_011986664.1|2311050_2311941_-|AraC-family-transcriptional-regulator MNYRKDIENCIEYIEEHIRESLTVNQITKEIGYSSYHFCRVFSFLKGMPLMEYVRKRKLSLSTIDLLEGEKIIDVAFKWGFETPSSFARAFRKEFGCSPSQYIKKMKFYYKSENNLILSKFMNDPYIIKKEAFKVAGYGIKTNVADSKYTKDVASFWSNYNGENLESKLYKILSPLKHGEVGLCIPCSDSGDITYLLGVIVEDFSKVTSDMITVEVPKAQYAVFTTNPVNTVESKDQREFAKIIKESWKYIFDEWFKNNDYEYDEEKLDFEFYDERCHLRPDTVMDIYVPIKKLER >NZ_CP028842.1|WP_011986663.1|2310303_2311044_-|class-I-SAM-dependent-methyltransferase MINYYGSLCTVMYELLHPHAPEDELQFYLQYAKKEMKILEPLCGSGRFLVPFLERGFNITGFDMSEEMLRELYKKAPEAKVFESSIEKFSPKEKYDYIFITSGSFSLFLDEDIAFNVLVKMKEALAPKGKFVFAAETTANIIPDREKYLKNCAVKTKEGYDIIFKSKSFYDKHKKILSTPSLYELYDGDKLLRKEEMDFRIKLYDFGELDKLILKAGFKGSHVFSDLNRRESIDKNTETFLYECYI >NZ_CP028842.1|WP_011986662.1|2308794_2310201_+|peptide-MFS-transporter MSEKKQKHPIGLWLVNISIALQSYAAYAVVSILILFLTADVSKNGLGLSVPKAAAIIGLYQGINYMGSLVGGYITDKWLGIQKSLILGCFLTACGYLALFFAKPNIGSVWLGLIILIVAGAFFKAQISSLVGELYSKNELSKKDAAYSIFYMFINIGAFFGPIIAGLISDKWFAKVAADGEIAAYGYKYIFLMCTLIMIFIGIFIWIVSPKWLGEIGKYPVSKDKKTSTESVSTKSTEKAKAQPLTQLEKNRIKAMIVMFVFVIIFWSAWDQTATSFSLLANKLVNRTIGGFTMPVPWLTSINAIFCVVLSPIIANIWLKLGNSKKGDLSVPTKMGLGMILTGIAFLTLILGISTLGGVLDGSKQMNILFIIVAYFLLTVGELCLSPIGMAMFNKLAPAKYGSLAMGAWYLSFFFSSIISGKLAGFTDTLGYTQIFGLISGIVIVFGVILILLRNGLLKLMSLDELDK >NZ_CP028842.1|WP_021134338.1|2308547_2308721_+|M24-family-metallopeptidase MNIHETPTGFRWQYRPKETHRFEEGIVITDEPGIYIAGSHGIRIENELIVCKGENNG >NZ_CP028842.1|WP_079995891.1|2308101_2308464_+|aminopeptidase-P-family-N-terminal-domain-containing-protein MDEVHLFINKNKLSDEIKLSLKKNAALFIHPYNKIYKEVKKFTNSDVILVHPDRMNYALYNNIGKEVITEISSSNKLDAFPAEQGRFICPSFEPISSFGEHVTIVRCILLMENSFMIVTV >NZ_CP028842.1|WP_011986661.1|2307172_2307787_-|sugar-O-acetyltransferase MNQKDRMLAGLPYKACLDGLPEERMANKKKIYEYNHCFPDEHEKIHKLIRDILGKAGADIHIEAPFYCDYGKNIQVGDNFFANYNCTILDVGKVIIGNNVQFAPNVSLYTAGHPIHPDSRNSGYEYGMGITIGDNVWLGGNVVVNPGVHIGNNVVIGSGSVVTKDIPDNVIAMGNPCKVIREITEEDRKYYYKNYEFDVDDYKE >NZ_CP028842.1|WP_012047734.1|2306635_2307130_-|hypothetical-protein MILAIECFIACVLFTLMILPSLYKEPIKHIMSYPTEIRKRVGSLPQYKDVIQKKEKKHLTVKIIAVFMFAIILAVVAYFSGAKSFSKAYIHVFTLFFAVNIYDTIVLDIGLFCHSKKTRIPGTEDMDKEYRSPWHHIKGAGIGTIIGAVVALLSGGMVHFISII >NZ_CP028842.1|WP_011986659.1|2305364_2305853_+|lipoprotein MISKKIIAFIAMTIMMISLLIGCSNNTMDKVYNDNSKIASVYDTFGLDKSDEIIESGIYKGKLKLSGSGTIWTYESSSDFDLKVPYILSVKSGKAKIVLMSPDNTVVNLVENTDKATMKGTTSLTLPIKKGNNRIKLVGYKKADIDIELHIEKGTFEKISFN >NZ_CP028842.1|WP_011986658.1|2303943_2304537_-|glycerol-3-phosphate-acyltransferase MIIIITSVISFLLGSIPTGYFITKKACGIDIRTKGSGNIGSTNVKRIVGTKISIITQIIDVLKGIIPVVLGISLSKIVKLPVSTDTYLSIIAIAAILGHDYTPFLKFKGGKGVNTTLGVFIFIAPIPTLTGLAVYFILGLFIRIVSIRSISIGITIPIMCIITKLPIQIIISTTIACILMIIRHKDNLVRLIRGEEK >NZ_CP028842.1|WP_011986666.1|2314726_2316724_-|FAD-dependent-oxidoreductase MKDKYKVLYDPIKIGKLEIKNRYVLAPMGPGGMCNADGSFNKRGIEFYVERAKGGTGLIMTGVTMVENNIEKCALPSMPCPTINPLNFITTGNEMTERVHAYGSKIFLQLSAGFGRVSIPSIVGKVAVAPSKIPHRFLPGVTCRELTTEEVKEYVKAFGESAEIAKKAGFDGVEIHAVHEGYLLDQFAISFFNHRTDEYGGSLENRLRFACEVVQEIKKRCGQDFPVSLRYSIKSFIKDWCKGGLPDEEFEEKGRDIPEGIEAAKILVAAGYDALNGDVGSYDSWYWSHPPMYQKKGLYLPYNEILKKVVDVPIITAGRMEDPELSSDAILSGKTDMIALGRPLLADAEIPNKIFEDKYDKVRPCLSCQEGCMGRLQNFATVSCAVNPACGREKEYGLKKAEQIKKVLIVGGGVAGMEAARVAAIRGHKVTLIEKNGYLGGNIVPGGVPDFKDDDRALVKWYECILKDLGVEIKLNVDASKENIKEFGADEVLLATGSSPRTLTIEGADKVYSAEDVLMERKNVGEKVIVIGGGLVGCETALWLKQQGKEVTIVEMQNDILQVGGPLCHANHDMLVDLIKFNKIDVKTSSYISKKTDEGFVLNTNGEESIINADSAVVAIGYLSEKDLYSEVRFDIPNARLIGDANKVQNIMYAIWSAYEVAKNI >NZ_CP028842.1|WP_011986667.1|2316820_2317618_-|MerR-family-transcriptional-regulator MRYSITDLAEILGYTTSAIHYFEKEHLIEVEKGKNGHRYYNVVDVFRLLSYTKYRSMEIPMKTIIAQFGGEENNYKLIEKRETMYQLEALKRAQYYMNLADAIEEHLVSIRRIEELLNKYEFAKSPEVTIMCDDECGWLSKKRSSQKIIHEWVKAMPTVQLGVFDSRMGISNFGYLVKTKKREELELPLGLHAKEIKSTSCIHTIVMADEDFTQQPQKVFKKASEFAIKKGLEIGEIAWGKILLVEVEKGAKLHPYIELWISIKI >NZ_CP028842.1|WP_011986668.1|2317665_2317959_-|hypothetical-protein MNFFTLNILIGAMAFIINKINNMSQDIDPFEAFNDIEENLEEIDNEKVTNFVNGLINASMSNPSIGYFFMFLIYMTPILNLLLLIKGIVNYFNKAEG >NZ_CP028842.1|WP_012047736.1|2317972_2318113_-|hypothetical-protein MLRIGFCHVFIRIKVLRDFYLICYKVHILYNHLDGFRYIINIKGYT >NZ_CP028842.1|WP_011986669.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NZ_CP028842.1|WP_011986670.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NZ_CP028842.1|WP_011986671.1|2319405_2319840_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NZ_CP028842.1|WP_011986672.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NZ_CP028842.1|WP_011986673.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NZ_CP028842.1|WP_011986674.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_7 | 2327923-2328081 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_7
|
2 spacers
spacers of NZ_CP028842_7
>7.1|2327953|35|NZ_CP028842|CRISPRCasFinder GGTTACTGGCTTTCTAATACATATAATTAAATTAG >7.2|2328018|33|NZ_CP028842|CRISPRCasFinder CTATATAAAAGCCATTGGGAATTTTGTTTATAC |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_7
The CRISPR arrays of NZ_CP028842_7 >merge|NZ_CP028842|7|2327923-2328081|CRISPRCasFinder ATTTAAATACATCTCATGTTAATGTTCAACGGTTACTGGCTTTCTAATACATATAATTAAATTAGATTTAAATACATCTCATGTTAATGTTCAACCTATATAAAAGCCATTGGGAATTTTGTTTATACATTTAAATACATCTCATGTTAATGTTCAACC >NZ_CP028842|7|7|2327923-2328081|CRISPRCasFinder ATTTAAATACATCTCATGTTAATGTTCAAC GGTTACTGGCTTTCTAATACATATAATTAAATTAG ATTTAAATACATCTCATGTTAATGTTCAAC CTATATAAAAGCCATTGGGAATTTTGTTTATAC ATTTAAATACATCTCATGTTAATGTTCAACC
>NZ_CP028842.1|WP_011986678.1|2326996_2327686_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >NZ_CP028842.1|WP_011986677.1|2326602_2326977_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >NZ_CP028842.1|WP_011986676.1|2324847_2326551_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >NZ_CP028842.1|WP_011986675.1|2323647_2324835_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >NZ_CP028842.1|WP_011986674.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NZ_CP028842.1|WP_011986673.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NZ_CP028842.1|WP_011986672.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NZ_CP028842.1|WP_011986671.1|2319405_2319840_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NZ_CP028842.1|WP_011986670.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NZ_CP028842.1|WP_011986669.1|2318150_2318489_-|hypothetical-protein MDINSITNSLFIGMKIHKPKKETEIIKITDDGFWYGIGEKNKKKVTYDEIEEAVKEIKEKGMLTRQWYKEKFPKISKNNPCNFTTIGGVLVKFKLAEYTMGKYLYKNEIIYK >NZ_CP028842.1|WP_012047737.1|2328478_2328652_+|hypothetical-protein MVLDMLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >NZ_CP028842.1|WP_011986679.1|2329424_2331080_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >NZ_CP028842.1|WP_012047738.1|2331856_2332705_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NZ_CP028842.1|WP_011986681.1|2332995_2333916_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NZ_CP028842.1|WP_011986682.1|2334239_2335733_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NZ_CP028842.1|WP_011986683.1|2336657_2337113_+|staygreen-family-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >NZ_CP028842.1|WP_011986684.1|2337192_2337660_-|helix-turn-helix-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >NZ_CP028842.1|WP_011986685.1|2337827_2338874_-|alpha/beta-hydrolase MEVNGVKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NZ_CP028842.1|WP_011986686.1|2339124_2340477_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >NZ_CP028842.1|WP_011986687.1|2340685_2342029_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_8 | 2328985-2329214 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_8
|
3 spacers
spacers of NZ_CP028842_8
>8.1|2329015|36|NZ_CP028842|CRISPRCasFinder AATAGAGTATTCAGATGAATATAAATTCTTGGAAGA >8.2|2329081|37|NZ_CP028842|CRISPRCasFinder TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAA >8.3|2329148|36|NZ_CP028842|CRISPRCasFinder CGACCCTATAACAGTTTCAGAAGTAGAACAAAATAT >8.4|2329015|37|NZ_CP028842|CRT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGAA >8.5|2329081|38|NZ_CP028842|CRT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAG >8.6|2329148|37|NZ_CP028842|CRT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATATG >8.7|2329083|36|NZ_CP028842|PILER-CR AGAGGTGATTTTATATGAAAAAGGAAAACATAACAA >8.8|2329150|35|NZ_CP028842|PILER-CR GACCCTATAACAGTTTCAGAAGTAGAACAAAATAT |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11,cmr6gr7 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_8
The CRISPR arrays of NZ_CP028842_8 >merge|NZ_CP028842|8|2328985-2329214|CRISPRCasFinder,CRT,PILER-CR TTTTCAATACATTTAATGTTAATGTTCAATAATAGAGTATTCAGATGAATATAAATTCTTGGAAGAATTTAAATACATCTCATGTTAATGTTCAATTAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAGTTTAAATACATCTCATGTTAATGTTCAATCGACCCTATAACAGTTTCAGAAGTAGAACAAAATATGTTTAAATACATCTCATGTTAATGTTCAATC >NZ_CP028842|8|8|2328985-2329213|CRISPRCasFinder TTTTCAATACATTTAATGTTAATGTTCAAT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGA ATTTAAATACATCTCATGTTAATGTTCAAT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAA GTTTAAATACATCTCATGTTAATGTTCAAT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATAT GTTTAAATACATCTCATGTTAATGTTCAAT >NZ_CP028842|8|4|2328986-2329213|CRT TTTCAATACATTTAATGTTAATGTTCAAT AATAGAGTATTCAGATGAATATAAATTCTTGGAAGAA TTTAAATACATCTCATGTTAATGTTCAAT TAGAGGTGATTTTATATGAAAAAGGAAAACATAACAAG TTTAAATACATCTCATGTTAATGTTCAAT CGACCCTATAACAGTTTCAGAAGTAGAACAAAATATG TTTAAATACATCTCATGTTAATGTTCAAT >NZ_CP028842|8|2|2329052-2329214|PILER-CR TTTAAATACATCTCATGTTAATGTTCAATTA GAGGTGATTTTATATGAAAAAGGAAAACATAACAAG TTTAAATACATCTCATGTTAATGTTCAATCG ACCCTATAACAGTTTCAGAAGTAGAACAAAATATG TTTAAATACATCTCATGTTAATGTTCAATC
>NZ_CP028842.1|WP_012047737.1|2328478_2328652_+|hypothetical-protein MVLDMLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >NZ_CP028842.1|WP_011986678.1|2326996_2327686_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >NZ_CP028842.1|WP_011986677.1|2326602_2326977_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >NZ_CP028842.1|WP_011986676.1|2324847_2326551_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >NZ_CP028842.1|WP_011986675.1|2323647_2324835_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >NZ_CP028842.1|WP_011986674.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NZ_CP028842.1|WP_011986673.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NZ_CP028842.1|WP_011986672.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NZ_CP028842.1|WP_011986671.1|2319405_2319840_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NZ_CP028842.1|WP_011986670.1|2318500_2319394_-|type-III-B-CRISPR-module-RAMP-protein-Cmr6 MIGNIGYLYYKEYFKDEYIHECKIQSKKYDEKNNPLIKINQKILDNSNIDILKNNKFKFIKEIQDKLYKKRIYFKTTYPGLIVGTGYSHILKEKEEFKLSLEFDYTTGLPVINGSSIKGMLRSVFYNKKDDEKLIEEKEKYIRDILKELIKKENPKFNGEFDFEELTNNIFEGKCKAKDKNGIHMSISERDIFLGATIDIEATIEEMKRTKQEKNNLLGEDYVTPHGEGKDKLKNPNPIKFLKVMPNVVWCFGFDLKDFNKDIPADIKKKLFKQILLDLGIGAKTNVGYGRLEFISY >NZ_CP028842.1|WP_011986679.1|2329424_2331080_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >NZ_CP028842.1|WP_012047738.1|2331856_2332705_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NZ_CP028842.1|WP_011986681.1|2332995_2333916_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NZ_CP028842.1|WP_011986682.1|2334239_2335733_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NZ_CP028842.1|WP_011986683.1|2336657_2337113_+|staygreen-family-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >NZ_CP028842.1|WP_011986684.1|2337192_2337660_-|helix-turn-helix-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >NZ_CP028842.1|WP_011986685.1|2337827_2338874_-|alpha/beta-hydrolase MEVNGVKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NZ_CP028842.1|WP_011986686.1|2339124_2340477_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >NZ_CP028842.1|WP_011986687.1|2340685_2342029_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV >NZ_CP028842.1|WP_012047740.1|2342464_2343364_+|hypothetical-protein MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP028842_9 | 2331432-2331592 | TypeIII |
III-B
Consensus repeat of NZ_CP028842_9
|
2 spacers
spacers of NZ_CP028842_9
>9.1|2331462|36|NZ_CP028842|CRISPRCasFinder ACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATA >9.2|2331528|35|NZ_CP028842|CRISPRCasFinder TTTAATATTTTTTCTATATCCATAGGCTTAAAATC |
cas6,cmr1gr7,cas10,cmr3gr5,cmr4gr7,cmr5gr11 |
CRISPR arrays and Neighbor proteins around NZ_CP028842_9
The CRISPR arrays of NZ_CP028842_9 >merge|NZ_CP028842|9|2331432-2331592|CRISPRCasFinder GCTTAAATACATCTTATGTTACTGTTCAACACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATAATTTAAATACATCCTATGTTAATGTTCAACTTTAATATTTTTTCTATATCCATAGGCTTAAAATCATTTAAATACATCCTATGTTAATGTTCAAC >NZ_CP028842|9|9|2331432-2331592|CRISPRCasFinder GCTTAAATACATCTTATGTTACTGTTCAAC ACGTAGGAAAGAAAATGGAATCTATAGGTAAGGATA ATTTAAATACATCCTATGTTAATGTTCAAC TTTAATATTTTTTCTATATCCATAGGCTTAAAATC ATTTAAATACATCCTATGTTAATGTTCAAC
>NZ_CP028842.1|WP_011986679.1|2329424_2331080_-|AAA-family-ATPase MKKRFNVTGTCIPEKHYMVDISKKLDSILKLIDNEEYFIINRPRQYGKTTTLYMLEKRLNKMEEYLPIKISFEAIDTEGYSEAKKFLSSIMMQIINYFRFSTKKEIYKFVKRHENKVNTMNEFNRFITDLIEFTEKKVVLIIDEVDKSSNNQLFLDFLGMLRSKYLLRSEGKDYTFHSVILAGVHDVKQASKIYDFDMIAYSCEEISRRFLTKDLKIRSDEEHKYNSPWNIASDFDVDMSFSRSEIKTMLDDYVENKKVALDKEYFAEKLYFYTSGYPFLVSKLCKIIDEKIMDENKLEWKKEYLEIAVKELLKDSNTNFDSLIKNIENNEGLSRLVDNLLIKGVRINFNIHNPDINLGCLYGIFKDDKGNLKINNRIYEQLIYDYRISKIQTSSNFYNYNSKENFIDTNGDLNIRKVLLKFQEFMQHEYSKKRKGFLEEDGRLVFLAFLSPIINGIGFAFKEVKAGEEKRFEIVITYNKKMYILELKIWRGEEYHKKGLIQLAEYLEQYKLDKGYLLIFDLRKSTNLIGEVEENYIGIENHSKKIIQVYC >NZ_CP028842.1|WP_012047737.1|2328478_2328652_+|hypothetical-protein MVLDMLELTIKSFVVIYIVKLILKHNLFISKLVIKIKFLGIHIELNGKEKKHPSDQE >NZ_CP028842.1|WP_011986678.1|2326996_2327686_-|CRISPR-associated-endoribonuclease-Cas6 MEFCELIATVMLKKDIYFEDCGYIIGKNINKSMLLDKDLKEIHPKKQYKNYVFNSFYPIERDKFYKKDRLYIFNIRGLSKEFIDKIETCLCNLESNDFNVISTSKKEIKQRYIKELYTQTPLIITVDDKPWLQNDGDLDLFKQRLEDNLEKKYKSFFNEDIDVKGKFIKSIEFKNRKPMHYNYKNGIKLLANKVSIQIKDNEEAQKVAFLARAIGLGEKNPSIGAGFCK >NZ_CP028842.1|WP_011986677.1|2326602_2326977_-|hypothetical-protein MGKTLRFEIVSGVNKGYFHTNSQSESLDLVGGIWQKIAKEEFEKSNIYVSAVIKPSKTVYNQEWGCPENGEETVVLTGVANEEFVDDIEKWKDTVIKLAKELKNQMKQSTLTCEFIETELHYFK >NZ_CP028842.1|WP_011986676.1|2324847_2326551_-|hypothetical-protein MTKEIISSHIFVFPFRWDVVKDEACFDTCIDSRLNTEKFIKYLKDNNQWEEDINISNIVENKEVENDLDYNTYAYFYDNVRKAIYGNPNSIKKNKNISVDLKNSKYYAGKLFNKKISNTIVRCLNYKNIDANSIYEIHVEKKDDKGTIVFDEHYKLKIKSIKLKVYDTGVATLSYFLNNYEWKNKEDILRINDYGRRIYPQHIPLDTVRSNFLAKKLSLKLKKRIIEEEFDYEIKEKPTKISKTIINILGEKFVSTEKELRYKSLSKEEIIFVKPVIDDRMFVICYYNNGFHSRVLTKYDKDEYLKNDFWYQFLFVDNDGATCKDEEMTKELLLKSTYTRWKSYGTLFGISRYSFVILCDESGFSKDVLYNHINIIYYEMILLALVQRASILRFSDETSRIASFERKNIYEQIKKLQEYYIRFVNTIYFREVTAQEQGIELYDKIVELMRIDTEVKRLDEEIDEIQRYINLETNDRTNRLLNVITFVGIGISVISLISSLFSNSKQIGDLTWLVTWQYVPFVMVLLVISVIKNYVNDNKVIKIIMWVITLLAIYIVLDYKFIKLFIK >NZ_CP028842.1|WP_011986675.1|2323647_2324835_-|hypothetical-protein MAKLKIGLKQHTPLIHFQSEQPGAILRATEVKSKLDKFLKKYAFPGGFEEYKQYLIGYKTDKKDKIEDFGDKQAFDYKLRIYTENPNKIQKINIKGGMQALYFAGRSNNGNVKGILTNEDIILEFFTFHKGLMEIIKNNIEGFFCINNFGTRQNKGFGSFYLKKPINEVDKLIDRICTHDKTNIYLNIKYNKGDYFQIFEDISVIYPLMKSGLNFPKWPKSYHKSFLFKYMLNKDIGNEKRFIKENFFSPWKRIENDNKEKRYVRAMLGICDGIEFRDSERTGKVKYNSNIERFQSPILFKIINNELFIIPKKIPKEMFYNKFKFSNEFKSGRESKVNKEIIYTPKEDEFNLENFLSGFADYFNNHIKVSNVNNVFENKIRKAKLRRIDIKQVVK >NZ_CP028842.1|WP_011986674.1|2321934_2323647_-|type-III-B-CRISPR-associated-protein-Cas10/Cmr2 MTKNKKSYIGLTIGPIVETIGNAKQTGELWASSYLFSYIMKNIIKTLIVKDREVNKDREQNEKLENRFILPCIDDILNKLSKNEMEQKSIQKIENNTDKAEQEVGLFHDRFIFQSENGEFDLVKESINEVIDGIVTGIENHDVCKDKSREEIKSDIEDFLKIYYLEIDIDLNQEEKENKLSSENNIIFKVNRALDALELREKILGNNGVENNYILQTLNNKQLKEQDFKKHFLSKDAYGENGKDGDYPSLFKIALDETYNNEFPNEDEKIKEELKQMGERKRLKANEYVAIVQADGDSMGRVIEKFKIHNDRENIYVDYKDFSSKLLEYDKNSHEKIKKYGGFTIYAGGDDLLFIAPVITKNKNNIFQLIDALSGLFDNEFKHEEEKPTTSFGIAIVHHKFPLYYALDEARDLLFNKAKNYKFNGEEKNAIAFKVIKSSGQSFETVVGKKSESYKQFKELFKNVSNSLNGKDRKIKNYLKAIHFKIKRDKVILNKIGKNEELLENYFKNNFDEKFHENGDIKKYINYLIKFIYLIYGETKTDEDKNKCIEQIYTYLRFIKFMDEDINLDN >NZ_CP028842.1|WP_011986673.1|2320718_2321918_-|CRISPR-associated-protein-Cmr3 MSKYLVKLKPVDSFFFGGEKVFDFYDGKKPLKNNIVKSREFPQQTSILGMIRKEILVLNSCIREKWDYSKDQQKENNKLIGERSFNITDKNEDFGIINSISPVFIIEETKVSDKFLIKIPKDHNVNDSLNKYNPFKFNNDKGNCLKVKTNLVKEVYLPIDFEAKKGLSEDFIDIKTGDIVSKNKVFIRDCSIGIKLDENHKTKDNSLFRLEKYKFKYDNRYERADKCFAFILDVEEEKGKITFENYKNIITLGGEGSHFFISFEKVNFDIKEKIDFINKEKNSFTIKERVRVATNKEEIKETKLIYKIILLSDTYISKDIYEKNCNYSISTKIDFRNLCSDNYCKNIDEYHYKRLKKSDSKYSLLEKGSVLFASKENYDRLIKNINNSKFQKIGYNIFI >NZ_CP028842.1|WP_011986672.1|2319867_2320707_-|type-III-B-CRISPR-module-RAMP-protein-Cmr4 MDNFKIYTIRCLTNMHVGSGDASYTLIDNQVQRDVITGFPTINSSSLKGSLRSFLDPKKEKSKAIKYIFGDKEDGMGNYKIFPGMLLSMPVRSNVKPFFRATCPRIIKDFLGFIENFQPQTSDIKNIKTLEEDLKNIEKVADKNKNTIFILKNFNRDIDVKFDNNQRIEGIKITSEQEISLKGEERIKEIFGESLILIDDNSFNDIVDRLPVIARNKLDNGESENLWYEEVVPRETRFYFGTILGKEHQSEFGKIEGKQPVQIGSNATIGYGYCDIKSI >NZ_CP028842.1|WP_011986671.1|2319405_2319840_-|hypothetical-protein MNKREIEKQIPIAIDLIDEFMKKKKFLKKDDKEDDKKLKGIAKEYKGYISNFGASIIQSGLLSTVAFFEANDSKSKSDKQVLMDLILKVVDIYNEKQLEWKNNSPFLHYILENNNKQTEEEVINAAIAVKLAMRVFKFTENSES >NZ_CP028842.1|WP_012047738.1|2331856_2332705_-|PhzF-family-phenazine-biosynthesis-protein MEYFHVDVFSNEILYGNGLTVVFCNEELEDNLMLKLTQEFKQFETIFVRRMDNSIFNARIFTVDEELDFAGHPILGAAATIHSNIFRNEEDIAITFQLNQKTIIVNSKKIEEYYEVQMNQGKAEFLCEVSKEKRNKYVHALNLSEENLSEEFPMEVVSTGLPYLLVPLASGIENAKIISSKFEEMLKEVGAKFAYIFDVNYIEGRTWDNQGNVEDVATGSAAGPLGAYLYKHNIFNVGHEIIINQGRFVGRPSKIKVSMSISEKEILVSGEVAILAKGTILL >NZ_CP028842.1|WP_011986681.1|2332995_2333916_-|PhzF-family-phenazine-biosynthesis-protein MRKFEYTLVDVFTNQVFGGNQLAVFKDAEKLSSEEMQSIARELNFSETTFVTDIGPNHKKLRIFTPKTELPMAGHPTIGTAFVLADEGVIETREGINKLIFEEGVGEIAVSIHVEGGRIRSIEMEQPMPVFGRVFGDIRTAAELLSLDIADIDTTSPIQTVSTGVPFLYIPLKSLDVISKIKLRLDTWEKFFSASEDTKHIFAFTRETLHAGSTIHSRMFAPAMGIAEDPATGGASGPLGAYLVEHGLVAHGYDGKYMIINEQGIEMGRPSFINITVSKTYNNFSEIKIGGTCVKFGAGLIELPTL >NZ_CP028842.1|WP_011986682.1|2334239_2335733_+|PLP-dependent-aminotransferase-family-protein MNIKIDKNSLITITQQLVHYFSDRIMSEFIKAGQKLPSIRNLAKELGISPMTIIKAYNNLEQNGLVTTIQGKGTYVNERNSTVKSNNITEKDSFQWQMSVPDYLSRSQFRYNPNLSYSNDYYNLSVASLNHKLLPTKTILKDSLSLIQNDIKLLSQYPPAQGDYEFRNIMSQYLRSKEIATSPENILVTSGSQQGISLIASTFIGPGDIVVMETPTYPGAIDLFKCRGAVILTVPVDSEGMRTDILMNLCDKHSPKLIYTIPNFHNPTGYSMSSNRKAELLDIARYNDILIVEDDPWNEISYKREKIKSIKSMDTDGHVVYIKSLSKILGPSYRLAVIISESSILSRLIAAKSNHDLGTSVLIQKTIINFIQSNKITYYIENLNKQLVKRRDKVISLLKSHAPSGMKWAIPEGGINIWVTLPKNFNVEKLLSYSITTKNISFLPGTICYPNEVEFNNLRICFTYLDEEFIEDTIIELCNLIKLLYTTKNITDYRPII >NZ_CP028842.1|WP_011986683.1|2336657_2337113_+|staygreen-family-protein MSKLNPEKLSVEFRDGVTGTEPILGRRYTLTHSDITAELFLTIGLTYAYDKIDVMRDEVLGEWIEKEKNYLFHVYLHVDGNNPIVTGVRNHIFRRELPLALEAIRYGDRKFFISHPKLDNSPVIVHFISSYPSFDRIEKWGTFSDYSLKKR >NZ_CP028842.1|WP_011986684.1|2337192_2337660_-|helix-turn-helix-transcriptional-regulator MSLGEKLLYLRKKAGLSQEDVAEKLSVSRQTVSKWETDQTVPELNKAKLLSELYNVSYDYLISENYISGDVTGIEMIVDEIDWTGAWSKKYSILASYPGIKGINTYSEKISELYDSFKNDFGFNDTDTVLVLKDILYQKYKMEKKKKVDNSKEKI >NZ_CP028842.1|WP_011986685.1|2337827_2338874_-|alpha/beta-hydrolase MEVNGVKKVIKVVSVILVILVIAGFFIIKNLTETKDGKLNMYVAANLQLYKILNPKSLNNKSIEETRGALNKQSTRWSNKPIPFSNIKNLDIKMNNEKIPVRIYTPEKGSNFPIIIYSHGGFWIGGNVDTIDGVCRKLSQNTKAIVISVNYRLAPENPFPAGLNDVYNVLQWTYKNGKSINGDEKHIAVVGDSAGGNLSAAVSSMSRDKNGPSITCQVLIYPSTNIFKLNSKSWSHFSNSFNVSTEDMEKYISIYAPKKEDRKSPYASPLLSKDLRKLPDTLVVTAEIDPLRDEGEAYANKLKESGVKAEVTRYKGITHGFITMDKITNKADEALNQISLYIQKEFQK >NZ_CP028842.1|WP_011986686.1|2339124_2340477_-|amidohydrolase MNQILIKNGYIITMDCSKRIFEKGDILVEDSKIIAIGNVESELIKSNVEIIDANGKIIMPGLVNTHVHLSQQLARGLADDVDLLTWLRKRIWPYESNMDLEDSYISSLACCTELIRSGVTTFCEAGGQEVDGMGKAVEEAGLRGILCRSTMDCGDGLPLKWQETTEESLQKQVELLERWNGKGDGRIKYWFGLRTIFNTTDKLITKTKELADKYKVGIHMHVAEIEEEVRYAEATRGETTVQHLAKLGVLDKNFLAVHTVWLTEQEIDLFKLHNVKVSHNPGAAMKVVLGFAHIPEMLEKGINVSIGTDGAPSNNRMDMFDEMHLTSLIHKGRRLNPKVVPADEVLEMATMNGAKCALWEDEIGSLEVGKKADLIIINPKSIGSLPMHDPIGNIVYSMHSSDVESSMCNGKWLMKNKVLLTIDEEDIIREAQEKATALVKKAGIVLPKRF >NZ_CP028842.1|WP_011986687.1|2340685_2342029_-|purine-permease MKNTKDTNLIVGIDEKISLRYAFFLGLQHVFAMDLYIVPIILAGILSLDAQNTAYFIQMSFIAAGIATLIQTGLCMRLPIMQGPSYIPIGALAAIGSKLGLQAMVGSLIPGSLFLMILGYPLRFLSKIISKFIPHIVGGTVIVIVGISLMPVAMTNIFTAPGNLKINCILALISSALLVGCMMIGRKSNKFGKAVRLTSVMISLIGGTIAASLLGVVDFTPVTKAAWFSFPKLLPFGKPVFDLKAILTMLFIYAVILVETSGTWFAVSAVTGSELTDEGLNRGAVGEGIGCFVGALFGGTPMTGYSTNAGIIAVTGVGSRMAIIAGGIILVALGMLPKLMNVIACIPSAVVSGVFAVVCVIIAMNGFKSIQHEEFDERNMLLIGLPILLALGTTVLPKDILNSLPSLANYIFSSGITVGALAAVILNILLPKAPVEVSKSQEYEEAV >NZ_CP028842.1|WP_012047740.1|2342464_2343364_+|hypothetical-protein MSNKRNLQSIRSFYLCILIFNIVYSSIFHLNNKGFNIKLFGDLTMRSVVLFTLNSILFLCVAIAVEKKINIDEEIKTQVSMRIKPLYLVNMFFITYILVCIFLLKNLDVILSSFVMEIIYIGILILTKKIIALELTDRQLQWQKACGYIDESCEKSSFLWKFKIWYSPHINVPFKNRWKGLSRLLYDLALVYGIFISKGNLFSLPLLILLFPDVLSWLEGLLGLQTSLTGMCTGITEHHNKNSHVIYHKVYVTDYKNKREITFYVDGPLFIHENSHMTVVHGTFSKRVLYVEGLNLDIR >NZ_CP028842.1|WP_011986689.1|2343704_2345024_+|APC-family-permease MLEKKYGLWTTVSMVIGIVIGSGVFFKADNILMASGGNVKTALLAWLVGAISMIFGALVFAECANRFERSNGIVDYAEGMLSEKFAYLIGWFNGIIYYPAIAAVLAWAAGNYTAILFNKDGNFVWIMAAIYMIGIYILNYISPILSGKFQIASTAIKLVPLMLIAILGTFQGLNNGILIENFSKVSTIGDSGSGFAAAVLGAAFAYEGWIIATTINGEIKDAKNTLPKALVFGSLVIVIIYILYFLGIVGMIPTETILKQGDNTVNVAARTVFGNFGASILTTFIIVSCLGTLNGLILGGSRSFYSLAIRGQGIKPEAFSKLDSKTNIPTNSTIANFILICIYLVVWYMNFKGLFPNKMFVDISELPIALIYGIYIIIYIAYMMKMKDLSFIKRFVIPSLALMGALIVVYGGLSKPSVIIDLGISVFVFLSGLLFYNKK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
NZ_CP028842_2 | 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NC_012654 | Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence | 174503-174538 | 0 | 1.0 |
NZ_CP028842_2 | 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NZ_CP006909 | Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence | 62802-62837 | 0 | 1.0 |
NZ_CP028842_2 | 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NZ_CP031095 | Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence | 207645-207680 | 0 | 1.0 |
NZ_CP028842_4 | 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP014152 | Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence | 149447-149482 | 0 | 1.0 |
NZ_CP028842_4 | 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP013684 | Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence | 128281-128316 | 0 | 1.0 |
NZ_CP028842_4 | 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP013710 | Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence | 129903-129938 | 0 | 1.0 |
NZ_CP028842_4 | 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 80344-80379 | 0 | 1.0 |
NZ_CP028842_4 | 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 37712-37747 | 0 | 1.0 |
NZ_CP028842_2 | 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT | 2306213-2306248 | 36 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 219276-219311 | 1 | 0.972 |
NZ_CP028842_4 | 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder | 2313587-2313622 | 36 | NZ_CP013700 | Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence | 47769-47804 | 2 | 0.944 |
NZ_CP028842_8 | 8.1|2329015|36|NZ_CP028842|CRISPRCasFinder | 2329015-2329050 | 36 | GU949551 | Clostridium phage phiCD6356, complete genome | 4906-4941 | 2 | 0.944 |
NZ_CP028842_2 | 2.2|2306082|35|NZ_CP028842|CRISPRCasFinder,CRT | 2306082-2306116 | 35 | NC_010379 | Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence | 30926-30960 | 3 | 0.914 |
NZ_CP028842_2 | 2.2|2306082|35|NZ_CP028842|CRISPRCasFinder,CRT | 2306082-2306116 | 35 | NC_010418 | Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence | 163878-163912 | 3 | 0.914 |
NZ_CP028842_8 | 8.4|2329015|37|NZ_CP028842|CRT | 2329015-2329051 | 37 | GU949551 | Clostridium phage phiCD6356, complete genome | 4906-4942 | 3 | 0.919 |
NZ_CP028842_8 | 8.8|2329150|35|NZ_CP028842|PILER-CR | 2329150-2329184 | 35 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17536-17570 | 4 | 0.886 |
NZ_CP028842_8 | 8.3|2329148|36|NZ_CP028842|CRISPRCasFinder | 2329148-2329183 | 36 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17535-17570 | 5 | 0.861 |
NZ_CP028842_8 | 8.6|2329148|37|NZ_CP028842|CRT | 2329148-2329184 | 37 | NZ_CP013844 | Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence | 17535-17571 | 6 | 0.838 |
NZ_CP028842_8 | 8.8|2329150|35|NZ_CP028842|PILER-CR | 2329150-2329184 | 35 | MN693403 | Marine virus AFVG_25M412, complete genome | 14464-14498 | 6 | 0.829 |
NZ_CP028842_9 | 9.2|2331528|35|NZ_CP028842|CRISPRCasFinder | 2331528-2331562 | 35 | MN694042 | Marine virus AFVG_250M538, complete genome | 50649-50683 | 7 | 0.8 |
NZ_CP028842_2 | 2.3|2306147|36|NZ_CP028842|CRISPRCasFinder,CRT | 2306147-2306182 | 36 | MT795651 | Vibrio phage vB_VnaS-AQKL99, complete genome | 5039-5074 | 8 | 0.778 |
NZ_CP028842_9 | 9.2|2331528|35|NZ_CP028842|CRISPRCasFinder | 2331528-2331562 | 35 | NZ_CP054613 | Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence | 1277029-1277063 | 8 | 0.771 |
NZ_CP028842_8 | 8.3|2329148|36|NZ_CP028842|CRISPRCasFinder | 2329148-2329183 | 36 | MN693403 | Marine virus AFVG_25M412, complete genome | 14464-14499 | 10 | 0.722 |
NZ_CP028842_1 | 1.2|1901636|40|NZ_CP028842|CRISPRCasFinder | 1901636-1901675 | 40 | NC_018689 | Bacillus thuringiensis MC28 plasmid pMC429, complete sequence | 417214-417253 | 11 | 0.725 |
NZ_CP028842_8 | 8.6|2329148|37|NZ_CP028842|CRT | 2329148-2329184 | 37 | MN693403 | Marine virus AFVG_25M412, complete genome | 14463-14499 | 11 | 0.703 |
1. spacer 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT matches to NC_012654 (Clostridium botulinum Ba4 str. 657 plasmid pCLJ, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
2. spacer 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT matches to NZ_CP006909 (Clostridium botulinum CDC_1436 plasmid pCBG, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
3. spacer 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT matches to NZ_CP031095 (Clostridium botulinum strain CFSAN034200 plasmid p1_CDC51232, complete sequence) position: , mismatch: 0, identity: 1.0
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagataaact Protospacer ************************************
4. spacer 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder matches to NZ_CP014152 (Clostridium botulinum strain BrDura plasmid pRSJ20_1, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
5. spacer 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder matches to NZ_CP013684 (Clostridium botulinum strain AM282 plasmid pRSJ10_1, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
6. spacer 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder matches to NZ_CP013710 (Clostridium botulinum strain F634 plasmid pRSJ2_3, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
7. spacer 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
8. spacer 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 0, identity: 1.0
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaaatgttgtggtataacagaatgtaaata Protospacer ************************************
9. spacer 2.4|2306213|36|NZ_CP028842|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 1, identity: 0.972
atttcatcaaatccgcatcaataaatgagataaact CRISPR spacer atttcatcaaatccgcatcaataaatgagattaact Protospacer ******************************* ****
10. spacer 4.1|2313587|36|NZ_CP028842|CRISPRCasFinder matches to NZ_CP013700 (Clostridium botulinum strain AM1195 plasmid pRSJ11_1, complete sequence) position: , mismatch: 2, identity: 0.944
atgttgtaaatgttgtggtataacagaatgtaaata CRISPR spacer atgttgtaagtgttgtagtataacagaatgtaaata Protospacer *********.******.*******************
11. spacer 8.1|2329015|36|NZ_CP028842|CRISPRCasFinder matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 2, identity: 0.944
aatagagtattcagatgaatataaattcttggaaga CRISPR spacer aatagagtattcagatgaatataagttcttagaaga Protospacer ************************.*****.*****
12. spacer 2.2|2306082|35|NZ_CP028842|CRISPRCasFinder,CRT matches to NC_010379 (Clostridium botulinum B1 str. Okra plasmid pCLD, complete sequence) position: , mismatch: 3, identity: 0.914
cttaaatatataggtatagatcaagacgctaaaga CRISPR spacer ttgaaatatataggcatagatcaagacgctaaaga Protospacer .* ***********.********************
13. spacer 2.2|2306082|35|NZ_CP028842|CRISPRCasFinder,CRT matches to NC_010418 (Clostridium botulinum A3 str. Loch Maree plasmid pCLK, complete sequence) position: , mismatch: 3, identity: 0.914
cttaaatatataggtatagatcaagacgctaaaga CRISPR spacer ttgaaatatataggcatagatcaagacgctaaaga Protospacer .* ***********.********************
14. spacer 8.4|2329015|37|NZ_CP028842|CRT matches to GU949551 (Clostridium phage phiCD6356, complete genome) position: , mismatch: 3, identity: 0.919
aatagagtattcagatgaatataaattcttggaagaa CRISPR spacer aatagagtattcagatgaatataagttcttagaagat Protospacer ************************.*****.*****
15. spacer 8.8|2329150|35|NZ_CP028842|PILER-CR matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 4, identity: 0.886
gaccctataacagtttcagaagtagaacaaaatat CRISPR spacer aaatctataacagtttcagaagtagaaaaaaatat Protospacer .* .*********************** *******
16. spacer 8.3|2329148|36|NZ_CP028842|CRISPRCasFinder matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 5, identity: 0.861
cgaccctataacagtttcagaagtagaacaaaatat CRISPR spacer taaatctataacagtttcagaagtagaaaaaaatat Protospacer ..* .*********************** *******
17. spacer 8.6|2329148|37|NZ_CP028842|CRT matches to NZ_CP013844 (Clostridium botulinum strain A634 plasmid pRSJ19_2, complete sequence) position: , mismatch: 6, identity: 0.838
cgaccctataacagtttcagaagtagaacaaaatatg CRISPR spacer taaatctataacagtttcagaagtagaaaaaaatata Protospacer ..* .*********************** *******.
18. spacer 8.8|2329150|35|NZ_CP028842|PILER-CR matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 6, identity: 0.829
gacccta-taacagtttcagaagtagaacaaaatat CRISPR spacer -acagtactaacagcttcagaagtagcacaaaattt Protospacer ** ** ******.*********** ******* *
19. spacer 9.2|2331528|35|NZ_CP028842|CRISPRCasFinder matches to MN694042 (Marine virus AFVG_250M538, complete genome) position: , mismatch: 7, identity: 0.8
tttaatattttttctatatccataggcttaaaatc CRISPR spacer tttaatatttcttctttatccatagtgtttataac Protospacer **********.**** ********* ** * * *
20. spacer 2.3|2306147|36|NZ_CP028842|CRISPRCasFinder,CRT matches to MT795651 (Vibrio phage vB_VnaS-AQKL99, complete genome) position: , mismatch: 8, identity: 0.778
tcttaacctttaattacattatatattataagttca CRISPR spacer gcttaacctttaaatacattatacattaccaaccca Protospacer ************ *********.****. *...**
21. spacer 9.2|2331528|35|NZ_CP028842|CRISPRCasFinder matches to NZ_CP054613 (Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed4, complete sequence) position: , mismatch: 8, identity: 0.771
tttaatattttttctatatccataggcttaaaatc-- CRISPR spacer agtaatattttttctatattcataggc--agcttccg Protospacer *****************.******* *. **
22. spacer 8.3|2329148|36|NZ_CP028842|CRISPRCasFinder matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 10, identity: 0.722
cgaccctataacagtttcagaagtagaacaaaatat CRISPR spacer cacagtactaacagcttcagaagtagcacaaaattt Protospacer *. . ******.*********** ******* *
23. spacer 1.2|1901636|40|NZ_CP028842|CRISPRCasFinder matches to NC_018689 (Bacillus thuringiensis MC28 plasmid pMC429, complete sequence) position: , mismatch: 11, identity: 0.725
tatttaaaggatttaaactta---catcatttagatctaagag CRISPR spacer tatttaaaggatttaaacttagttcattacataggttatc--- Protospacer ********************* ***.*. ***.*.
24. spacer 8.6|2329148|37|NZ_CP028842|CRT matches to MN693403 (Marine virus AFVG_25M412, complete genome) position: , mismatch: 11, identity: 0.703
cgaccctataacagtttcagaagtagaacaaaatatg CRISPR spacer cacagtactaacagcttcagaagtagcacaaaatttt Protospacer *. . ******.*********** ******* *
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
575757 : 585171
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NZ_CP028842|575757:585171|DBSCAN-SWA CATGATTATAAAAAAGAAATTGCTTTTAAAAGGCTTACATTGTGCCAATTGTGCAACAAAAATAGAACGAGCCGTGCAAAAGCTAAATATAATAGAGGAAGCTAACTATAATTTTAATAATTCAACTTTAATTATTAACTTAGAAGAAACTCATAAAGATAGCATTATAAAAACAATACAAGAAATAGTAGATAGAATAGAACCCGGGGTAAAGGTAGTAGATAAAGAAAATTTAAAAAGAACGGTAGTGCATGCCCCTGTTAAAAATAGTAGTAATTTAAAGATGCAGAATAATAAAGAGGAAAATTTAAAATTAGATAAAAAAGAAAATAGTTATGAGCATAATCATGATCATAGTCATGGACACAGTCATGATGGAGAAGATAGTGACGAGTTAGAAAAGAAGACTCTTATAAGAATTATTTCAGGAGTGGTTTTATTAATTTTAGCTACCGTATTGAAATCTAAAGAAACTTTGTCTATAGGTCTATATTTAACTTCATATGTATTAATTGGAGGTAAGGTAATATTAAGTTCTATAAGAAATATATCTAAAGGACAAGTATTTGATGAAAACTTTTTAATGGCTGTTGCAACTGTAGCGGCTATAGGAGTAAAACAGTATCCAGAAGCAGTAGCGGTTATGCTATTTTATGAAGTAGGGGAGTTCTTACAAGATAAAGCTGTTAATAAATCTAGAAAATCTATAACAGCACTTATGAATATAAGACCTGACTATGCCAATTTAGTTAGAGGTGAAGATATAGAAGTAGTTTCTCCAGAAGATATTAATATAGATGATATTATAATGGTAAAACCAGGAGAAAAAATTCCTCTAGATGGTATAGTTGTAGAAGGACAATCTTTTGTAGATACATCAGCTATAACAGGTGAATCTTTAATAAGTGAAGTTTCAAAAGATAGTAATGTATTAAGTGGATATATAAACAAAAATGGTGTTATAAAAATAAAAGTTACAAAAACCTTTGGAGAATCTACAGTGTCCAAAATATTGGAATTAACAGAAAACGCATCAGCTACTAAGGCAAATACAGAAAAATTTATAACAAAGTTCGCCAGATATTATACTCCTGTAGTTGTTTTTGCTGCTTTAGCTTTAGCAGTAATTCCTACACTAATACTAAAAGATCCAGATATATCTAAATGGATTTATAGAGCAGCTGTATTTTTAGTAGTATCTTGTCCATGTGCTTTAGTAATATCAATACCTTTAAGCTTCTTTGCTGGTATTGGAGGGGCATCTAAAAAAGGTGTTTTAATAAAAGCAGGAACAGCATTAGAAGCTCTAAATGATGCAGATACAATAGTATTTGATAAAACAGGAACTTTAACTAAAGGTGTGTTTAAAGTATCAAAAATTGATTCAGAAGAAGGAGTAAATACAGAAGAATTAATAGAATATGCTGCTTATGTAGAAAGTTATTCTAATCACCCTATCGCAAAATCTATACTAAAGTATTATGAAAAAACCATAGATAATAAAAGAATAGAAGGTTATGAAGAAATAGTTGCAAGAGGTGTAACTGCTTATATTGATGGCAAAAAAGTTTATGCTGGTAACAATAAATTAATGGAAGAATTAAATATTAACTATAAAAAAGCTCAAGAGGATGGAGTAATCCTTTATATAGCATTAGAAGATAAGTATATAGGTTATATAGTTATAAACGACGAAATAAAGAAAGATTCAAAAGAAACAATAAAATCATTAAAAGATATAGGTATAAAAAAAGCAGCTATGCTTACAGGAGATAGAAAATCTACAGCTAATAATATAGGGACTTTTCTAGGAATGGATGAAATATACTCAGAACTTTTACCACAGGAAAAGGTAGAAAAGATGCAATCCTTAAAGTCCAAAACATCTAAAGATGGGAAAATTGTTTTTGTAGGGGATGGAGTAAATGATGCTCCAGTATTAGCTATGTCAGATATAGGGGTATCCATGGGAGGCTTAGGATCTGATGCAGCCATAGAAGCATCTGATTTAGTTTTAATGTCTGATGAACCATCAAAATTAGTAGATGCCATAAAAATAGCTAGAAAAACTCATAAAATAGTATGGCAAAATATAATTATAGTTTTAATAATCAAGTTTGCAGTATTAGCTCTAGCTGTAATGGGAAAAAGTACTATGTGGATGGCTGTTTTTGCCGATGTAGGTGTGGCTTTAATAGCAGTAATAAATGCATTAAGAATACTAAAATAAGAATTTACTAAAATAATAACTTTCTAAAGAAGGATAGGAACGAATAATTTTAAAGAAAAATATTTAATTATATTTATATAGTTTTAGTTAAGTAGTTTTAGGTTCAGATGGAGTTTGCTTAGAATAATTATTTTTCTCCATCTGAACATTATTATTTATCAGAGAGTAATAAATATAGAAGATTAATTTTTATGAAAGTATAAAAAATTATCAAATTGTATAAACAAAGTATACTTATGAGAAATTATAAGATGAGTATTAGGTACTTCTATATATTCTTCAATAAATGTTATGTAAAAATAAAAGATTTAATAATTTAATAAAAAAATTAAAAACAAAAGAAAATATTTCTAAAAAATATTGACTTAAAATTTAGGCTGTAATATAATTATATATGTTCAAAGAAAATAAATAATTGAGGCTTCTTGGTCAAGCGGTTAAGACGCCACCCTCTCACGGTGGAATCAGGGGTTCGACTCCCCTAGGAGCTACCAGATTTGAAGAAATGCTGTAAACAGTGATGTTTACAGCATTTCTTATTTAGAAGTGAAAATGGAAAATTAATATTTTCCCACACTAGAAAAATACAAATATAAACTTCCTTTCTAATCAAATTTCCATTGGCATCCCCCAATAATTTAAATAGTTTGTTAAAGGCTAAAGAAAAAGCTTTACCAAAAGGATTTAATGAAGCTAGATTTTTACAAAATTGCATGACAGTATTAAAAGATATTAAAAATATAGAAAAATGTAATGAAGTGAGTGTAGTAAGAACAATGCTTAAAGGAGTATTTCTAGGTTTAGACTTCTTTAATAAGGAATGTTATGCAATACCAGTTTATTTAAATCTTTTTTAGAAGAATATAATGGATGTGAAGCTAGGATGATGGCAGTATTAAATGTATCCATGAAAATATAAAGAGTTAAAAAAGTATGAAAGGTGAATTAGAGTTTATTAGATGTGGTAAATATGATTATTGCAAGATTACTAAAGAATTAAAAGAAATTATACACTATAAAAAATTATAAGAGGGGTAATAAAGTGGCAGGTACAACCTCATATATAGATAAAGAAACAAAAGTAAATATTTAAGAGGATGATGATTTTTTTGTTAAAATTCACAAGTTATTTGATGAATATGCTTTAAGTATTATTGGAAGAAGAGAAGTTCCTCAAAAAGTATATGATGTTCTACCAAGTAATTTATCTGATTGTCCAATCTATAGTGAACTAGAAGAACAGTTAATAAATAAAGAGTTGCTTTTATAAGAAGCATAAAGTCAAATTGAATGTTTAAAAGATATAATAGATTTTTTAAAAAGATAACACTACCGTAGTAGAAATTAATATGGCAAGATAAGTGAAAGCCTGGATAAGTTTATATAGAAGTATACAAGAGCATTGGTTATAGCAAGAGAAGCTTTTTTCAAAAAGACAGGCATGACTGAACATTATTTTCTTAGAGAATGAATTGATAATTGGTGCAAGAGGTAGCTTCATAACATCACCAAAAAAGTTGATCCAAAAATGGGGATGGGGTTATAAAAAGACCAGAAGATTTTTAAAAAGAAGCGTTATGTAATACTATATTTGGATTAAAAGATTTAAAATAGGTAATACTACATTTACATTAAAAGACTTAAAACAAGTGGTATAGGAACTAGTACAAGCGGAAGAAGTTATAGAGAAATTAAAATAAATTACAGGATTTATATCCCTGATGATAAGGAGGAAATATGACACCGATAGAAATAATGGAAAAGATAGGGGCATGTCAACGGGGGCTGACGAAAGGGAATATAGAATTAAAAGCTTTAGGAGTGAAGAAGGCTAGAGCAGAACATGACTATAGGATAGCTCTAAGAAAAGAGATTTTAAGATTAAGACAGTTAGAGAATCAGCCAGCAACAATAATAAATGACTTAGCTAAAGGAAAAGAAGATATTGCAAAATTAAGACTTGAAAGGGATATAGCAGAAACTAATTACAGTGTATATATAGAAAGTATGAGGAATTTAAGATTAGAGATTGAGGCGTATAGAAGTTTTCTCACATGGGAACGTGTAGAACTTAAAAATACGTAATGTTAAAATTATGATGAACTAAAGAGAGGTAAAGAAGACCTCTTCTTTTCTGATGTAAATTATTATTGATTGCTTAACTCTGATTTTATTTAATTTATCTGCTATTGTTTCATGTGCACCAATAAGATGAGGAAGATTTTGTAATTCTAGTGAGTTTAAATTTGACATAAAATCACCTCTTTAATAATTAGTTCAATAATATTATTGGAAAGAGAATTAAAAATTATACAGTGATGTTTAATACTTAAATATAAAGTTGAGTGAGCTCATGGCAAAATTCAAATATTGAACTAAGATAAAAGATAAGCTTGTATTAGCTGAAGAAAGGGCAAGAAATGAAGTAAGTAATGGACAAATAACAAAGAATCTAGGGATAGATAAGGGTATATTTTATAAATATAAAAAGCAAGTATATAGGATTTTTTATATCTTAGAAAGGGGGAAGGAGATAATGATGATAGATTTTGGAATTAAAGATTCATTTTTAAAAAGAACATTAGAATATAAGTATAAGGAAGTAACCAAGGAATTAGTATAAGATCATAGGACTAAATTGTATACATATATAATAACTTTGATCATTATTAAATATGTATAATAAATAATAAATATATCAGTAACATAATGTTGTTTGTGAACATATTATATTAAGTAATATAGATTAGAAATATTTTGGAGGGTAACTTTGAAGATTAGTAATATTAAAGAAATAACATTATTTGAGCATCATTTTTGGTTACAGATTTTAGGAGATCATTCTAGATTTATTTTAAACTCACTCTCACCAAAAGAAAAATCTTTTATTGAAGAAGCAAACAGATTTAAAAATTTATTTGATAATTTATTAAAGAAATCAAAACAATCACTTTCAGAAGAAGAGCTTTTCGCTTTAAATAATCATGCCTATAATGCAGCTATGAAAATTAGAGAGTTTAAGCTAGATATAATTGATAGGCAGATTACAGATAAAATTGTCATTTCATTGCCACCTACATTTATTAATCATATGGTTAACGAAGTTGATGAATATATATTTATATTAACTAAATTAATGAAAGGAAATGTATCTAATATAGGACCTATTCATCTCCATCTTTTATGGCTTCCAGATGGAGCAGGTCATGCATCCAATATAGCTAGTAGTCTTGATATAACGGAGAAAGAATTGATTAAAAAGAGTAATCAATATTCTAAAAAATTTAATAATTTATACTTAAGGACTATAGAGTACAATGGTTATACAAGAACTGGTATTTGTGATTTCCCAGCACTTGATAGTCTAAATAATAATGCTGACGAAACAATGAGTTGTTTTAAAGAATTTTTAAATGAATTAAAGAAAGGTGTCATAGAAAAGAAAATACTTGGAACTATTGTACCACTAGTACCCGATCATATGTTTAGAGAAGAATGTTACTATTTAACTAAGCTTTCAATGGTTTCAAACATAAAAAAACCCGAATGTGATCCTACAAAATCAAGAGTAGAGAGCTAAATTTAACAAAGCAAAAGAGTCATATTTTATTATCTAAGGTTCTTTTGGTATGATTTTATTATATAGATTGATGTAGTATATTAGTTTATTTTTATTATACCAAGGTATAATAATCCTAATCATAAAGTTATCAACAATATGCATAATAAAAGGGTGACAATTACAATATTGTCACCTGAATTTTTCCTACACCAGTTTGAAATTATCATGATTTGATGAAAAATCCTATAAATTTCAAACTTAGTAATATCAATGAATAGAAGTATTTATAAATTTTATAAAGACAAATTAAAAGGGAGCTATTCAAAAAGCTACAATTTAGTAATATAAATGACTGTAGCTTTTTATTATGTTTTTTATATAGAATTTTTAATATAAATTATTAATAAGGCTTGCTTAGTTGAAAATTAGAAATTGAGTTTTAAATATTTATAATCCTATTACATTCATTTGCAATATTTTTATCATAGGTTACTATTACAATTGTTTTTCCTTTTTTATTTAAAAGTTTTAATAGACCTATTATTTTATAGGAATTTTCTTCGTCCAGTGAGCCAGTAGGTTCATCTGCTAATATTGTTATTAGGAAGGATTAGAAAAAATATTGACAGGTCTTAAGAGGTGATGTATAGTTTTATTAAGCGGTATAATTTACTACTTAATAAAACTATTTTTACTATTTATTATTATATTATATAGGGGACATTCTTATTTACGCCTCTTTATTTTATTTTTATTTAAAAGGATTTCTATTGATATATAGAGGTCCTTTTTTATTTAAAAGATTTTTGTTAATATAAAAATTTTTTTATTTCAAATCATATATATAACAAATTAAATAATTTAGAAAATATAATATTAAAAGTCTATAAATATTTTTAATTTAATAAAATAGAGAATTTAATAAAGTTATAACTTTATCTGAATATAATAATATAAAGAGAGGAGGAGTAGACTTGAAACTAACTTATGTATTAGATACTAATGTTATTTTGTATTCACCAGGAGCTATATTTTCTTTTGCAGATAATGATGTAGTTATACCTGAAGTAGTTTTAGAAGAATTAGATAGCTTTAAAAAGAATAATTATGATTTAGGGGCTAATGCTAGGCATGCAGCAAGAATAATAGATAAATTAAGAAAAGATGGAAGTTTAATAGATGGTATAGTATTACCTGGTGGAGGAACTTTAAGAGTAGAAATGAATCATTATGATGTAAAATTGCCTCCGTCTTGGGATAAGAATAAGCCGGATAACAGAATAATACAGGTTTGTAAGGGATTAAAAGAAAAAGGGGAAGAAGTAGTATTAATTACAAAGGATACCTTTGAGAGGATAAAGGCGGATACTATTAATATAGATGTAGAGGATTTTTATGAAAAGGTAGTACCAGAATATGAAAGTCAATATAAAGGAAGATGTGATGCTTTTGCATCTCACAGTACTTTAGAAAGTTTTTATAAAAATAAATATATGGATGTAGAGAGCTTATTTTTTTATTCAGAAGAGAAAAATGATTACTATAAAGCAGATATCAATATAAATGAATTTATATTAATTAAATCTATGGAAAATCCAAAACAAACAGCTCTGGGAAGATATAATGGAGAAAAAGTTGTTCCTCTTTTTTATAAAGACGTCAAGCCTCTAGGAATAAGTCCTAGAAACATAGGACAAAAGTTTATGTTAGAAGCTTTTTTAACAGATTCTAAAAATGCACCTTTAGTTATAGTAAAGGGACCTGCAGGTACAGCCAAGACTTTATTCTCTTTAGCTACAGGACTTCATAAAGTTATGGAAGAGGGAGAAGATGGATATAGAAAAATTTTAATCTGTAGACCTAATGTAACTATGGATGAAGATATAGGGTTTTTACCTGGAACAGAGGAAGAAAAAATAATGCCTTTTATGAGACCCATTTTTGATAATTTAGAGATTTTAGTGGATTCTGATGAAAAGGAAAGATATAAAAATGAAAAAGAATTATATGATAAGATAAAAGAGCTATTTGATAGGAGAATTATAACTACAGAAGCAGTAGCTTATTTGAGAGGTAGATCTATAGTGAAAAATTGGGTTATAATAGATGAAGCTCAAAATTTAACACCAAAGCAGGTGAAGGCGGTTATAACTAGAGTAGGACAAGGAACGAAACTTATATTAGTAGGTGATCCAGATCAAATAGATCAACCGTTTTTAGACTCTAGATCAAATGGTTTATGTTATGCATCAGAAAAAATGAAAGGAAGCAAACTTTGTTATCAGGTAACATTAAAGGATCATGAATGTGAAAGATCACCATTAGCCTATGAGGGAGCAAAGCGATTATAATTTTATACTATATGTAAGTAGAGGGCGCCTCAAAATCAAATATATTTTGTGGTGTCCTCTATATTTTATATGATATAATTTATTACAATTGCACTTATGTAAGTTAATGTATAAATAGTTTTAATTTGGAAAATATATTGCAGTTTAAAGGGAAATAAAATGAATTTTAGGAAGTTTTACAATATTTCATAAAGCTTACTATTTAAAAAAATTTATATTTAGTGTACAATAATGAAAGATGTAAAATAAAGAGAAAGGAATTTTTAGATGGAAAATAAAGAGAAAAAGTCGAAAAATAAGAAATTTTCTTTTAAAATATTTTTATATTTTATAATTTTTGAATTGTTTTTTACAGCAGCCACAGCGCCTTTTATAATATTCCATGGTCCTTTTAAAAATGTTAAAAAGACTATGGTAGGAGCAGCTATGACTACTTTAAAACATCAATATATAGCTAAAACATTTTTATCAGATGCTAAAATAAAAGAGATATTAGGTGAAGATTCTATACAAACTATAAAACAAGATAAGAACTCTGTGTTAAAATTTGAAAACAAACATGATAGTACAATAGAAAGATATGATATAAGTTATGGTAAAAAGTTCAAAGGATATATGTTAGTAGTTCATGATCCATCTAGGGTAAAGGTTGGATATAGTTCTAAGTTACCAGTACAAGGAGAACTTACAAGTCAGATAGCAAGAAATAAAAGAGCTGTTGCAGCTATTAATGCAGGTGGCTTTACAGATAAATCAGCTAATAGCAAGTGGACAGGTACCGGTGGAAATGTTGAAGGGGTAATAATTAGTAAAGGTGAAGTTAAATATAATAGTAATAAGCAAGGAGAATTTACAGGAGATGTAGCAGCTATAACTAAAAAGGGGGCTTTAGTTGTAGGTAAACATAGTATACAAGAATTAAAAGATTTAAATGTACAAGAAGCTATAACTTTTGGACCAGCCTTAGTAGTAAAGGGGCAAGGCACCATAACTTCTGGAGATGGCGGATGGGGAATGGCGCCTAGAACTGCTATTGGACAAAGAGAAGACGGAGCTATACTTATGCTGGTTATAGATGGTAGACAAGCATCTAGTTTAGGAGCTACATTAAAAGATGTACAAGATATCATGTTACAATATGATGCATATACTGCTACAAATTTAGACGGTGGATCTTCAACTACAATGTATCATGAAGGAGAAGTTATAAATAATCCTGCTAATTCTTTAGGAGAAAGATCAGTACCATCTATTTTGTATGTTGAACCTTAG
Protein sequences of DBSCAN-SWA_1 >NZ_CP028842|575757:585171|578633_578843_+|WP_011986136.1|DBSCAN-SWA MLKAKEKALPKGFNEARFLQNCMTVLKDIKNIEKCNEVSVVRTMLKGVFLGLDFFNKECYAIPVYLNLF >NZ_CP028842|575757:585171|580756_581566_+|WP_011948236.1|DBSCAN-SWA MKISNIKEITLFEHHFWLQILGDHSRFILNSLSPKEKSFIEEANRFKNLFDNLLKKSKQSLSEEELFALNNHAYNAAMKIREFKLDIIDRQITDKIVISLPPTFINHMVNEVDEYIFILTKLMKGNVSNIGPIHLHLLWLPDGAGHASNIASSLDITEKELIKKSNQYSKKFNNLYLRTIEYNGYTRTGICDFPALDSLNNNADETMSCFKEFLNELKKGVIEKKILGTIVPLVPDHMFREECYYLTKLSMVSNIKKPECDPTKSRVES >NZ_CP028842|575757:585171|584166_585171_+|WP_011948238.1|DBSCAN-SWA MENKEKKSKNKKFSFKIFLYFIIFELFFTAATAPFIIFHGPFKNVKKTMVGAAMTTLKHQYIAKTFLSDAKIKEILGEDSIQTIKQDKNSVLKFENKHDSTIERYDISYGKKFKGYMLVVHDPSRVKVGYSSKLPVQGELTSQIARNKRAVAAINAGGFTDKSANSKWTGTGGNVEGVIISKGEVKYNSNKQGEFTGDVAAITKKGALVVGKHSIQELKDLNVQEAITFGPALVVKGQGTITSGDGGWGMAPRTAIGQREDGAILMLVIDGRQASSLGATLKDVQDIMLQYDAYTATNLDGGSSTTMYHEGEVINNPANSLGERSVPSILYVEP >NZ_CP028842|575757:585171|580089_580239_-|WP_011948235.1|DBSCAN-SWA MSNLNSLELQNLPHLIGAHETIADKLNKIRVKQSIIIYIRKEEVFFTSL >NZ_CP028842|575757:585171|582522_583899_+|WP_011948237.1|DBSCAN-SWA MKLTYVLDTNVILYSPGAIFSFADNDVVIPEVVLEELDSFKKNNYDLGANARHAARIIDKLRKDGSLIDGIVLPGGGTLRVEMNHYDVKLPPSWDKNKPDNRIIQVCKGLKEKGEEVVLITKDTFERIKADTINIDVEDFYEKVVPEYESQYKGRCDAFASHSTLESFYKNKYMDVESLFFYSEEKNDYYKADININEFILIKSMENPKQTALGRYNGEKVVPLFYKDVKPLGISPRNIGQKFMLEAFLTDSKNAPLVIVKGPAGTAKTLFSLATGLHKVMEEGEDGYRKILICRPNVTMDEDIGFLPGTEEEKIMPFMRPIFDNLEILVDSDEKERYKNEKELYDKIKELFDRRIITTEAVAYLRGRSIVKNWVIIDEAQNLTPKQVKAVITRVGQGTKLILVGDPDQIDQPFLDSRSNGLCYASEKMKGSKLCYQVTLKDHECERSPLAYEGAKRL >NZ_CP028842|575757:585171|575757_577986_+|WP_011948233.1|DBSCAN-SWA MIIKKKLLLKGLHCANCATKIERAVQKLNIIEEANYNFNNSTLIINLEETHKDSIIKTIQEIVDRIEPGVKVVDKENLKRTVVHAPVKNSSNLKMQNNKEENLKLDKKENSYEHNHDHSHGHSHDGEDSDELEKKTLIRIISGVVLLILATVLKSKETLSIGLYLTSYVLIGGKVILSSIRNISKGQVFDENFLMAVATVAAIGVKQYPEAVAVMLFYEVGEFLQDKAVNKSRKSITALMNIRPDYANLVRGEDIEVVSPEDINIDDIIMVKPGEKIPLDGIVVEGQSFVDTSAITGESLISEVSKDSNVLSGYINKNGVIKIKVTKTFGESTVSKILELTENASATKANTEKFITKFARYYTPVVVFAALALAVIPTLILKDPDISKWIYRAAVFLVVSCPCALVISIPLSFFAGIGGASKKGVLIKAGTALEALNDADTIVFDKTGTLTKGVFKVSKIDSEEGVNTEELIEYAAYVESYSNHPIAKSILKYYEKTIDNKRIEGYEEIVARGVTAYIDGKKVYAGNNKLMEELNINYKKAQEDGVILYIALEDKYIGYIVINDEIKKDSKETIKSLKDIGIKKAAMLTGDRKSTANNIGTFLGMDEIYSELLPQEKVEKMQSLKSKTSKDGKIVFVGDGVNDAPVLAMSDIGVSMGGLGSDAAIEASDLVLMSDEPSKLVDAIKIARKTHKIVWQNIIIVLIIKFAVLALAVMGKSTMWMAVFADVGVALIAVINALRILK >NZ_CP028842|575757:585171|579723_580071_+|WP_003356906.1|DBSCAN-SWA MTPIEIMEKIGACQRGLTKGNIELKALGVKKARAEHDYRIALRKEILRLRQLENQPATIINDLAKGKEDIAKLRLERDIAETNYSVYIESMRNLRLEIEAYRSFLTWERVELKNT |
7 | Bacillus_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
910782 : 922501
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NZ_CP028842|910782:922501|DBSCAN-SWA ATTAATTAGTAATATCTATATGCAATCTTATATTATAGTTATTTAATTCTGTAACTTCTACTTTTAATATATAAATTGCACCATTTAATAAACGTATTGAATTGGTATTATTTAAGAGGTGTAAATTTTGTTGTATATTAATTAAATTATAGCCGTCAATAGTTTCAGTGACTCTAAATAAAGTACCTATTCCTTGGTTATAACTAGTATAAAGCCTAATGTTAGATGTATCTTTATTATTAAAGTTACCAGGTATTGTAAATTCATATGAAATATAGTCATGGACATCAGGGCTTTGTCTTGTATAGTAATGTGCACCTGTTGAATTAAGATTATCTATTATATTAACTGAAGAATTCATTAAATTTCGGAGATCCCCTTCTTCTCTCTTGAATTGTATTTGATTTTCTATATTAGAAGAAGTTTGTGGTACTCTAATGTAGTAATTTTTATCCTTATTAAGCAAAACAACTAAATAACTTTTAGCATTAGGACTGTCAAACCCAGTAATATAATTTATTGCTTTAATATCATCATCACATAAATTCCCAGATTGGAAATTTCTATTACCAGAACCTATCGCTTCATATATTTTTAATGATGGTAGATTATTTTGAGCATTAATTTTATAAATTCCTGTAGTATTTACTGTAAATAATATATAAAATGGATTATTATTTACAATACCTGGAATGTTATATGTGTAATTATCTGAAATAGCAGTATTTATTTCTTGTATATTTTCAGATGGGTCTATGACACCTACTACAATTTCTTCCTCGGGACCATTTTGTATAAATCCATCTTCAGCCACTTGCATTTTAACTACTTCAGATTCAGGTGAAGGAGCATTAGTTACTTCACAATATCCTAAGGAAGGAAGATAATACTCAGCTTTATTAACAATACTTCCATTTTGATAGTCTATTAATTCATATTTTTCATAGGTATTATAAGCCTTTATGCATATATTTTTATCTGAAGGAGCTTCTTCTACAAATTTAAATAACGATGTTGATGTATTAAATAATTGTACATTGAAAGCGTCTTTAAGTCTTTCTTCAGTATATTGTTGTGAGAATTTTGTATCATTACTTGTGGTGAATAATGGTCTAGTTGTATTTCTTAATCGAGGTTGTATAATACTTCCTGATGAACCTGCTTCGATTAATAATGTACCTATCAAATCTTTATCATTTGTTCTTATATATCCATCACCCTTATTAATAACATATAGCCCATTACTATAAGGCAATACTCGTTGTGTGCTACTAACTTTAGAATTAAAAATATTGTTAGTTGGTATATTTTTAGTAGTTTCTAAAATTTTTTTATATAGGAATTGTTCATTTAAAATGCACTTATCATTAGTTAGAAAGTAAAAATCTTTATTTATTTTTTCCCCTGGATTAAATTCTATAGACTTAACATATCCAAGAGATGGAACATATAAAACTGCTCTTTCTATAATTTCATGTTGTAAGACTTTTATTATTTCATATCTAATGTAGGTATATTGTAAATACATATATAAGTTTTTATTTGAGGGAGCGGTTTTACTAAATTCAAATCCTATTGGAATTTGATTAGCTTCAGTAAAGTTAGTAAATACAGTTTGTATATTATTTTTTATATATTCTTCATTGAAAGATGGTGTTGGATAATAATATGGTATCGCATTATCATTTACACGTAGGTCCCCAACTATTCCTGTTGATCCATTACTAATTACACTTCCACCTAATATTTGATTTTGTCTAGATAATATCCATCCATCCCCTCTTCTAACTACATAATTACCATCAGCTAAATCAATAGTATCACTATAGTTTATAACTTTTTCTTGTATATCATTATAAATTTTTTTTATAGATGAATTCATACACTTTTCTCCTTTATATTTTTTCAAGTTTGAACATTTGATTTGAATTGTATATATCAAAATTCGGTAATAGGAGTAGTGGTTGGCTTAAAATATTTTCATTAGTATCATAAATGTCCCAGGCATAATCTAATTCATTCACTTTATTTAAACTTAACATAATATAAGTATTTACAGCAATTTTAATAGGAAACCAGTAGCATCTATTGGATAATGAATCTAAAGAAATAAATCCAAAGTTATCGTAACTTAAATACTTATTTGGTTCTGCTACATTAGAGATTTTAAAGCATCTATTTTCAGCCATATATTCTACATTCCATTTTTGATTATTTGCAGAAGATTCATTTGAAAATGTTAATGATTTCGATACAGGATTTAAATATAAAGAACCAGAAAAGATAGATTTTATATTGTAATTACCATTAGGTAGAAAAGTTCTTTCAACTGACATATAATTCACCTCTTTATAAATTAGATGATAGTACTCATATTAAATCTTTGTTAATATTAATTTTATGGGTTACGAATATTCCATTTCTGATTATCATCTCCATGATAATTAAATACTTGAATAGCAGTTCCGTTTGCTGTTTGGCCGCCATATAAATCTAGAGCTTTAGTTGTATCGCGTAGATTAGTAATTGTATATGTTTCATCAGTATCTGAAACAGGATTTATAAGCCAATATTGGGCGTCATTATTTTGATCATTAGAAGAAGAAACCCTTACAGTATTACCATTTGAAAAAATCCATGTTAGAACTCCGTTTGAAAGTATTGTATTAAAAAACTGGTATGCTGCTTTTTCTTCATTATATCTAATTGTCCATTTTTGATTGCGACCATAGTCCCAAGTATATAAATTAACATTTAGATTTGTCACATCCACTTGTTGTACAACTTTATTAAGATCTAATATTGGACTTATTTTACATGTGAAATTGTTAAGATCTGATATTATATAATCTTCTATGATAAATTTTATATAATTTGAATTATTAAGTGTGCTAAGCTTCAAATTACGAGCTACGGTATCAGCATATAATACTAAGTTAGGGTTTTTATAACTTGCAATAATAAATGAATTGTTACCAATGTCTTTTAATAATAACCAATATTGATTATCTGCATTTGAATCTTGTTGCGTTGATATATTATGTGTTGGTGCATTCCATGTTAAAACTAAATTAGTATTATGGATATCCATACTTTTTATTTTATAAGCAGCTTTATTAGAATCATATATAAGTCTCCATCTTTCAAGGTAATTTCTAGTTTGTTGAAATAAGCTAACGTTACCGGCAACTTGATAAAAAAATAAATTAGTATCGGCCTTACAGGAGATGGTAACAATTTTGTCATTTAATGAATTTTGGATTACTGAATAGTGTTCCATTATGATTCCTCCTTTATTTAAGAATTAATCTTACATATAACATATAACATAATCAAATTATTTTTTGTAAACCTAAAATTTAAATATATCAAATTTTTATTAGTATGTTTACATAATTGATTATGGATATTTCGTAAAAATGGCTTATTAAAAATTTAAAGGCAATTAGTTTATTTATAGTATAATAAAAAAATAATATGTATATTATGGAAGGGTAGTGGTAAATATGAATAAATTGTTTTTACAAATTAAAATGTTAAAAAATGACAATAGGGAGTTTCAAGAAATTTTTAAGCATTTTGAAAAAACTATAAATATATTTACTAGAAAATATAATATATATGATAATTACAATGATATTTTGTACCATTTATGGTATACACTTAAAAAAGTTGATTTGAGCAATTTCAATACACAAAATGATTTAGAGAGATATATTAGTAGGACTTTAAAAAGATATTGCTTAGATATTTGCAATAAAAGAAAGATTGATAAGAAAATAATATATAATTCAGAAATTGTAGATAAGAAATTAAGCTTAATAGCAAATAGTTATTCAAGTTATTTAGAATTTGAATTTAATGATTTAATATCCATATTACCTGATGATCAAAAGAAAATTATATATATGAAATTTGTTGAAGATATTAAGGAGATAGATATAGCTAAAAAACTTAATATAAGTCGTCAATCTGTATATAAAAATAAAATAATGGCTTTAGAGAGATTAGAACCCATATTGAAAAAATTAATTAATATGTAGTTTATATTTTTAAAAAATTTTAGGTTTACAAAAAATAGTGTGGCTATGTTATATATAAATGATAAGAATATACTGAAAAATGTATCCAAAATTTAAGGGGGCGTGTATAGTAAATAATTAAAAGTATGTGCGTTGAAATAAATTTAGGAGGGTGGTTAGATATGAATATAAATGACAACTTAAGTATAAATTCCCCGGTAGATAATAAAAATGTTGTAGTAGTTAGAGCTAGAAAAACTGATACGGTTTTTAAGGCTTTTAAGGTTGCTCCCAATATTTGGGTGGCGCCAGAGAGATATTATGGCGAATCTTTGAGTATAGATGAAGAATATAAAGTTGATGGGGGAATATATGATTCTAATTTTCTTTCACAAGATAGTGAAAAAGATAAGTTCTTACAAGCCATTATTACTTTGTTAAAAAGAATTAATAGTACTAACGCTGGGGAAAAGTTATTATCTTTGATTTCTACAGCTATTCCATTTCCTTATGGATATATAGGTGGAGGGTATTATGCACCTAATATGATTACTTTTGGATCAGCACCAAAATCTAATAAAAAATTGAATTCTTTAATTTCAAGTACTATTCCATTTCCTTATGCAGGATATAGAGAAACAAATTATCTTTCATCTGAAGATAATAAAAGTTTCTATGCATCTAATATAGTTATTTTTGGTCCAGGAGCAAACATAGTAGAAAACAATACTGTTTTTTATAAAAAGGAAGATGCAGAAAATGGAATGGGAACAATGACTGAAATATGGTTCCAACCATTTCTAACCTATAAATATGACGAATTTTATATTGATCCTGCAATAGAATTAATAAAATGTTTAATAAAATCTCTTTATTTCTTATATGGTATAAAACCTAGTGATGATTTAGTTATTCCATATAGATTAAGAAGTGAATTAGAGAATATAGAATACTCACAATTGAATATAGTTGATTTACTAGTATCTGGAGGCATTGATCCTAAATTTATAAATACAGATCCATATTGGTTTACAGATAATTATTTCTCAAATGCAAAAAAAGTGTTTGAAGATCATAGGAATATTTATGAAACAGAAATTGAAGGAAATAATGCCATTGGTAATGATATAAAATTGAGATTAAAACAAAAGTTTCGAATCAATATCAATGATATATGGGAATTAAATTTAAATTATTTCTCTAAAGAGTTTAGCATTATGATGCCAGATAGATTTAATAATGCACTTAAACATTTTTATAGAAAACAATACTACAAAATAGATTATCCAGAAAATTATAGTATAAATGGTTTTGTTAATGGTCAAATTAATGCTCAATTATCTTTATCAGATAGAAATCAAGATATTATAAATAAACCTGAAGAAATAATTAATTTATTAAATGGAAATAATGTTTCATTAATGAGAAGTAATATTTATGGTGATGGATTAAAAAGCACTGTAGATGATTTTTACAGTAATTATAAAATCCCATATAATAGAGCCTATGAATATCATTTTAATAATTCAAATGATTCTTCTTTAGATAATGTTAACATTGGAGTAATAGACAATATTCCAGAGATTATAGATGTAAATCCTTATAAGGAAAATTGTGATAAGTTTTCACCGGTACAGAAAATTACAAGTACTAGAGAAATTAATACAAATATACCATGGCCTATAAATTATTTACAAGCTCAAAATACTAACAATGAAAAATTTAGTTTATCCTCAGATTTTGTAGAAGTAGTTTCTTCTAAAGATAAATCTTTAGTGTATTCTTTCTTATCTAATGTAATGTTTTATTTAGATTCCATAAAGGATAATAGTCCTATTGATACAGATAAAAAATATTATTTATGGTTAAGAGAGATTTTTAGAAATTATTCTTTTGATATTACTGCAACTCAAGAAATTAATACTAATTGTGGTATTAATAAAGTAGTAACTTGGTTTGGGAAAGCATTAAATATTTTAAATACATCTGATTCTTTTGTAGAAGAATTTCAAAATTTAGGGGCAATTTCACTTATTAATAAAAAAGAAAATTTAAGTATGCCAATAATTGAGAGTTATGAAATCCCTAACGATATGTTAGGATTACCACTAAATGATTTAAATGAAAAATTATTTAACATATATTCTAAAAACACAGCTTATTTTAAAAAAATCTACTATAATTTCCTAGATCAGTGGTGGACACAATATTATAGTCAATATTTTGATTTAATTTGTATGGCTAAAAGATCAGTGTTAGCTCAAGAAACTTTAATAAAAAGAATAATACAAAAAAAATTGAGTTATTTAATAGGAAATTCTAATATATCATCTGATAACTTAGCATTGATGAATCTTACAACAACAAATACATTAAGAGATATTTCAAACGAATCACAAATAGCAATGAATAATGTAGATAGTTTTTTAAATAATGCCGCTATATGTGTTTTTGAAAGTAATATATATCCTAAATTTATTTCTTTTATGGAACAATGTATTAATAATATAAATATTAAGACAAAAGAATTTATACAAAAATGTACTAATATTAATGAAGATGAAAAATTACAATTAATTAACCAGAATGTTTTTAATAGCTTAGATTTTGAATTCTTAAATATTCAAAATATGAAAAGTTTATTTAGTTCAGAGACAGCATTACTTATAAAGGAAGAAACTTGGCCTTATGAACTAGTGTTATATGCTTTTAAGGAACCAGGTAATAATGTTATCGGAGATGCATCTGGTAAAAATACATCAATAGAATATTCTAAGGACATAGGTTTAGTTTATGGAATAAATAGTGATGCATTATATTTAAATGGATCTAATCAAAGTATAAGTTTTTCTAATGATTTCTTTGAGAATGGATTAACTAACAGTTTTTCAATTTATTTTTGGTTGAGAAATTTGGGCAAAGATACTATTAAATCTAAGTTAATAGGTAGTAAGGAAGATAATTGTGGTTGGGAAATTTATTTTCAAGATACTGGGTTGGTTTTCAATATGATAGATTCTAATGGAAATGAGAAGAATATATATCTATCTGATGTTTCTAATAATAGTTGGCACTATATAACTATATCTGTAGATCGTTTAAAAGAACAATTATTAATATTTATTGATGATAATTTAGTGGCTAATGAAAGTATTAAGGAAATTTTAAATATCTATTCAAGTAATATAATTTCTTTATTAAGCGAGAATAATCCAAGTTATATTGAGGGATTAACTATTTTAAATAAACCCACTACAAGTCAGGAAGTTTTGAGTAATTATTTTGAAGTTCTAAATAATTCATATATAAGAGACAGTAATGAAGAACGATTAGAATACAATAAGACATATCAATTATATAATTATGTATTTTCAGATAAGCCTATATGTGAAGTTAAACAAAATAATAATATATATTTAACAATTAATAATACAAACAATTTAAATCTACAAGCTTCTAAATTTAAATTATTAAGTATAAATCCAAATAAACAATATGTTCAAAAACTTGATGAGGTAATAATTTCTGTATTAGATAATATGGAAAAATATATAGATATATCTGAAGATAATAGATTGCAACTAATAGATAACAAAAATAACGCAAAGAAGATGATAATTAGTAATGATATATTTATTTCCAATTGTTTAACCCTATCTTATAACGGTAAATATATATGTTTATCTATGAAAGATGAAAACCATAATTGGATGATATGTAATAATGATATGTCAAAGTATTTGTATTTATGGTCATTTAAATAATTAATAATTTAATTAATTTTAAATATTATAAGAGGTGTTAAATATGCCATTTGTTAATAAACAATTTAATTATAAAGATCCTGTAAATGGTGTTGATATTGCTTATATAAAAATTCCAAATGCAGGACAAATGCAACCAGTAAAAGCTTTTAAAATTCATAATAAAATATGGGTTATTCCAGAAAGAGATACATTTACAAATCCTGAAGAAGGAGATTTAAATCCACCACCAGAAGCAAAACAAGTTCCAGTTTCATATTATGATTCAACATATTTAAGTACAGATAATGAAAAAGATAATTATTTAAAGGGAGTTACAAAATTATTTGAGAGAATTTATTCAACTGATCTTGGAAGAATGTTGTTAACATCAATAGTAAGGGGAATACCATTTTGGGGTGGAAGTACAATAGATACAGAATTAAAAGTTATTGATACTAATTGTATTAATGTGATACAACCAGATGGTAGTTATAGATCAGAAGAACTTAATCTAGTAATAATAGGACCCTCAGCTGATATTATACAGTTTGAATGTAAAAGCTTTGGACATGAAGTTTTGAATCTTACGCGAAATGGTTATGGCTCTACTCAATACATTAGATTTAGCCCAGATTTTACATTTGGTTTTGAGGAGTCACTTGAAGTTGATACAAATCCTCTTTTAGGTGCAGGCAAATTTGCTACAGATCCAGCAGTAACATTAGCACATGAACTTATACATGCTGGACATAGATTATATGGAATAGCAATTAATCCAAATAGGGTTTTTAAAGTAAATACTAATGCCTATTATGAAATGAGTGGGTTAGAAGTAAGCTTTGAGGAACTTAGAACATTTGGGGGACATGATGCAAAGTTTATAGATAGTTTACAGGAAAACGAATTTCGTCTATATTATTATAATAAGTTTAAAGATATAGCAAGTACACTTAATAAAGCTAAATCAATAGTAGGTACTACTGCTTCATTACAGTATATGAAAAATGTTTTTAAAGAGAAATATCTCCTATCTGAAGATACATCTGGAAAATTTTCGGTAGATAAATTAAAATTTGATAAGTTATACAAAATGTTAACAGAGATTTACACAGAGGATAATTTTGTTAAGTTTTTTAAAGTACTTAACAGAAAAACATATTTGAATTTTGATAAAGCCGTATTTAAGATAAATATAGTACCTAAGGTAAATTACACAATATATGATGGATTTAATTTAAGAAATACAAATTTAGCAGCAAACTTTAATGGTCAAAATACAGAAATTAATAATATGAATTTTACTAAACTAAAAAATTTTACTGGATTGTTTGAATTTTATAAGTTGCTATGTGTAAGAGGGATAATAACTTCTAAAACTAAATCATTAGATAAAGGATACAATAAGGCATTAAATGATTTATGTATCAAAGTTAATAATTGGGACTTGTTTTTTAGTCCTTCAGAAGATAATTTTACTAATGATCTAAATAAAGGAGAAGAAATTACATCTGATACTAATATAGAAGCAGCAGAAGAAAATATTAGTTTAGATTTAATACAACAATATTATTTAACCTTTAATTTTGATAATGAACCTGAAAATATTTCAATAGAAAATCTTTCAAGTGACATTATAGGCCAATTAGAACTTATGCCTAATATAGAAAGATTTCCTAATGGAAAAAAGTATGAGTTAGATAAATATACTATGTTCCATTATCTTCGTGCTCAAGAATTTGAACATGGTAAATCTAGGATTGCTTTAACAAATTCTGTTAACGAAGCATTATTAAATCCTAGTCGTGTTTATACATTTTTTTCTTCAGACTATGTAAAGAAAGTTAATAAAGCTACGGAGGCAGCTATGTTTTTAGGCTGGGTAGAACAATTAGTATATGATTTTACCGATGAAACTAGCGAAGTAAGTACTACGGATAAAATTGCGGATATAACTATAATTATTCCATATATAGGACCTGCTTTAAATATAGGTAATATGTTATATAAAGATGATTTTGTAGGTGCTTTAATATTTTCAGGAGCTGTTATTCTGTTAGAATTTATACCAGAGATTGCAATACCTGTATTAGGTACTTTTGCACTTGTATCATATATTGCGAATAAGGTTCTAACCGTTCAAACAATAGATAATGCTTTAAGTAAAAGAAATGAAAAATGGGATGAGGTCTATAAATATATAGTAACAAATTGGTTAGCAAAGGTTAATACACAGATTGATCTAATAAGAAAAAAAATGAAAGAAGCTTTAGAAAATCAAGCAGAAGCAACAAAGGCTATAATAAACTATCAGTATAATCAATATACTGAGGAAGAGAAAAATAATATTAATTTTAATATTGATGATTTAAGTTCGAAACTTAATGAGTCTATAAATAAAGCTATGATTAATATAAATAAATTTTTGAATCAATGCTCTGTTTCATATTTAATGAATTCTATGATCCCTTATGGTGTTAAACGGTTAGAAGATTTTGATGCTAGTCTTAAAGATGCATTATTAAAGTATATATATGATAATAGAGGAACTTTAATTGGTCAAGTAGATAGATTAAAAGATAAAGTTAATAATACACTTAGTACAGATATACCTTTTCAGCTTTCCAAATACGTAGATAATCAAAGATTATTATCTACATTTACTGAATATATTAAGAATATTATTAATACTTCTATATTGAATTTAAGATATGAAAGTAATCATTTAATAGACTTATCTAGGTATGCATCAAAAATAAATATTGGTAGTAAAGTAAATTTTGATCCAATAGATAAAAATCAAATTCAATTATTTAATTTAGAAAGTAGTAAAATTGAGGTAATTTTAAAAAATGCTATTGTATATAATAGTATGTATGAAAATTTTAGTACTAGCTTTTGGATAAGAATTCCTAAGTATTTTAACAGTATAAGTCTAAATAATGAATATACAATAATAAATTGTATGGAAAATAATTCAGGATGGAAAGTATCACTTAATTATGGTGAAATAATCTGGACTTTACAGGATACTCAGGAAATAAAACAAAGAGTAGTTTTTAAATACAGTCAAATGATTAATATATCAGATTATATAAACAGATGGATTTTTGTAACTATCACTAATAATAGATTAAATAACTCTAAAATTTATATAAATGGAAGATTAATAGATCAAAAACCAATTTCAAATTTAGGTAATATTCATGCTAGTAATAATATAATGTTTAAATTAGATGGTTGTAGAGATACACATAGATATATTTGGATAAAATATTTTAATCTTTTTGATAAGGAATTAAATGAAAAAGAAATCAAAGATTTATATGATAATCAATCAAATTCAGGTATTTTAAAAGACTTTTGGGGTGATTATTTACAATATGATAAACCATACTATATGTTAAATTTATATGATCCAAATAAATATGTCGATGTAAATAATGTAGGTATTAGAGGTTATATGTATCTTAAAGGGCCTAGAGGTAGCGTAATGACTACAAACATTTATTTAAATTCAAGTTTGTATAGGGGGACAAAATTTATTATAAAAAAATATGCTTCTGGAAATAAAGATAATATTGTTAGAAATAATGATCGTGTATATATTAATGTAGTAGTTAAAAATAAAGAATATAGGTTAGCTACTAATGCATCACAGGCAGGCGTAGAAAAAATACTAAGTGCATTAGAAATACCTGATGTAGGAAATCTAAGTCAAGTAGTAGTAATGAAGTCAAAAAATGATCAAGGAATAACAAATAAATGCAAAATGAATTTACAAGATAATAATGGGAATGATATAGGCTTTATAGGATTTCATCAGTTTAATAATATAGCTAAACTAGTAGCAAGTAATTGGTATAATAGACAAATAGAAAGATCTAGTAGGACTTTGGGTTGCTCATGGGAATTTATTCCTGTAGATGATGGATGGGGAGAAAGGCCACTGTAA
Protein sequences of DBSCAN-SWA_2 >NZ_CP028842|910782:922501|914287_914824_+|WP_011948509.1|DBSCAN-SWA MNKLFLQIKMLKNDNREFQEIFKHFEKTINIFTRKYNIYDNYNDILYHLWYTLKKVDLSNFNTQNDLERYISRTLKRYCLDICNKRKIDKKIIYNSEIVDKKLSLIANSYSSYLEFEFNDLISILPDDQKKIIYMKFVEDIKEIDIAKKLNISRQSVYKNKIMALERLEPILKKLINM >NZ_CP028842|910782:922501|912676_913117_-|WP_003356711.1|DBSCAN-SWA MSVERTFLPNGNYNIKSIFSGSLYLNPVSKSLTFSNESSANNQKWNVEYMAENRCFKISNVAEPNKYLSYDNFGFISLDSLSNRCYWFPIKIAVNTYIMLSLNKVNELDYAWDIYDTNENILSQPLLLLPNFDIYNSNQMFKLEKI >NZ_CP028842|910782:922501|914985_918567_+|WP_011948510.1|DBSCAN-SWA MNINDNLSINSPVDNKNVVVVRARKTDTVFKAFKVAPNIWVAPERYYGESLSIDEEYKVDGGIYDSNFLSQDSEKDKFLQAIITLLKRINSTNAGEKLLSLISTAIPFPYGYIGGGYYAPNMITFGSAPKSNKKLNSLISSTIPFPYAGYRETNYLSSEDNKSFYASNIVIFGPGANIVENNTVFYKKEDAENGMGTMTEIWFQPFLTYKYDEFYIDPAIELIKCLIKSLYFLYGIKPSDDLVIPYRLRSELENIEYSQLNIVDLLVSGGIDPKFINTDPYWFTDNYFSNAKKVFEDHRNIYETEIEGNNAIGNDIKLRLKQKFRININDIWELNLNYFSKEFSIMMPDRFNNALKHFYRKQYYKIDYPENYSINGFVNGQINAQLSLSDRNQDIINKPEEIINLLNGNNVSLMRSNIYGDGLKSTVDDFYSNYKIPYNRAYEYHFNNSNDSSLDNVNIGVIDNIPEIIDVNPYKENCDKFSPVQKITSTREINTNIPWPINYLQAQNTNNEKFSLSSDFVEVVSSKDKSLVYSFLSNVMFYLDSIKDNSPIDTDKKYYLWLREIFRNYSFDITATQEINTNCGINKVVTWFGKALNILNTSDSFVEEFQNLGAISLINKKENLSMPIIESYEIPNDMLGLPLNDLNEKLFNIYSKNTAYFKKIYYNFLDQWWTQYYSQYFDLICMAKRSVLAQETLIKRIIQKKLSYLIGNSNISSDNLALMNLTTTNTLRDISNESQIAMNNVDSFLNNAAICVFESNIYPKFISFMEQCINNINIKTKEFIQKCTNINEDEKLQLINQNVFNSLDFEFLNIQNMKSLFSSETALLIKEETWPYELVLYAFKEPGNNVIGDASGKNTSIEYSKDIGLVYGINSDALYLNGSNQSISFSNDFFENGLTNSFSIYFWLRNLGKDTIKSKLIGSKEDNCGWEIYFQDTGLVFNMIDSNGNEKNIYLSDVSNNSWHYITISVDRLKEQLLIFIDDNLVANESIKEILNIYSSNIISLLSENNPSYIEGLTILNKPTTSQEVLSNYFEVLNNSYIRDSNEERLEYNKTYQLYNYVFSDKPICEVKQNNNIYLTINNTNNLNLQASKFKLLSINPNKQYVQKLDEVIISVLDNMEKYIDISEDNRLQLIDNKNNAKKMIISNDIFISNCLTLSYNGKYICLSMKDENHNWMICNNDMSKYLYLWSFK >NZ_CP028842|910782:922501|913179_914061_-|WP_011948508.1|DBSCAN-SWA MEHYSVIQNSLNDKIVTISCKADTNLFFYQVAGNVSLFQQTRNYLERWRLIYDSNKAAYKIKSMDIHNTNLVLTWNAPTHNISTQQDSNADNQYWLLLKDIGNNSFIIASYKNPNLVLYADTVARNLKLSTLNNSNYIKFIIEDYIISDLNNFTCKISPILDLNKVVQQVDVTNLNVNLYTWDYGRNQKWTIRYNEEKAAYQFFNTILSNGVLTWIFSNGNTVRVSSSNDQNNDAQYWLINPVSDTDETYTITNLRDTTKALDLYGGQTANGTAIQVFNYHGDDNQKWNIRNP >NZ_CP028842|910782:922501|910782_912663_-|WP_011948507.1|DBSCAN-SWA MNSSIKKIYNDIQEKVINYSDTIDLADGNYVVRRGDGWILSRQNQILGGSVISNGSTGIVGDLRVNDNAIPYYYPTPSFNEEYIKNNIQTVFTNFTEANQIPIGFEFSKTAPSNKNLYMYLQYTYIRYEIIKVLQHEIIERAVLYVPSLGYVKSIEFNPGEKINKDFYFLTNDKCILNEQFLYKKILETTKNIPTNNIFNSKVSSTQRVLPYSNGLYVINKGDGYIRTNDKDLIGTLLIEAGSSGSIIQPRLRNTTRPLFTTSNDTKFSQQYTEERLKDAFNVQLFNTSTSLFKFVEEAPSDKNICIKAYNTYEKYELIDYQNGSIVNKAEYYLPSLGYCEVTNAPSPESEVVKMQVAEDGFIQNGPEEEIVVGVIDPSENIQEINTAISDNYTYNIPGIVNNNPFYILFTVNTTGIYKINAQNNLPSLKIYEAIGSGNRNFQSGNLCDDDIKAINYITGFDSPNAKSYLVVLLNKDKNYYIRVPQTSSNIENQIQFKREEGDLRNLMNSSVNIIDNLNSTGAHYYTRQSPDVHDYISYEFTIPGNFNNKDTSNIRLYTSYNQGIGTLFRVTETIDGYNLINIQQNLHLLNNTNSIRLLNGAIYILKVEVTELNNYNIRLHIDITN >NZ_CP028842|910782:922501|918610_922501_+|WP_011948511.1|DBSCAN-SWA MPFVNKQFNYKDPVNGVDIAYIKIPNAGQMQPVKAFKIHNKIWVIPERDTFTNPEEGDLNPPPEAKQVPVSYYDSTYLSTDNEKDNYLKGVTKLFERIYSTDLGRMLLTSIVRGIPFWGGSTIDTELKVIDTNCINVIQPDGSYRSEELNLVIIGPSADIIQFECKSFGHEVLNLTRNGYGSTQYIRFSPDFTFGFEESLEVDTNPLLGAGKFATDPAVTLAHELIHAGHRLYGIAINPNRVFKVNTNAYYEMSGLEVSFEELRTFGGHDAKFIDSLQENEFRLYYYNKFKDIASTLNKAKSIVGTTASLQYMKNVFKEKYLLSEDTSGKFSVDKLKFDKLYKMLTEIYTEDNFVKFFKVLNRKTYLNFDKAVFKINIVPKVNYTIYDGFNLRNTNLAANFNGQNTEINNMNFTKLKNFTGLFEFYKLLCVRGIITSKTKSLDKGYNKALNDLCIKVNNWDLFFSPSEDNFTNDLNKGEEITSDTNIEAAEENISLDLIQQYYLTFNFDNEPENISIENLSSDIIGQLELMPNIERFPNGKKYELDKYTMFHYLRAQEFEHGKSRIALTNSVNEALLNPSRVYTFFSSDYVKKVNKATEAAMFLGWVEQLVYDFTDETSEVSTTDKIADITIIIPYIGPALNIGNMLYKDDFVGALIFSGAVILLEFIPEIAIPVLGTFALVSYIANKVLTVQTIDNALSKRNEKWDEVYKYIVTNWLAKVNTQIDLIRKKMKEALENQAEATKAIINYQYNQYTEEEKNNINFNIDDLSSKLNESINKAMININKFLNQCSVSYLMNSMIPYGVKRLEDFDASLKDALLKYIYDNRGTLIGQVDRLKDKVNNTLSTDIPFQLSKYVDNQRLLSTFTEYIKNIINTSILNLRYESNHLIDLSRYASKINIGSKVNFDPIDKNQIQLFNLESSKIEVILKNAIVYNSMYENFSTSFWIRIPKYFNSISLNNEYTIINCMENNSGWKVSLNYGEIIWTLQDTQEIKQRVVFKYSQMINISDYINRWIFVTITNNRLNNSKIYINGRLIDQKPISNLGNIHASNNIMFKLDGCRDTHRYIWIKYFNLFDKELNEKEIKDLYDNQSNSGILKDFWGDYLQYDKPYYMLNLYDPNKYVDVNNVGIRGYMYLKGPRGSVMTTNIYLNSSLYRGTKFIIKKYASGNKDNIVRNNDRVYINVVVKNKEYRLATNASQAGVEKILSALEIPDVGNLSQVVVMKSKNDQGITNKCKMNLQDNNGNDIGFIGFHQFNNIAKLVASNWYNRQIERSSRTLGCSWEFIPVDDGWGERPL |
6 | Clostridium_botulinum_D_phage(50.0%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1430643 : 1476071
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NZ_CP028842|1430643:1476071|DBSCAN-SWA TATGCTTAAAGAATTTATATCTTATTATAAACCGCATAAAGAGTTATTCGTTTTAGATATGATAGCAGCTTTTATTGTGGCTTTATGTGATTTGTTTTATCCCATGATAACAAGACAAATCATAAATGATATTATTCCAAATGGAAAGATTAGATTACTTTTCTTTTGGGCGATATCTTTATTAATTATATATATAATGAAATATTTTTTAAATCATTTTATTCAGTATTGGGGACATATGGTAGGGGTTAGAATACAAGCAGATATGAGAAAAAGAGTTTTTAACCATCTTCAAACATTACCCTTTACATATTTTGATGAAAATAAAACAGGGGTTATAATGTCTAGAATCATAAATGATCTTATGGAAATATCAGAACTTGCACATCATGGCCCAGAGGATCTTTTTATTTCCATTATTATGTTAATAGGATCTTTTATAATATTGTGTACTATAAACATACCATTGACAATAATAAGTTTTATATTTATACCAATTCTAGTATGGTTTTCCATGAAAAATAGACTTAAAATGGAAAAAGCTTTTATGGATAGTAGAGTGAAAATTGGGGATCTTAATGCGGAATTAGAAAATAGTATTGCAGGTATAAGAGTTGCAAAGGCCTTTACTAATAGAGATTATGAAAATGAAAAATTTGAAATGGGAAATAAAAGATTTGTAGGAGCTAGACAAATGGCTTATAAATCTATGGCAGATTATTTTTCAGGAATGTACTTTTTCATAGATATACTGGATCTAATAGTACTTATAGCTGGTGGATATTTTGTATATAAAAATTTAATTAACTTTGGTGATTTGGTTGCTTATCTTCTATTTATAAAAATGTTTATGACACCTATTAGAAAGCTTATTTCTTTTGTTGAGCAATATCAATCAGGAGTAACAGGTTTTGAAAGATATAGACAACTCTTAAGAGTAAAACCTGAAGAAGATAAAGAAGAAGCAGAAGTTTTAGAAAATATTAAGGGTGCAATAGAATTTAAAAATGTAAGTTTTAAATATGATGAAGATACACATATATTAAATGACCTAAGCTTTAAAGTTGAGGAAGGAAAGACATTAGCACTAGTCGGTCCATCTGGGGGAGGTAAGACAACACTCTGTAATTTAATACCTAGATTCTATAATATAGACAATGGAGATATATTAATTGATAATAATAGTATATATGATGTAAAAATAGGATCTCTAAGAAAAAATATAGGTATTGTTCAACAAGATGTATTTTTATTTACAGGAACTATAAAGGAAAATATATTATATGGTAATCCGGAGGCTAGTTATGAAGAGGTAGTAAAAGCAGCGAAGCTTGCTAATATACATGAATTTATAGAAAGTTTACCAGAAGGATACAATACTTATATAGGAGAAAGAGGAATAAAGTTATCTGGAGGACAAAAACAAAGATTATCCATTGCAAGAGTGTTTTTAAAAAATCCACCTATACTTATACTAGACGAAGCTACTTCTGCCCTAGATAATGCTACAGAATATTTAATACAAAAGTCTTTAGAAAAGTTATCTAATGGAAGGACAACTATAGTAGTAGCTCACAGATTATCTACCATAAAAAATGCAGATGAAATAATGGTTTTAACAGATAAAGGAATTGAAGAAAGAGGAACCCATGAAGAACTATTAGCATTAGATGGAATTTACAGTGAACTTAATAGAAATATTGAAAAAACAAAAGGTTAATTATAAGTTTTTTTATTATAAAAAATATTAAAAAATTTCTAGGTGGCCATAAGAATGAGTTAATGATATAAACGTATAAAAGTAACAATAAAACTTTAATTTTGTTGTTTGTAATTTATCTTGAACAATAAAATTGGAGTTTTATTGTTATTTTTATTTTTTGAAATAAATTACTAAAACAATATACAAATATGTTATATATATAACATAATTTGTATACAATTAACAACTAAAATGGTAAAATATATATAAATAAAGATATATATACATAAATGAAAAATGTATATTTAAAATACTAATAATGTAATATAATGTAGTTAATAAATAGGGGGGTAAAATGGCATACGACATAAAATTAAAAAATAAGAATGAAGAAGAATTAGAAAGAATTGCAAATATTATTATGAATTTATTTTTGTATCAAGTAGTATTTTTTATAATATTTATTATGTTAGCAAATATTTTAGGATATGTGGGATTAAATAAAAATATTATACAACCTTATAGTAAATTAGCAGGGGAAATTTTAGCATATATATTTTTTATTAAGAATTATATTAAAGACAATAGATATAAATTAAAATTTAAAAATACATTACATTTTAAAGGATATGTTTTTATAGCAATGCTAATTATAGGGTATATTTTGGTCTATGATAATACAATTGATATAGTTTTATCAAAGGTTGTAAAAAATAGTTGGTTCTATGATGTTATGACTAAAGAAATGAAAAATCCAATAGTAGGATTTATAGGAACAGTGATTATGGCACCTATTTTTGAGGAGATAGTTTATAGAGGAATAATGTTAGATGAGCTATTGGTTAAATACAATTATAAAAAAGCTATAATTATTTCTGCATTAATATTTGCAGCAATTCATCTTAATTTTGTTCAACTAACAGATGCTTTTATTGCAGGTATCATCCTTGGGACTGTTTATTGTAAAACTAAATGTTTAATTCCATGTATTATAATTCATTTTTTAAATAACTTATTTTGCAATATAGCTAAATTTTATCCCAGTATATATAAAACTAAATTTAATATTATAAGATTAGGTATTGGAATAGCTATTTTAGCAACATTAGCATATATTTTTTTAAAAGATAGAAAAAAAGTTATTTTATAGCAAAATCATATCTAATGTTTTAAAGAGGATAATCATAATTTCAAGGTTAATTAATTTGTTTCTCCAAAATTAAAACATATATTGCTAATTACAAATTAGAAGTATATAGAAATATGTGTTACTATAGCAATATAGGAAAATATATAATTGGAGTGTGATATAAATGAAAATAGCAATGCCTAAGAATGAAAAAATAATTAACCAACATTTTGGAAAAAGTAAAAGCTTTGCCATAGTAACAGTAGATGATAATAAAATTATAGATATTAAAGATATATCAACAGAAAGTTTACAACATAATCATGGTGGTCTATCCAGTTTGTTAGTAGAAGAAAAAGTTGAACTAGTTATAACAGGAGGCATTGGTCAAGGCGCCTATGATGCTTTAATTAAGGAAGGACTAAAAGTTATAAGAGGGGCAAAGGGAACAATTGAAGATGTATTACAACAATATTTAAGAGGAGAACTTCAAGATAGAAAAGTAATGTGTAATCATCACGGTGAACATCATCATCATTAAAAATAAAAGGAAAGTACCTAGTACTTCCCTTTTATTTTTTAGTGTATATTCTATACTTTAAATTATTTTTTATTTAGGTGTTAGGTTTCAATTTATTAGGAATAAAATTATGTGATATAAAAAGTATTTTTGAAGAATATGAATAATATTTCTTCTAAAAATACTTTTTATTTTTTTTATTAATTTTAAAAATAAAATAAATTTTTGTAAAAATATATTATAATTTTCAATAATATCTGATATATTAATTATAACAAGAAGAATTTCATGATTTTATTTAATATAATTATATATTAATAAATGGATTTACTTTATATGGTTTATTTAATGCTTAATAAAATTATAATAAGAATTTATTTCAAATAAATATGTTTTTTATTTTAAGTTATAAAAATTGATTTAAAAGAGGAGATTGTAAATGAAAGAGTATATTATAATGACGGATTCTTGTTGTGACTTGCCTAGTGAGTATATAGAAAATAATCATATCCCTTATATTCCATTAACCTGTAATGTTGAAGGGAAAGAATATATAGACAATTTTGGACAAAGTCTTCCTTATAAACAGTTTTATGAAGCTATGATAAAGGGAGAGATACCAAAAACGTCACAGCCAAGTCCAGAAGCTTATTACAAAGTATTTAAAGAGTTAATAGATAAAGATAAAGATATATTATATGTATGTGTTTCTTCAGGATTGAGTGGAACATACAATAGTGCCAATATAGCTAAAAATATGATTTTAGATGAATTTCGTAATGCTAGAATAGAAATAGTAGATGTATTAACTGCATCATTAGGACAAGGAATTATGGTAATGAAAGCTATGGATATGAAAAAAAATGGATTAACTATTGATGAAGTTACTAGTTATTTAGAAGAAAATAAATTAAATTTAAATAGTTATATGGTTGTAAACGATCTTATTCATCTGAAAAGAGGAGGAAGAATTTCAACAGCTGCAGCTCTTATAGGGACGGTTCTTAATATAAAACCTATACTAACTTTAAATGATGAGGGCAGAGTTATAACTGTGCGCAAAGCTAAAGGTAGAAAGGTCGCTATAAGGAAATTAGCAGAAATAGTTATAGAAAGAATAAAAAATCCAGAAGAAGAAATAGTAGCTATTTCTCATGGAGATTCAGATCTGGATGCAGAGAAGTTGAGAGAACGCATATTAAAAGAGATAAAAGTTAAAGATATAATAATAAACTATGTAGGTCCAGTAGTAGGAACTTATGGAGGGCCAGGATCTCTTAATGTATTTTTTATGAGTGATCATAGACAAAATCATATTATAGATATAAATTAATAAAATAAGGAAAGTGCGACGCACTTTCCTCATTTTTTATCTTTGGCCTTTACCTGTAATATGTTCTATTTCAATCTTTATAATTTTAATTTTATCTTGAGCTCTTTCTATATAAGCTGTCCCTTCTTTTAAATAATCCTTTGAATATTTATTTATAAGAGCTAATAACGCTTGTTTCTTTTCATCTTCAAATACTTCATAAGCTTTACCGAAGGTTATTACACTTTCATAATTTGTATCAAATTTTGAAGGAAGTAATTCTACATTATTTACAATAGAAAATGAAACTTTATCGTTTCCATTTATTGCTTCAAGTTTTTGTCCTTCTTTTGCGCAATGAAAGTAAATAGCCCCATTACTGTAAACAAAATTTAATGGTACACCGTAAGCATACCCATTATTAAGACATACTGAAAGGATTCCATAATTAGATTCTTTTAATAAAGAAATACTTTCCTCATTATTTAACTTTTTTTCTTTTCTTCTTATTTCTTTAAACATATAAAGCCCCCTTTAAATAATAGTATATTATCTAATATTTTAACATTTAATTTTTATATAGTTAAAATAGCTTACAATCCTTTAAAAGTCAACACTATTTCAAAATCCGTCAAAAATTTCGTCAAAAAATCATTTAAAAAATATTTTCAATTATTTTAGTTGCTTTTTTCATCATATCATCGTTAACATGACTATAAGTTTTCATCGTTTGTTCTACTGTATGTCCAAGCAATTGAGCTACAGTCTTAAAATCTACTCCATTGCTTATAAGTTTAGTTGCGTATGTATGTCTTAACTCATGCACAGTAATATCATATCCTTTTAATTTTAGTAATCTATTTAAGCATATACATGATGAATTAGTATTTTTGAATTTAAAAATTCTATTATTTATATTAACAATTTTTTTATGTTTTTTCAATTCATCTAATGTATTTTTGGAAATTGGAATTATTCTATTAGAATTTTTGCTCTTCAATTCACCAAAATTGTACTTGGTAGGGTTAACTTGCTTCCATTGTTTATTTATTATTATAGTTTTATTTACTTCATCTATATCACTCCACGTAAGGCCTAATATTTCTCCAAGTCTTAACCCACATTTTAAACCTAATAGTATAACTAAATAATATTTGTTACTTTTAAAATCTTCTAATAATTTATTTTCTTCATTTTCATTTAATGCCCGCTTATTTACTTGCTGCTTACTTTTATTAAATTTTAAATTTTTAGTTGGTAATTTATCTATTATATTATAATCATCCATGGCAGATTTAAAAATAGTATTAAGCTTTCTAATATATTCTTGTATAGTACTAGGATTCAATCCAGTAAGTGTGAGACTATCCACAATGTGTTGTATATCAATATTAGATATCTTAGCTAATTCTTTATTAGAAAGCGTTACAAAGTGATTTAAAACTGTTTTAAATGCTAATATAGTGTTTGTTGTTCTATATATTTTCAAATGTTCTAAGTACATATCAGTAAACTGCTTGAAAGTTATTTCAGACATTGAAGGATCCATATTATTTTTAACGGATTTTTCTAATTCAACTAAGGACTTATCCATAGCAGTTTGCGCATCTTGCCTTTTCTTAAAACCTTGTTTGCTCTTAGTTTTCCACTTATTGCCTACCTTATAAGTTATTATGTATTGATAGCCCTTATCTTTTTTTCTTATAAGTGTAGAATATTGCAAGGTAACACCTCCTTAAAATTTTTTCATTACTCCAAAATTAGGTTCAAAGAACACTATATAATTATCTATTTCAAATAGAACTCCATATTTCTCTTTATAATGCTGTATAGATGATTCTAAAAAATCCTCCGTAACCTCTAAATGCTCAGCCATTTCATAACGATTTTTAGTACCGGCATTGAAAGCATTAATAATGTCAATAATACCAACTAATTTTTCATATCCCCAATTTCTTGCTCTTTTTTCTTGTTTTAAATTAGATATATTAGAATTGTCTAGTATATTACCACTTGAGGTATAATGATGACCTAGTTCTTCTGCAAGAATGCATCGTTTTTCTTTTAATGTCTCTATGTTTTTATCCAATGCTATTACATTATCTCCATACAACCCTTTGCATTTACCTTTAAATTTCATTTCAACAACTTCTACCCCCTGGCTTTCAGCTTCATATAAAAGTTTATTATACGTCATATGAATCCCCCATTTTGTCTATTTTTTCTTTTTGGATATTATAAATTTTATGAAATTCTCTATATCTTCTACATCCTCATCTGTAAATTCTTCCCCTTCAAAATGTGCAGCCAAAGTTTTAATTTTATTTTCTTGTTTTTCAGGTTGATTAACTTCTTCAATCCCATATTCCTCAGTAGCTTCTTTTACCATGTTGTATACCTTTTTTACAGAATCAAGTGTCATATCCAATTTTTCTTCTGTGTTAAGCAAAAAGTCGGTTGAAACACTAAAAAATTCTGCTATTTTAATTAATACTTCATAACTGGGCTTTCGGGCATTAGTTTCATACATTCCTACCATAGAAGTAGTAACTCCTATGTTTTTCCCTAATTCTTCTTGTGTTATATTTTTACTCTTTCTTAATTTTTTTATTTTATCTCCTAACAAAGTAATCACCTCAAATATATTATTAACACTATTAGTATTATAACCTGTAGTTGTAATAATATCAATACAACTAATAGTGATAATTGAAGCTATAAGAAGCAATAGAAAGGAAATAGCACTTAATTTCTCACTAATGGTTATAATTGCATTTGATTCCTATAACTGTTAGTTGTAATATATACATAAAGCAAATTGAAACGAGGTGATAGATTTGGCAAACCACATTACAACTTTGCGAAAGAAAGCAGGATTTGATACAGCTAAAGAAGCTGCAAAGGCTTTAAATATAAGTAATGGTATGATGTATCAGATGGAAGGTGGATATAAGACCCCAGGTTCACAGTTAGCAATTAAAATGTCCAAGCAGTTTAATTGTACATTAGAAGATATTTTTTTACCTTTTAATACAACTAAGAGTTGTATTAGATCATAAAAAGATGAAAGGTTGAGATTAAAATGGACAAACTTTTAACTAAAAAGGAGCTAGCTGAAAGATGGCAGGTTGCAGAAAAAACGATTGACAACTGGAGGGAAAATGGCGTTTTAACGCCGTGCAGTGGTATACCAGCTATAAGATTTAGCTTACAACATATAGCAGAACTAGAAGGAACTAAAGTGGAAAAATTTTCTCCAATAGAGAGAAGAAGGCTTGAAATAGAAAATGAAAAGTTAAAGCAAGAAAATGAAAAGTTAAAAGGAATATTAGCAAATGTTTTATCTGAAGTATCTAAGATTATTAATTCATAGGGGGTAACAAGATGAAAAAGATAAATTTAACTATAGAAAATGGACAACCTGTAATAACAGAAATAAAACCAGTAGTAGTTAATAACAAAAGGATTTTAACTACAAAACAGTTAGCAGAGGTTTATCAATGTAACGAAACTCAAATACAACAAAATTTTAATAATCATTCAGATAAATTTATTTTAAATAAACATTATTTTTTACTTAAAGGTAATGATTTAAGAGATTTTAAGCACAACATAGATAATATCGAAGTTGCCCCAAATGTAAATAAGCTTTACCTATGGACAGAAAGAGGAGCAAACCGACATTGCAAAATCCTTGATACTGACAAGGCGTGGGAGCAGTTCGACAACTTAGAGGAAACTTACTTTAGAGTTAAAGAAAAGAATTTGCCACCTATGAGTATAGAGGATATTTTAATAGAAAATTTACAACAAATGAAAGATGTAAAGCAACAACTTAATCAAGTAAATTACACTGCTTTAGAAGCTAAGCATGCATCAGAAGAAAATAAAGAAAAACTTGAGGAATTCCCTTTATTTACTATAGATAGTAAGGAATTAAGTAAAGTAGTTAGCAAAATTGCAATTAAATGTTTAGGTGGTAAGGGTACTCCAGCATATAAGGAATTAAATAGAAAAGTATTCTCAGACATATACAAACAAGTTTGGAGAGAATTTGATGTAACAAGTTGTGCAGCAATAAAAAGAAAATATTTAGAAGATGCCAAGAAATTTATAAGTGAATATAAATTACCAAGAGCATTAGCAAATGAAATTGAAACATTAAATAACCAAGTAAGTTTTTAGGAGGGTGGTAACCATGAAATGCCCAAAGTGTAATAAGGAAACCAATGGTATTAATTTTTGTATGCAGTGTGGAGCTAAATTAAATAAAACATGTAAAGAGTGTTGGATGAAGAATAGGCAGCCATATAACTGTGGTTTTGAAAAATGTCCAGGCTATAAGCTACCTATTATTGAAAAATTAAAGCCCTAAAGATTTTTTTATAGTTTCAGAAGCTACATCTACAAATATATCTCTTATGCCTTCAGCAGTATATGTAGCAGCTTTACCTAATAATTTCTTAAATCTAACTACAGCAACTTTAGTTTTAGGGGTAGGAGATTCAACTAGTAAATCTGGAATAGATTCAGAAAATTGCTGTTTTTCAATTTGACTTAAATTTTCGTCCTCATTTATTAATAATCTTGCTGATTCTAGTGCAGATTTAGTCCAAGGATATGGTTGACCACAATTATAACAATAAGCTGGCGTAGTATGCATTGTTGACCCAAGATAACATACAGTATCAGATTCATAATCACCACGAATATTAGCACTACAATTTGGACAAGATATTATAGTTTTAGAACCACATTTAGTGCAAAATTTTTCACCAAACTGAGGAGTTGTATCATAGCTATCAGTTACAATATGACCGTTTAAACATATTTGAGCAATGCGATAAGAACCCATAAAAACACCCCCTTCCAACAAAATTCTACCACAAAGGGGACAAACAGTAAAAGGAGGATTAAAAATGAGTAAAAAAATAAAAACAACAGATTTAAATTTAAATGTTTCTACAGGAACAATGCTTTATGTGGATATAGATATTTTTAGATTCTCATACGATCAAGAAATATTTAACTTAACTATTAAAATACTTGATGGAGAGAATTATGAATTTTTCGAAGAAGTTGATTTGCCAGAAGATGAGGCCATTGTAGATCATAATGATCTGAAAATATTTGCCCTAAATTGGATATTTAAAAATGTTGAGGTAGTAAAGGAGATTTAAAATGCTAAGAAAGTTATTAAAAGAAAGGGGAATTAATTTAACAAAAGAAGAATTTGCAATAGTTGCTGAAATTACAACAGATGATATTAAGTTTAATAGAGTTAGCTTTAGAAAGTGTACAAGCTTAAATTATGTACTATATATTGCAATAAGAAGTGCAAGTATTTTTAAAAGATGTGCATAGAAAGAAGGTGTAAAAGATGAATGAAAATTGGTGCATATTAGCGATAGCTGCTCTTTATGAAAGACCTTGCACAATAGAACAAGCATTTGAAGTGTTTGATAAAGGTAAACTTACTAAAAATAAGAAAAAATCCCAAGAGGATATAGAAGATATGGTTAAGTTTAGAAATATGGGAATGACCTTTGAAGAAATAGCAGATATATATTGTGCAGACAAAAGAACTGTATGTAGATTAATAAACTCTTTTAAAAAGAAAAAAATAGCTCCCTGCCAGGAGCACAATAATTAAATAAAAATTCGTTAAGTACAGTTTATAAGAAAATTTAATGTTTGTAAAGATAGGTGTGATTATTATAGCTAAGAAGTATTATTGGTTAAAGCTTAAAGAAGATTTCTTTAGGCAAAAAGAAATTAAAAAATTAAGGAAAATAGCAGGTGGTGATACATATACAATAATTTATTTAAAAATGATGCTTTTAAGTTTAAAAGATGAAGGGAAATTATTCTTTGAAGGGTTGGAAGATTCTTTTATAGATGAAATAGCTTTAGAAATAGATGAGGATTTAGAAAATGTAAAAGTTACAATAATGTTTTTAATTAAATGCAGATTAATAGAAGAACTTACAGAGAATGAGTTTTTAATGACGAAGGCATATGAAAGTATAGGTAGTGAAACACAGTCGGCTGAAAGGGTTAGAAGGTTTAGACAAAGAAAAAAAGCGTTACTTAGTAACGGTGAGGTAACAAAGAGTAACACAGAGATAGATATAGAGAAAGAAAGAGAGATAGATATAGAGAAAGATAAGATAAAGATAGACTGGAATAAAATATTAGAAGCATGGAATGCATTACCAGAACCAATAAAATCAGTACGTTCCATTACAGATAAAAGAAAAAAGAAAATAAAAATTAGAATGAAAAATTTGAAGTTGACACAAGAAGATATATTAAAAGCAATAGACAAAATAAGTAAAAGCAACTTCTGTAAGGGAATTAATAAGAAAGGCTGGACAATAGAATTTGATTGGTTATTCAAAGATGATAATAATATTACAAAGGTTTTAGAAGATAAATATATAAACAAGGATGGTAAATATGGAGATAGAGAAAATAATTCAAAGGATAAAAGCCAATATGACTTCAATAGACCATATACAGGACCAAGTTACAGCGACCAAGAAATTGACTTCTAATATATGCCACATATGTAATGGTACAGGATGGGAATTTGATAATGAAACAGAAACATATAGAAGGTGTGAATGTTATGAAAAAGAGAAGTTGCAAAGACTTTGGAATAAGTATGGAATAGATCCAAAGGACATAAAAAAACTAAATGAGTACAAGCCTATTGATGATATACAGATATCTGCAAGAGATAAAGCAGTAAAATATATAAAAAACTTTGAAAATATAAAAGATACTAAAGAAAATGGATTCGGATTATTTGGACAACCAGGGGCAGGCAAAACACATATCTTATTATCCATAGGTGCTGCACTGATAACAAAAGGTATAGAAGTTATATATATGCCTTACGTTGAAGTAATGAGGGAGTTAAAAGCTACAGCAATGGATAATGAATACTATATAAAGTTATCATCTAGTTATATGAAAGCAAAAGTTTTAATTATTGATGATTTATTTAAAGATAAGTTAAAAAATGGTGAATTAGTTGGAGAGTTAAGGGAAGCTGATATTAAACATCTTTACCCTATATTAAATTATAGGTATTTAAATAACTTACCAACTTTAGTGAGTACAGAATGTATTCCAGATATTCTACAAAAATTAGATAATGCCCAATGCGGAAGAATGATAGAAAGATGCGGAGATAACATAACAATATTCAAAGGACCCAAGTATAACTATAGAATGAGGAAATTTGTTAAATAAGAGGGGTGATAGTATGCAATTAATGATTTTAAAGAATAGTTCTAAATTAGGAATAAACAATGAACTATTAACATTGGAAAACCTTATAGATAAGTTACAGGAAGAAGTAAAAGAACTAAAAGATGCCGTAGAAGATAAAAACAATATAGATCATGTAGCTGAAGAAGCTTGGGATAGTTTGCAGATGTGTATAGAAGTTCTGGACAAGCTAGAAAGTAAACATAATGTAAATTTAAAAGCAACGTTAAATAAACATCATAAAAAAATTAAAGATAGAGAATGGAAGGCTAAAAAGATGATAGTTTTCCAAATATTCAATGACTATCATTAGGTCGGAATATGAAATTTATGCGACATAAGGGGGTGAAGATTTGAAGGTTTTGAAATGGCCGGGAACTAAATGGAGTATAGCAAATAAAATAGTGGATTTAATGCCTGAACATAAAATTTATTTAGAACCATTCTTTGGTTCGGGAGCAGTATTTTTTAGTAAGCAACCTTGCAATACAGAAATACTAAATGATTTAGATAGCGAAGTAGTTAATCTTTTTAGATGTATCAGAAATACGCCAGAAGAATTGGCCAAACTTATTTATTTTACTCCATACAGTAAAGAAGAATACAAAGAATCTTATAATCGTTCCGGAAGTGACATAGAAAGGGCAAGACAATTTTTAATAAGATCTAATATGGCCAGAGCAGGTATGCAATATTATTCTTCCAGTTGGAGACATGCAGGGCCAGTACTAGGAGGACAATGTAAACAAAGAGTAAGTGGAGATTGGAACAAAGTTCCGGAAAGAATACTTCAAGCTGCAGATAGGTTAAAAGATGCGGAAATAGAAAATACAAATGCTTTGGAATTAATAAAAAAGTACAATAAGAAAAATTGTTTAATATATGTTGATCCACCATATTTACTAAGCACCAGGAGACAAAGGTATTACAATGTGGAAATGACAGAGGACCAGGAGCATGAGGAACTAATCAATTTATTAAAAAAGCATTCAGGACCTGTAATGCTTAGTGGATATAATTCAGATTTGTATAATGATCTACTAAACGATTGGAGTAAAGTTGAGATAAAAACCAATGCAGAGCAAGGAAAAGAAAGAATAGAAGTTATATGGACCAATTATGAAATACCAAAACAAATTTCATTATTTGGTTAGTTAATATGATATAAGAATTAAAATAATTGTTCTTTGAAAATTGAATAATACGGTGGTTTAAAACTATTATTTTTTTCTATCTATCGCTTATAATATATGGGATATATGGTATAATTTTTTATAATGATTAAATTACACTTATGAAACAATATTAAAAGCCGAATTTATAAAAATATAAGTTTAATAATTAACTTATTAGTGTCAGAAGTGCCATAGTTAAGCGAAAGATTTTAAGGGGGATGAAAATGGACGAACAACAATTTTTGAAAACAATGATTGAGACAGTAAAGTATGATGATGAGTATAGCAATAAAGATGAACTACTTGGAATTTTAAGAAATTCTAAAATTACATATGATAAAACTAGTGATTTTTCACGTAAATATTATCACTGTTGGGAGTATATTGACTTAAGAGCACCTGTGCCTATGTTAACAGTAGCTAGAAAGTTTAAAAGCGTTTTAGGAAAATTAGCAGCAGACGTGTATATTGAACCAAGTGACTATGAGTTTGGTGGCTTATGTATAAAGCCAAAACCTGTAGAGCTTGATAGTGAAGAATATACTGAACACAATGTTTTCTTTGATGAAATAAAAGATACAATAGTTCAAGGTATTCGAAATGCGAAATATACAATATGGGCTGCTGTAGCTTGGTTTACTGATACAGAGATATTTGAGGAATTACTGTTAAGAAAAAAAGATGGTGTAAATGTACGAATTATAACATCAGATGAAAAATCGAATCAATATTTAATAGAAAAGCTTGAAAGTAATTTTGAAGTTGTGAAAGTGCCGCTAAAAGGTACTTATTTATCAAACAGACTTCACGATAAATTCTGTATCATTGATTTTGAATTTGTAATGCACGGTTCATATAATTGGAGTAAGAACGCTAGGGGAAATGATGAAACTTTAGTTACTGCACTTGACAGAGACTTTGTAAGAAAATTTGCAGATGAGTTTATGAAATTATATAATGAAAACTAAAACTCAACATTCTTATTTAATTTTACAACTAAAAAGCGAATCAGCTATTAAAACACCGTATTATTCAATGAATTTTATGGTGTTTTTACGTCGTAATCCAAATAAATTACCAAGGGGAAGGAGAGACAGTGGAATGAGTAAAAAATGTTTGCTTTTATGCAATAGGCACAACAGCATTTATGGAGATAATTGGTGCTTATGGTGGGGTGAAAGAGAAAGTAAAAGTGGTTATACAAGTGATATAAGATTAGCACATAGATTTAATGAAGAAGAGATTAAGGGGTATGCAGAAAAAGGATATGACATACCAGTACCAATAGATGTAATAGGAGTATTGGAAGAGTATGAACCAAAAGAAACTTATAATAAAAATTTAAGAGTAATGATAGAAAAAGGCACTCTAAATGAATTGATGGAATTAGAATTAAAACCTTTGTTTCCAGATGATGAAATTATATGTCCTAATTGTGGGAGTTGTCATTATAAAGAAGATTTTGATTATATGGGAAATGAAATATTAATATGTAAAGAATGTGAATATGAGTTTAGCGAAGATGATTTATAGTTCATAATTCAAAAATTTAATGAAGTAAAAGGAGAGATAAATTATGAGTTATGAAAAAGACATAGAACATGAATATACAAATGAAATTGTGTGCCCATTTTGTGGTTATGAATTTATTGATAGTTGGGAATATGGTGAAGAAGATTTAGGATTAATAGAGTGTAATGAATGTGGGAAAGAGTTTTATGCAAATAGGGATATTTCAGTAACTTATCTTACATGTAAAGCTAATTATGGAACTTGTAAACACTGTAGAGACGATAATGTAGTGATTGAAGATTATAATTCAACAGTAGGTAAATATAGTGGTTTATGTGTTAAGTGTGGCGAGCTAGAAAAGCAAAGATTACTGAAAGAATATTTTGATAGTATTCATAACAAGAAAGATTGTTAGAATGCAATTCAAAAAATTTTGGAGGGATAATATGAGGTTAGAAAAAGTTGAAAATAGAAATAGAGGATATGACATTTATTTAATTATTGCTAATAGAGATTATAAAAGTTGGTGGACCTCTCCACCTAAATCAGTAGATCATGCTGGACTTGAATACTTAAAAGATAGATATCCTAAGATAAACACCAAAGCAAGAATGGAAACTTTTAAGGAATTATATAAAAATTTATGGATTGATATTACAAAAACACAAAGACAAAATATGAAACATTGTATAGGATTGGACTATAAAAAGAAACCCTATAGGAATTATTATTGTACAAGCCATAAAGATGAAAACTGGAATAACCTTGTAGAAAAAGGTTTAGCTGTTAAAAGTTCTAAAGAACCAAATAGTTATGGTTGCACATGCTTTTGGTTAAGTAAACAAGGTGTTGAATTTATACTTGATAAGTCTATAAGTGATAAAGTTTATGAAGAATTATAGTTTGTAATTAAAAGAAATGAAATTATTATGTATCAAAGGAGGATTATATGGAGATTTATATTGCAGGTAAGATAACAGGTTTAAAGGACTATAAAGAAAAATTTAATAAAGCACAAGAAAAGCTAATTTCAAAAGGTTATAAGTGTATGAATCCTAGTGTTTTACCAGAAGGATTTCCATGGGAAGTTTACATGCCAATTTGCTATGCAATGATTGATGCTTGTAATTCAGTATATATGTTAAAAAATTGGACTGATAGTAAAGGTGCTAAGTTAGAGCTAGAATATGCTAAAAGCAAAAATAAAAAAATAATTTTTGAGTAGTCTTAAATATTATATGGAGGGAGCTTAAACATGCAATATGTAAAAGAGATTAATATTAATGAGGCAGTAGTTCATATATTGGACAACAATAGTGAGGAGCCAGTATTAAATGAATATAAATTAAGATTGGATGATGAGTGTTATAAATATATATTAAAACATGTAGATAAATGCCTAAAAGATGAATGTCTAAGGTATGCAAAATTCAATGAAGAGAAAAATGTAGTAAAAGAAGTTTCACAAGAATATTTAAATGGCCATAACGATTTATTAGATGTTTCTAAGGAACTGGCTAAACAACTTTTTATATTGATGAAAGGCAATGATAATATATCTTCTTGCGATTTAATGATAGTTTCTATATCAACAGAATATGGCCCAATGTTAGCCATATTAAAAATGGATTATGTTAAAAATTATATTCATGTAGTGGATATGGTAGAGGATAAAGTAGGTATAGATATAGTGCCAGAGTTTACAGGATTACCTGCCAGTGCTCAAAAGATAGAAAAGTGTGCATTTATAAAGCCTATAAGAGAAGATCAAGAATTTAATTTGATGGTTATAGATAAGCAGAAAAAAAATAAAACTAGCGAGGAATATGGATCAAATTATTTTATAAATAAATATCTAGGGTGCAGCATAATAGAAAATGAAAGGGATTCTACAAAAGCATTTGTACAAGCTACGGAAAAGTGGTCTAAAATCAATTTGAATGAAGATGCAGCAACATCAGAAAAAATAATAAGAACAGTAGGAAAACTATTAAAAGAAAAAGATACTATAGACATAGAAGAAGTTTCTAATGATATATTTGGCGAAAATTCAGATGCTAAATTAAATTACGAAGGATTTATAGCAGAACAGGGTATAAAAGAAAAAATAGATGTAGACAAAGAATGGGTAGATAAAAAATTTAAAAGAATAAGATTAAAGATAGATAGAGACATAGATTTGTATATAGATAAAGAATCCTATCATGATGATTCAAGGTTTGAGGTAAAAAGAGTAGGGGATGGATCAGTAAATATAGTAATTAAAAATGTTTATAATTATATGCAAAAGATAAGTGGAAAATAATAATATAAATTAAAACTAAATAGGTGTAAGGATTGAAATGTATATTCTTGCACCTTAACTGTACTAGTGTATTAGAACTATATAACATTAAGAAAGGGTGTTATAAGTGGCTAAAAAACAGATAGAAAATGTCTTGATTGATGGTCAGGTAAGTATTTGGGATATAGATAAAAATATTAAGAAAAGTAATGGTAAGCCAGTTATAAAGTTAGAAAATAAAGAAATAAAAATAAATAATATTGAGCAAGGCAAAATCATAGCAAAGTATAAAACATATGAGAATTTAAATAGAATAATAGGATATGCTGGTGGAGCTTTAGGGATTGAAATTAAATATAAAGATAGATTTGAAACAATTTATGTAAATAAAAAAGGTGAAGAAGAATTTGTAATTAAGAAAAAATCAAGTGTTCTGCCTTGGGATAAGATTATTTATTTCAGAGAAGATTTAAAAATAAATAACATACAGAAAGAAAAAATAAAGAAAATAAAAGGACAGGCTCTAAAAAGACCAGGAGACGAAAATATAATTTTTAATCAAGGCAATAAAGTAATAAGTGTCATAGAAAATGGATGGGTATTAGAGTATGACAACATAAAGATAGCAGAGCTAGAAAAGTATAAAAAAATAAATGCAGATAGTATGGATCAAGATTTTAAAAAAACTTTAAAGCTAGGTAATATAGTTGAAACAGAATATAAAGATGAAATTATACAGGGAAAAGTAGTTCACATTTATAATAATGGATACACTTGCAACATAATTGAGGGAAATAGATATATACCTATTCCTATATGTGGAATTAGGCAGGTGATAGCTTGAGCTGGATAGATGAAATATTAGATAGAGCATTAGAGAATGTTAAAAAGTATTTAAAAGAAAAAGACAAGCCTTTGAAAAGATATAAAAAAAGAGTTAAGAATAGAAACATCTTGTATAAGAAAAGGATGAAACTAGGTAGAGTAAAAAGAAAAGTAAGAAGTGGTAATCATGGAGGAAAATAAAAAAAGATTCATGGATTATGTAAATTTAAGATTAAAGCAAAAAGAATATAAGAAAAGATTATTATATTCAGATATTGCAGATTTAAGGATTAAGAGTATTGAGAAATCAAGAAATAGAAAAAATGGTCAGTTCTAGGAGGGAGCATTGTGTTAAATAAAATATTAGGAGCTGTTGCAATATTAACTTTTATATGGTTAGTGGCATTTAAAAAGATAGATAAAGAAGAAAATTCAATGTGCAAATTTAATTGTGAATATTGTGGTGAGAATGATGTTTGTGGCATAAAGAAAGGAGCAACAAAGAGCTATGATGAATAAAAAAATTTATGAGAAATATAAAAAGAATGCAGAGAATGATTTAAGAAATTATCCATATTGGTTGTTGGCCATAGAGACCCCAGGGTTAGGAGCACCTAATAGATGGGGACAACAAGTAAATCAAAGTGGATATTTTAAAACAAGTACTGTTGAAGAAGATATGATAAAAGATATGGAAAGAAGATGGAAAGTTGATATTATAACTAAAGTATTAAAACATTTAGATCCTACGAGTAAAACAATAATTGAAGAATGGTATTTTAGAGATAATAATTCCAGAGAAGAATTGTTAAAAGAATTAAACATAGATAAAAATAAATTTTATTATTATAGGAACAGAGCATTAAAAAAATTTATGGTAGCAATAGGATATTTAAAATAATAAAAAAGTTAGACAAATTACAGACAAATTACAGACAATTTTAATGCAATAGTAAGAAACATAATATATTATATGATATAAGGGTTAAAAGCCCACGCAGGGGTTTTATCGTACAATAAGGCAACTGCGGAAATAAAAAATAAATATATTGTGTATATGTACTAAAAGCACTTAGCCAGTATTTATTGTATGTAACTACTGGCTAAGCGTTTTTGCATATAGCTCTTTAATAAGGAGGGCAATAACTATGGAAGTGTATTGTAATAAGTGTAATAAAGACTTTGAAATAAAAGCTAAAGAGAAAAAATATGCAGATGGGATAGTAGAACTTTATTTTAAATGTCCATATTGTAAAGAAAGATACACATCGTTTTTTACTGATAAAAACATAAGGCATAAACAAAAGAAAGTCAGAAAATTATATGAACAATATGGTAAAGAAACAGACGAACATAAAATAATAGAGTTACTTAAACAAATAGATGATCTTAAGGCTGAGATAGGTAACGATATGAATAAGTTAAAGAATAAAATGTTAGGCACTCAATAGAGTGCTTTTTTTATAAAGATGTGAATATGAAAGGATGTGCTAAGTATGTATACAAGTTACAAATGCATCTGTTGCAATAAAGAATTTGTTTTATTAACAGAAGAATTAGAATATATAAAAGGATACTTAGTATGTCCCTATTGCAGCAGTAGGAAAGTTAAGAAAGAGAAAGTAAGTGATATTCTTAAAGAGTGCATGAGTGAACGAAGTTATAAAAGAATTAAAGGTGTATTAAGGCAGGTGAGATAGTTGGGGATAAAAAGGCCTGCTAAAGCAATTACTAGTACAACTAAAGTATTAGATATACAAGACTATCTCAGATACAAAAATGAAAGAGATTATGTATTATTTATACTAGGAATTACAACAGGGTATAGAGCAGGTGACTTAGTTAAATTAAAGGTTAGAGATATTAAAGAAGCCTTAAAGAGAAATGAATTTACAATTTATGAAGGAAAGAAAATGAATTGTAAAAACATAAAAGAGAGAAATAAAAAACCGAGATCGGTTGAGGTACTTCCTAAGCTAGCTAAAATATTAAAAGGCTGGATTAAAAATAAAAAAGATTATGAATATGTATTTCAATCTAGAAAAGGTATTAATCAACATATAGGAGTACAGGCAGTAAGTAACATATTAAAAGATGCAGGAGAATATTTTGGTTTACATGATATAACTGCACATAGTATGAGGAAGACGTATGCATATAAAATATACATGGAAAGTGATAAGAATATAGTTGCAGTTAAAGAGTTATTAGGTCATAGAAGTATAGAAGAAACTAAAAAGTATATAGGATTAGATAAAGAAAAATATCATCAGTATTCAAAATCATTAGAGGAATATATTAGATGATATTTTATTTTTTTTATTAGTCAATGTTTAAAAAATTATATAGTAAGTATTGAAGGTATAAAATTAAGTGCATATATTAAGAAGTTAATTTTTAAAATGAATGTGTTATTCACATATATAATTAAACATTCGGACAGATTTTAGTCATATGTACAAAAGCTATATATATCAATGCTTTCAAAGGGTTTTGTTAATAAATGTTATTTTATATTTCTATACTAAATTTAAAAAGTTAGGAAATATAAAAAAATAGCGTAGCACTTTACAAAGCAAGTGCTACGATAATGAGGTGAAAAAATTGGCAAGAAGTGATAGCTTTGAAGACATAATTGAAAAGCGTCTAGATGAGATAGAGCAATGGGTTGAAAGTAATAACACGGATAAGGAAATAGCTGAAAAGCTAGGGATTGCATATTCCACATATAGGAAATATAAGAGTACTAACGTAGCACTTAAGAGCCGAATTGCTACGGCAAAAGATAAGAAGAACCAGGAAGTAGAAAAGGCATTGTATAAATGCTGTATTGGATATCATTACTACGAAGAAGTAATAACAAAAGTTAAAACAGAAGATGTAGTTAATGGACAAATAATAACAAATGAAGATGTTAAGATAAGCAAAGTTAAAAAGTATAGAGGGCCTGAGTTAAATGCACAGAAGTATTGGTTAAATAATAAAGAGAAAGCTAAATGGAAAGAAGACCCACACAAGGTTTCTAATGATAAGAAGCTTACTAAGCTTAAAGAAAAAGAAGTTAACTCAAAGGTTATAGAGATATAATATAGTGCCTATATATAGAAAGTGTACCGAATGTGGCAAGAAAGTAATGCAAGGTAAGTTATGTAAGTGTGAGTATAAGAAGAGAAAGGAAAGATATAAACAATATAAATATAAAAGGTTACAAGATTTAGAAGAGAAAGAAAGACAAAGGTTTTATAGCAATAGTTTCTGGTTAAAGTTATCTGAGAATATAAAGAGGCATTACGTTGGTTTATGTGTAGTGTGTTGGTCTAAAGACTTAACACAAGAGAGTGAGTATACACACCATATAGAAACTATAAAGGATAGATTTGATTTAAGATTGAATGAAGATAACTTAATACCACTATGAGATTGTTGCCATAAGAAAGTCCATAGATTAATGGATAAAAGTTATAAGGATAAAATTATGATACAAAAATATTTAAAAGATTTAATAGAAAAGTTTAATAAAGAATTTTATTAGTACCGGGGGGAGGGTTGAAAATTTTTATACAAACTTAGAAAGTCCCTGGTGCCCTCTCAGTCGCATAAAATTCCCAAAATGAAAGTTTTAAACTTTAAAGTAAAGAAGGTGAAAAAAATATGGCTAGACCATGCAAAGTAATAGACAGTCAAAGTAGACATAATACAAAAGCTGAAATTGAAGCTAGAAAAGAAAAAGAAGAAAGAATAAAAAGTCTAGCTGATAAAATTGAAAAGCCACCAGAATATCTTTCAGAAAAACAAAAAAATATATATAAATTTATTGTAGAAGAATTAAAAATGACTGGAATATTAACTAATCTAGATGTCTATATTTTATCTACATGTGCAATAGCAGTAGATAGATTAAGAACTATAGAAACAATAATAAATAAAAATGTAGGTAGTTTATGCAATAAGGATTTAATGTCAGCTAAAGATAAATATACTAAGGATTTATATAGATGTTGTAATGAATTAAGTTTATCTCCACAGAGTAGAGCAAAACTTGGAAACTTAGCATTGAACAATAAGGAAGAACAAGAGGATCCATTATTAAAAGCCTTAAGAGAAGATGATGAAGATTGATACTTTTAGATAAAGCTTTAAAATATTGTAATGATGTTATTGAAGAAAAAGAGATTACGACTGATGAAGTGAAGCAACAATGTGAAATGTTTTTATGTGATTATAATATAAATCAATATAAAGAAGAGTTTGAATTTTGCTTTAGTGAAAAAAAACTTAAAAAAATAAATAATCTTTTGAAATTGTTTAATTATGCTACTGGATTTGTGGCTGGTAAACAAGTATTAGAAAATTTAGAAGGGTTTCAAGCTTTATTTATTGCTGCCATTTTTGGATGGAGATATAAGAAAAATAAAAAGAAGTTTAGATATAGAGATATAGTTTTATTTATACCTCGTAAAAATGCAAAGAGTTTTATAGCAGCCTTAGTAATCCTCCTTTTAATGCTTACAGAACAAAATTTTAGCGAATTCTATAGTATATGTATAGATAGAGATTTGGCAAAAGAAACAAGAAAAGCTATGGCACAATTAATTGCATCAAGTCCAGATATTAAAAAACATTTTTTTGTATCAGATAGTGAAATAGGTATAATTAAATGTTTAATAACTAATAGTTATTATGTCCCGAGGACTGCAAAAGCAAATAAAAACAACTCTATAAGACCTGCATGTTTTGTTGCTGATGAGGTAGGAGCTTTTACAACAAATGATAATATTCAGGCAATGAGAAAAGGTCAGTTAAGTGTATTAAATCCAATTCAAATGCAAACAACTACTGCTTATGCTGAAAGTGATTCAATTATGTTGGAAGAATTAGAATATGATAGAGCTGTATTAAATGGAGTTGTTGCTGATCCAAAGTTATTTTGTCTGTTATATTATTGCACAAAAGAAGAAGCTTGGACAGATAGAGGATTATATAAAGCCAATCCTCTAAGAGTTGAAGAAAACTATGAAGAGATTAGAGCAGACAGGGAAAAAGCTAAAATAAAGACAAGTGAACAGGAAGAATTATTGACCAAAAACTTTAATATATTTCTTGAAACTAATGAGAAAAATAAATATCTTGATATAAAGCACTGGAAAAAGTGGGTTATTACTGAGGAAGAATTTAAGCAAAGAATTAAAGGAAAAAAGGTTAAAGTTGGGGTTGATTTATCAGTAACTACAGACTTGACAGCAGTAGGGATAGAGTTTGAAGATGAAGGCATAATTTATTGCAATTCACATGGATTTTTGCCAGAAGATAGTTTACCTAATAGAAGAGAAAAGCATATAGATTATAGAAAATATGAAAAAGCAGGTTATTGTGATATTCATTCAGGAATGACAGTAAGTTATACGAAGGTTGAAGAATATATACGAAATATAGAAACTGAATATGAATGTGAAATTGAGGTAATAGTAACAGATCCAATGAATGCAAAAGAAATGATGGAAAGGCTTGCAGAGGATTATGATGTTGTACTATTAAAGCAAACTTTTACTAATTTAAGCCCTGCCACAAAGGAATATAGAAAAGCTGTATATGATAAAAAGATAAGATATGTTAAAAATGAACTTCTTGACTGGAATATGAATAAAGCAAGTACTACTAAGGGCAAAGCTGATGATGAAATGCTTATTAAGGAAAATAAAAATAAGCAAAGAATTGATATGGTTGTAGTTTTAATATTTGCTTTTACAGAATTATTAGGAGGAGATACAAATTATAATCCAGTGGACGAATTAGAAAAAACAGATTGGTAGAAAGAAGGTGATAAAAATGAAGAAAAAACTTAATAAATTACTTAATAAGACTATTTTAAATGATATTTTTATCATGGAAATGGTCTTTTTTATTGGACTTCTTATCATTATTTACACCAATTTTAAGGTGAACTTGTACTTTGGACTGTATTTCTTAGGTATCATTCTAATAGCTTTTAGTATATTTTTATATAAATTTAGAGGAAATCGAGGTGAAAAGAGGTGAACGTAAGTGATTTTTGATAAATTAGTTGAAAGAAGAGAAGCAGTTGACGTAAATGATTGGAAGTCAGTATATTCTTTTGAAAATGGATATGATATTACACCTTTTGAACTTGAAATGAGGGAAAGCACATATTTTAGTTGTATAAATAATATATCTCAAGACATTGCAAAGTGTACATTACAAATAAAAAAAGAAATAGAAAAAGGAGAAGTATTAGCAAAGGAACATTATTTATATGATTTATTAAGATTAAGACCTAATCCTTATATGAGTGCTATAGATTGTTATAAAACTTTTGTAGCGCTAGCTAAACATTGGGGATATGCAGGACTTTTTATTGATAGGCAAAGAGGAAAGGTAAAAGGTTTATATCCTGTTAAAATAACTAATTGTACAATTGATAATACAGGATTAATTAATAGCACTAAGAATAATAAAATTTTATGGGATTTTGAAGGGGTAGATGGTGAAACAGGTTGTTGCTTTGATAAAGATATAATTATTCTAAGAGATTTTACACTTGATGGAATAAAGGGCAAAGCAAATAGAAGTATTTTATCAGAAAGCTTAGATAGTAGCTTAAAAAGCCAAAATTATTTAAACAAGCTGTTTACTAATGGATTAACTAATAAAATTGTTGTGCAAATGACCTCAGATATTAAAGAGGAAAAAGAGTTAAAAAAGGTACAAGCTAAATTTGATAGAGTTTATTCAAATAATGGTAAGATATTTACTATTCCAGCAGGTTATAATATACAGCCATTAAATTTAAGTTTATCAGATGCACAATATACAGAGTTAAGAAAGTTGTCTAAAGAAGAAATAGCAATGTCTTTTAGAGTACCATTAACAAAATTAGGATTCGTAAAAGAAAATGCTAGTTCTGAAGAACAAGACAACATAAAATATCTAACTGAATGTTTGCTTGTTATATTTGAACAGATAGAGCAGGAAATGGATTGGAAATTATTAACGCCACGAGAAAGAGAATTAGGATACAAGGTAAGGTTTAATATTAATGTGCTACTCAGAACAGATAGTAAGACCCAATCAGAAGTGATAAGCACATATGTTAAAAATGGAGTTTATGACTTGGACTATGCTAAGGATATTGTAGGAGTAGAAAAAATAGGTGGAGAGCTTATTATAACCTTACCTTCTGGACAAGTATTATTGAGGGATTTATTAGCTGGAAATGTGAGCTATTTAAATAAGAAAGGAAGTGATACAAGTGAGGGTGGAGATAAGAAGTGACCATGTAATTATAGAAGGTTATATTAATGCAGTAGAAAGAGATTCAAGACCAATGCCAAGTCCTAAAGGAAAATTTGTAGAACAGGTAAGATCAGGTGTATGGAAAAATGCTATAAGCAAAAATGATAATATAATATTTTTGCTTAATCACAATAATAATAAAAAATTAGGTACAAGCAAAGAGAATTTGAAACTTAGGGAGGACAACATAGGATTATATGCTGAAACTAGAGTTTATGATCCCGAGGTCATTAAAAAGGCAAAGGAAAATAAATTAATAGGATGGAGCTTTGGATTTAAAAAAATTAAAGACAGTTGGGGAAAAACGGATGATGGAATTGATAGAAGATATTTAGATGAAATTGAGCTTAGAGAAGTTTCTATATTAGATGATAGCAGAATACCAGCGTATTATGGTACAAGCGTAGAAACTAGAGAAAATGAGGAAATAACAACCGAATTAAGGTCATTTGAAGATATAGTTATTGAAAAAATAGAAGAAGATACTTCTAAAAATGAAGATGAGAAAAGAGAATTAAAACTTAAATTATTAAATTTAGAACTGGAATTATAACAGTTCTTTTTTTATACAAAAAATTAGTAAAGGAAAGGTGAATAAATAATGGGATTGGAAGAATTAAGAGCACAATTAGAAGCTAAGAAGGTAGAAATTAGAGAATTTATAAAGGATAAAAAAGTAGCTGAAGCTGAAAAGGCAATGGAAGAAAAGAGAGGTCTAGAAAAGTTAATTAAGGCAGCAGAGGAACTAGAGGAAGAGGAAAAAAGAGATCTAGAAAATCAAAGAAAAAAGAAAACTCAACCAGAAGAGAACAATGAGTTTAGGGCTATAGTTAAAACAGTAATGGGAGAGGAAACAACGACAGAAGAGAGAGCAAATATAAAATCTGTAGATAATGCTGCAGTTATTCCAAAGCAATTCGTAAATAAATTAATTGAAATACAAAAAGGTTTTGGCTCACTGAAAGGGTTATGTGATGTTATACCAGTTACAAAAAATGAAGGTACTATACCAGTTATTGACCTAGATCAGAACGAAATGGCAGATGTTGCAGAGGGCGAAGATATAGTAGATGGAACACTTGTAACTACTGATGTACCTTTTAAGTGTGCTAAAGTAGGTTTAATTCAATCTTTAGCGTCTGAAACTGTAGATGATGCAGAAGTTGAAATGGAAGGTTTAGTTAAAAAGAACTTTGCCAATATAGCAACAGTTAAAGAAAATGCTAAAATATTGAAAGTAATAAAGGACAATGCTACTGAGGTTGTTGGGGTGACTTCTTATGAAGATGTAGAGAAAGCTATTGATGGGTCTTTACCTTCTATAAAAGCTGGATTAGTTACCTTAACTAATGTGGCAGGATATGTAGAATTAAAGAACAAAAAAGATAAACAAGGTAGATCATTAAACCTTATAACAAATATAAACGGAGTTGAGTATTTCCACGAGAAACCAATTATTACTGTAGATGATATCTTATTACCAGTATCAGAGGGTAAAACACAAGTATTTTATGTAGCTAATATGAATGAAGCAGTTAAATATTGCGATAGAAAAGCTGTAACTATCGCAAGAAGTACAGAAGCAGGGTTTAAAGATGATACGGTAAAATTAAGAATCCTTGAAAGGTTTGTACCAGTTCTAGGAGCTAAGAGATCTATAAAGAAAATAGAATTTTAATGATTGGGTGGCTTAATGCTACCCTTTTAATAAGCAGGTGATAATATGACGGTTGAGGAAATAAAAGATTATATAATAGTTGATGATGAATCTGATAGTTTCCCAGAGGAATTAATGGAAATAAGTCAAATTTATATAGATTCTATGGTAGGAGAAGGGTATAAACAAGATGAAAAAATGATTAAATTAGCTAGTTTGCTACAAAGGAAACTTTGTGCTGATATGTACGAAAACAGAAGTACAGAAGTACCACAAAATGTCAAACAGGATAGAATTACAGCTAGCATACTTGACAAATTAAGTAACTATGATGGTGATATAAATGTTTAAGGTTAATATAGGAGATTTAAATAAAAGGATAGTTATACAAAAGTATATTATAAACCAGAATGAAAATGGATTTGATATAGAAGAATGGATAGATTATAAAGCTGTTCGGGCATCTATGAATAATCTTTGGGGAAAAGAATTTTATGCAGCAAAAGCGACAAATAGTGAAAATACAGTAGAATTTATAGTTAGATATTCTAAAGATTTAAAAAATATAAATACTAAAGAATATAGAATTAAAACTATAAAAGATAAAAATGCTACAAAAGAAAAAGATAAATATAGATATTTTGATATAACCTTTATAGACAATATACAATATAAAAATAAATGGCTTAAAATAAAGGCTATTGAGGTTATTTAATGGCTGATGGTATTGAAATTGAAGGTATGGAAGAATTTACTGAAATGCTAGAGGATATGACTATTGATGAAGCCGATGAAAAGAAAGCAGTGAGAAAAGGAATTGAAGTTGTAGCAAAACGGGTTGAAAGCAATACCCCAGTTTTAACGGGAAAGCTTAAAAAAATAAAGAAAAGTGTTAAAAAGGAAGGTTTTGCAACTGTTGGTACTGTAAAATTAGGAGCTTGGTGGGATTTATTTCAAGAGTTCGGTACTTCACAGCAAAAGCATCATGTCGGTTTTTTTGACAGAGCTGTTAAAGATAGTGAAAATGAAGCTGTTGAGATAGTTGTTGAAGAATTATTAGACAAAGTGAGGTAGATTATATATGACCATAAAGCAATATCTTTTAAAAATATTAAATAATAAAGAGATATTAGATTTATTACCAGATAAAAAAGTGTTTTTCCTTCATGCGAATAATCCTAATAAAAGCATGTATTTAGAGTATGAGATTATAGATGAATATGGTGCAGATTATTCCGAAGGGAAAGAAGATTATACTACTTATGTAGTCCAGATAGATATATTTTCTACTGGAGATTATACAGAATGTGAAGAGGTAGTAAAAAGAATAATGATACAAAATGGATTTAACAGGGACATGGCAGCGGATCTGTACGAAAAAAAGACAGGTCTAAATCATAAACCTATGAGGTTCTCGATAGATTTACCGACTAGCAAAGGCTAGTCTTTTTTAATGCAAAAAATAAATTAAAAAGGATGGGATAATACATGTCAGAAGAAAAAGTAGTTCCGATAGTAGACTTGAAAAAGTTATATGTGGCTAAAGTTTTAACAGATAGGTTAACCACAACTTTTGATGCGCCAAGATATTTTGAAGGGGTAAAAGAGTTAGGGTTAAAACCCAAAGTTAATAGTGATGACTTTTATGCAGAAGGTATTTTGTGGATTAGCGAAACTACACTAGCTAATATAGATGTAGAAATAGATATTACAGATTTAAAAAAAGAAGAGGAAGCATTTCTATTAGGTCATAAATTGGCAGCTGAGGGTGGGATTATAAGAAGTTCCAATGATGAAGCGCCAGAAGTTGCATTATTATATAAGGCAATGAAAGGTAATAATAAAGCCAGATATGGAATAATGTACAAAGGAACATTTTCTATAAGTGATGAAAGTTATAAAGGTAAAGAAGGAAAGGCTAATTTTCAAACAAAAAAATTAAAGGGCACATTTGCACCTCTAAGAAGTAATGAGATGTGGAACTGGAAAGTAGACGAAGAAGATGGAATGACAGATGAAAAATTCTTTAAAGAAGTAATAATACCAACCCCAAAAGTGGATGAGGAAGTAGAAAATAAAAAAAGTGAGGAAGCTTAATTTATAGGGTAGTCAAATACTACCCTTATTATTTTGTTGATGAAAGGACTGGATAATATGTTAAATAAAATAAGAAAACAAAAAATAGGTGATAAAGAATACTCTTTTAAGATGACAAATAAAACAATTCGTAAAATAGATGAAAAGTATGGTAACTATGGTTCTGTTATTTATAGCCTAATGGAAGGACAACAATTCTACACAAATGCTTTAAAATTAGTATCTATGTGTTGTGTAGATAAAGAAAAAGTACTTGTAAATAAAGAAGAAAATAAATATGAAGAAAAAATAAAAGAATGGGATATAGAAGAATTAGAAGATATTATAACAGGACAACAATATCAAGAAATTACAAACTTATCCGTAGATTTATACTTAGATTACATGGGAATGAATCAAACAGAAGATAAAGAAGATAAAAAAGAAAAAAACTAAAAGACCAGTTAAGGACTATTGATGATTATTTAATAGACTTTGACTGGCTTTTTTATATAGCAAAAGTACATTTAAATTACACAAAAGAAGAATTTTGGGATAGTACACATGCGGAAATATATAAGATGTGGCAAAGGCATATTAAATTTAATAAATGGGAAATAAGAAGTGATAATGAAGAAAATAACTCTACAAGTGATGTAAATCACAAAAGAGTAAATATAGAGGATATACCATTTCTATAAGATAGGCACTCTGATGAGTGTCTTTTTTTATATAAAAATTTAGAAAGGAGGTAGAGAATGGCTAGTAATACAGAGAAACGTATAACCGCAAAAATGGTATTAGATAGTAGCGGATTTAATTCTAGCTTAAAAGGTGTAAATGCAGAATTAAAAAATGCACAATCACAAATGAAATTGGCATCTAGCGGTATACAAGCATTTGGGAAAGACAGCGAAAAATTAAAATCTGTACAGGAGGCATTAAGTAGGCAAGTAGAATTGCATTCTAAGAAAGTAGATGTATATAAACAAAGCATAGAGAAGACTACTTCTAAAATGCAGGATAACATAAAAGAAAGAGATAAATTAAAAGAAAGCTTATCTAAAACTGAAAGTGAATTAAAAAAAGTAATAAATACTGGAAGTAAAGAACTACAAAGTTATATCAAAAATAGAGAAGAACTAACTAAATTAAATAAGCAGTATGATGAAGCAAAAAAAAGATATGGAGAAAATTCTAAAGAGGCTGAAAAGTTAAAAGAACAAATTACTAAATTAGAAAATGAGCAAAAAAAACTTACAGCTGGGAAAGAAAAAGAAATAAAAGCATATGAAAAAGCTAAGACAGAAGTTGATAAAACAACAAAAGAGTATGAAAAAAATGAAAAAGCAATAGATAGTAATGCAAAAAAAATACAACAGTATGATACTAATCTAAATAAAGCACAATCCCAGATGAATAAAGCACAGGGAGAACTAAAAAAGATAAATGAAGAATTAGATAAGCAAAACAATAAGTGGGTTCAAGCAAGTGAAAAACTAGGAGAACATTCTAAAAAGTTAAAGGATACAGGACAAAAGATAACTGATGTAGGAAAAAGTATAACTACAAAAGTATCAGCACCTTTAGCTGGACTAGGAATAATAGCAGCAAAGACGACAGCGGACTATGATGACAGTATGAGCCAATTAAAGGCCATAACCAATTCTAGTACGGAAGATATGAAAAAGATGAGTGACCAAGCTAAGGATTTGGGTGTAAAAACCAGGTATAGTGCTAAAGAGGCAGCAGATAGTATGGTCATGTTAGGGCAAGCCGGTTATCGAACAACAGAAATTATGAACACTATGCCAGCAGTGTTAAATTTGGCGCAGGCGGGAGCTATTGATTTAACACAAAGTACGGATGTGTTAGTATCCTCTATGAGCCAATTTGGAATTAAAACAGAAAACGCAGCGCATGTAGCTGATGTATTAAGTCTTGGAGCTAATAAGGCCAATTTGGGAGTAAATGATATGGCCGAAGCATTAAAGTATGCTGGTAGTATGGCTAATACCGCAGGTTGGAGCATTGAAGAAACTGCAAGTGCTATAGGGCTAATGAGTAATTATGGAATTAAGGGTAGCCAGGCAGGAACTGCATTAAGAGGCGCTATTTCTAGATTAGTTAAACCTTCAGAGGCTTCAGCAGAGAAAATGGAAGCACTAGGAATTAAGGTATTTGATAATAACGGTAAAATGAAAGCTTTAGGCGAGGTTATAGATGAGGTTAAAAAGGGAACTTCTAAATTAACAGAAGAACAAAAAATGAATGCACTTGTAACTATATTTGGTCAGGAGGCTATAGCAGGCATTAACGCTCTTATGACCGAGGGTGGAGATAGTGTAAGAAAGTATGCAGATGAATTGAAAAAGGCTGACGGTAGTGCAGAAAAGGCAGCTCAAACAATGGAAGATAATATGGGTGGTGCTTTTAGAAGTTTAAAATCTGCAATGGAAGGTGCAGCAATAAGTATTGGTAGTGCAGCAGCCCCAGCAATAAGAGAAATTACAGATAAAATAACAGAATTAACACGAAAATTCTCAGCATTAAGTCCAGAAACACAAAGAAATATTGTTAAATTTGGAGCATTTGCAATTGCTACTGGCCCTGTTATAGTAGGAATAGGAAAAATAGCAACTGGATTTGGAAGTATTTTAAGTGTTGGAAGTAAAGTGGCTGGAATAATGGGTAAAGTAACACTTGCTACAAAAGGAGTAGAAGTAGCAACTACTACAGCTGGTGTAGCGGCAACAAGTGCAACTGGAGCAGCTAGTGCTGGATTGGCAGGATTAGGTTCAATAGCATTGCCAGTTATTGGTGTTATAGCCGCAGTTGGAGGAGCTGTTTATTTAGCACATAAAAACACACAATATCTAAATGATAGCTGTGTAAAGAGTGCAGAAGATATGGGAACTATGGAAACTGCAATGGCAGGATTAAATGGACATGTTATTCACACTAATAAACAATTAGAAGAAATGAATGTTAAACATAAGGAATGGAGTAATAAAGTTTCTAAAGATACCCAAAAGTCCCTAGATCAATGTGCAAATAAAATAGCAGATTATAGTATGGAGCTAAAGAATGCTGAAAAAATTGATAATTTGGTAGACAGTGAGGCTGGAATAAGATTAAAAACAAAACTAGATGATATTTGCAATAGTGCCATAAAAAAAATTAAGGAGAAACAACCAGAGCTACAAAAAACTTTAGCTGATGGATTTGCTGCAGATGGTAAAATTGACGAAAATGAAAAAAAGATTTTGGCCTCAATAAATAAAAATGGGCAAGAGCAAATAAAAAAGGTTAATGATATTAAATCTAAAATTTTAGAACTAGAGAAAAAAGCAAGTAAACAAACTGGTGAAGCTAAAAAAGCAACTTTAGCTGAGGTTGATAAATTAACTAAAGAAATTGGAAATATAGAATTAAAAAATACTGTTAAATCAAAAGAAGAATTAATGGCAGCACAAGCTGATTTTAATGTCCGCATGAAAAATTTGGACATGAACGGTCTTTCAAAATTAATGGAATCAAAGGCAAAAGCTAGGGATACAGAAGTAAAGAAAATAAAAGAAAACTATGATAAACAAATTGAGCTATTAAAACTAAATTCGATTAATGTAGATAGTGAAACTAAAAAGGCAATTGACATAAAAATAGAACAGTTAGAGACAGCAAAGAATAAAGAAATAGGTGTGGAAAATGAAAAATATAAAGGCTATTTAGATGCCGCAATAGAAAAATATCCGCAACTAATAAACTATATAGATATGCAACACGGAACAATGCTAACCAAAGAACAGCAACAAAAACAGGCGGAATTATTAGAGTATGGTTCTAAAATGGAGGGATTTTTAGGTATTACTGAAACTGGATATTATAAAATTAAAGATAGTGTTACAGGGCAAATGCATAACTGTTACGTAGAAGTGGATAAAAGCACTGGTCAAATTGTTGGGGCTTGGGATAAAAGTAATAATAAAATTTATGGTAACCCCATCAAGGCCCAAGAGAAAATAGACCAAGAGTTGAAAAATGGACAAAAATTTAAGCCAATTGGTGATAGTTACGATCGTGTAAAAGAAGGAATATGGAAGCGTGCGATAGAAGCACAGGCTAAGACAAATTATAATTTATTTAATTGGATACATGACGCACATTCTAACGCACAAAGTTGGTTAAGTAACCATCCTTTTATTGCTAGTGTAGTTCAACAAGTATTACACCCTAACACACCTACATATATACCGCGTAGATGGACAGGGGATAAATATTTCACAGGTGGATTAACATATCTACATGATGCACCAGGGAAAAATAATAATTATGAACTTTATGATCTACCAAGGGGAAGTCGAATCTATAATCATGATGCTAGCGAAGATTTAGTTATTAAGACAGCTGAAAATGTAGCATCTAAAGTAGCTAATAGTGTATTAAAAAATTTTAAAGGGTTAACAGCGGGTGGACAAGATCAAACCATTATAGTTCCAGTTAATTTAGATAGTAGAGAAATTGCAAGAGTAACAGCGAAACCAATGTCAGAGGAATTGGGAAAGTTAAATAGGAGAGGGGGATTAGGCTATGTTTAGTATACAGTTTAATAATTATAATTCTTATAGGGATCTAGGATTAGTTGTAGAACATAGACCCAATATTCCTGCACCTGAAAGAAATGTTAACAATATTTATATACCAGGTAAAAACGGAACATTAACAGAGGACTTGGAAACTTATGAGGATATAGGTATCTCTATTACATTTGGTTTTCAAGATAAAGTTAATATAAATAATAAATGTAGACAAATAAAAATGTGGCTATTGGATAAGATAAAAGATTGCAAATTATATTTTTCTGATGATATTGAAACATATTACAAAGTTAAAAATGTAAAGATAGATAATATTGAAAGAAGTATAAAGAGCTTAGGAAAGTTTACAGTACTTTTTACATGTGATCCATTTGGATATATAGATGAAGAGTTTTTAATTATAGATAAACCAATTTCCATATATAATGAAGGAACTTATGAAAGTCAACCTTATATAAAAATACATGGTTCTGGGGATATTAGTTTAAATATAAACAATGAAGTTATTAAATTAAAAAATATTAATAATTATATAGAGTTAGATTCTGAAATTATGGAATGTTATAAGAATAATGAAGCATTAAATAATCATATGTATGGAGAATTCCCAATTTTTAAAGTGGGAGAAAATAAAATAAGTTGGACAGGTAACATTAATAAAATAGAAATTATACCTCATTGGAGGTGCTTATAAAAATGATTACTTTATATAAAGAAGTAGAAACTAACTTTACTCATAATGGAATAGGAATATTAAAAGACTGTTTACAGTGTGAATTACACAGAGAAATAAACGGTCTTTTTTCTTTAGAATTGGAATATCCTATATTTTCTAAAATGGGTGATAAGATAGAAAAACATATGATAATTAAAGCGCCTACACCTCAAGGGGAACAACTTTTCAGAATACAAGAAAGAGAGAGAGATTTAAGTGTAATTAGAGTGTATGCTACACATATTTTCTTTGATTTAACTAAAAATTTTATAGCTGATACTAATATAGTTGGAAAAACAAGAATACAAGCAGTGCAACAGGTATTAGACAAAACTTTAAATTCACACAATTTTACTCTAGAAGGTGAAGAAGGTGGAAAACAAAATAACTGTAGATTAGTAAGAGAAAATCCTGTAGAAGCTCTTATTGGAGATAATGATAATACTGTAAAGAATAGATGGGGTTTAGAACTTGATTTTGATAACTATAAAATAATAGCTAAAGAAAAAATAGGAAAGGATACAGGAGTATTAATTGCATATAGAAAAAACTTATTAGGCATACATGAAACTTTAGATATGAGTGAGGTTGCAACTAGAATAATACCACAAGGGTATAATGGATTACTATTACCGGAATTTTACATCGATAGTCTTAATATTGGAGCCTATTTTCAACCACTTGTTGCCCATATAAAGTTTGAAGATATAAAGGTAAAAGAAAAAAATTTAGAAGGTGAGGAAACTTTAGAAGATGAAGATAGTGAGGGCTTTGAAACTAAAGAAGAAGCTTATGTAGAAATGAGAAAGCAAACACAAAGACTATTTTCTGAGACTAAAGTTGACATACCTTTTTTTAATTATGAAGTGGAGTTTGAAGAGTTAGGAAAAACGGAAGAATATAAACAATATAAGAACTTAGAAAAGATTAATCTTGGTGATACTGTAACAATAAGACATGAAGAACTAGGATTGGATCTAAAGGGAAGAATGATAGCCTATGATTATGACTGTTTATTAAAAAAATATATAAAAATAGAAATGGGTATGAGAAAAAAAGATTTAACTTTACAGATAAAGCAGACTATTGCTGATATAGAATTTACTAAAGAAAAAATAGAAATGGAAGTTTCCAATTTAGATAAAAGTTTAAGTAGTAAGTTGGAGATAACCGAAAAGCATATAATGACAGAAGTTAATGATGTTAATAGAAGTTTAAATAGTAAGATCGAGCAAACAGCAGATAAAATAACATTTACAGTCAATAACCAAATATCTAAGGTGAATAGTAAAATTGAACAACAGGCAGATAGTATATCTTTGGTTGTAGATGGTGGGGGAAGTATAAAGGCTGCACAAATTGCTTTAGCCATAGCTAATGATAGCAGTTCTATTAATATGTTAGCTGACACTATAAATATAATCCCTCATGATGGTGTTATTAATTTTTCTAATGGTACAAGTATAGATACTAGAGATAGCTCAGGGCAAAACAGGGATAACTTTATAAGATTACGTGCAGATAAATATCATTATGTTTGCGTGGATGCTAACGACGGAGCTATAAGTTTATTTTTCCCAGGCGGTGGCGGTTCACATGCTTACTGGACTTTTAAAAAAGATGGGCTGTATAAAGATGGGGTAAAAGTATTATAAGAAAGGAGTGATTATATGGATAAACCGTTTAATTTACTTATAGATACAAAACGAACAGGTTTCAATGCTGTAAGAGGATTGAAGCAAGGGGACAATAATTCTATATTAAATGTTACTTTAGTGCAGAATAGTGTCCCTTTTAATTTAACTGGATTAACAGTAAGAATAAATTATAAAAGGCCAGATAATAAGTTATTTCTTCAGATGGTGAATATAGAAAATGCTACTGAAGGTAAGATTAAAATAAATATATTAACTAAGGTTTTAGAAAATGCAGGAGAAGTTAAAGCTGACTTATCCTTATTTGATAAAGATAATAGAAAAATAACAAGTGCAACATTTTCTATGTTTGTAGATTCTAGTGTTTATCGAAATGATTATATAGATAAAGAAGATTTAGATCTTATTCAATCTATTTGGGTTGAAGAAGATAAAAGAATTAAACAGGAAAACATTAGAGAAAAGAATGAAGAAAGTAGAGTATCTAATGAAAGCATTAGAGAAAAAAATGAAAAAGATAGAACTGATAAAGAACAGCTAAGGGAATTAATAGAAGATCAAAGGCAAGACAATGAAATAGAAAGAGAAAAAAGTGAAGCTACTAGAATTGAGAATGAAAAAACTAGGCTGGAAAATGAAAATAAAAGAATAGAGAGTGAAGAAAATAGAGTTACAGGGGAATCTAAAAGAGTAGAAGCAGAAGAAGAAAGAAAGGTAAATGAATCAGCTAGGCAACAAGGATATACAGAAATAAAAAATACTATTGATGATTTTTCTTTATGTGAGGAATACAACCCTGACAAAGAATATAAAAAATTTAATCGAGTTGTTTATAATGGTAGCTGCTGTGAATGTTTAAAAGATTGTACTAACATATATCCAGTTAATAAAGAATACTGGATTCTTATAGCCACAAAAGGTAAAGATGGGTTAGGCAGCGGAAATATGCATACAGATGATTATGATAAAAATCAGAATGGCATAGTAGATAAAGCTGAATCTATAACAGATGGATTTATAACATATAACGTAACAGATATTAATAATATAGTAAAAAATTTAAGTATAAATGACCAAAACGCTCGAGAAGAGATAATGGATATTAAACTTAAACTAAAAGAGAAACTAGCAGTAGACTTTATAAATAAATCTGGAATCGGATTCTTTGACACATTTGAAACAGATGATTATATAGAATCTACCACGGCGACATGGAATAAATCAGAGACAACAATAGAATTCGGAAGTCCAGAATCAGAGCAATTAGTTTATCAAGCAGTAGAAAACTCAGATACAATCGAACTAGTAGGCGACCAACTCAGGGTGGGGGATATAATAAAAATAGGAGATAAATTAATAACAGTAGAGGAGGTAATATAGTGGAGTATTTAGGAATTGAAAAGTTCGGGTCATTTCTAGATAATGGAGCAGCGTATACTATTCCAGATAGACCGTGGTTTACAGATAACTACCCAGGTAGCTTATCTGAGCGTGGAAAGGGTAATATAAGAGCTATTGCAGATAGACACGAAATATCATTAGGGAACACTCTATCGAATGAAAACTCACAGATACCGTGGATTCATTTAAAGGATGGTTTAAAACATATTTATGTTTGCAAACAAGTTCTAGCAACAAACATATCATGGGACTATTTAAATGAGCGTAATATGATATATGGAACACCAGTTACAATAGATGGAAAACAATATAAGTTGAGGGTGTTAACTGGTGGAGTTGAAAGAAATCCAGATAAACCGGGTATGGTACCTACAGACAATGAGTGGGATACAATAATACAGAATACAGCAAACATCACAGGATTACCAAAACCAACTACAGAAGATTTAACAGAAGCCAATACTTATGGGCAACTAGACGGAAAACATAACCAACACTGGAACTGGTGGGGAATAAATACAATATGTCAAGAAACTAGGACATTAACCTCTAGTAAAATTACACGAGGATATTCTAGCGCTGCAAGTTTTACCAGTTATGATGCGATAGCCTTGAACAGTGCATGCGGGTGGCGACCAGTTTTAGAGTATATCGAAATAGACCCACCCAGCAAACCAATACCAGTATACCCAACATCAGAAGATAAGACATACCCAGAACCAATAAAAGGTAAGATTACTTTACAAACCAAGTATAACGGTGACGGTTATTTAGAGCAAATGGAGGTGTTAGTATATAATTACACTCAACAAAAGTTTGAATATCAAACTGAATGGATAGACAATACAACAGGAGTAATGCAACTTCCAGTAACATTCAAGGCGGGTAACAATTATAAGATAACAGTAAGACATAAAGGAACAGGTGGAATTGCTAAGGGATGGCTTGAACTTTATGTAATCGGGGGGAAATTAGGAAAATACAAGCTATCAGAACCAGTAACCCAAAAACAATATGACAAGTTAACAGCATATACAAGCGGGGATGACCTAATAATGAAACCACAACAATTCCCAGAAACAGAGAACTCAGTTATAAGACTAGTACCTCAAACAATGAACACACTAACAGTAAAAGAAGATACTACAACAGAAGATCTTAAATATTCAAGCACAACGAAAACTCCAACAATAGGGGATAAGCTAATAAAGGACTCACAAATATATACAATATCAAATATAGTAGAAGAACAATCAGAAATAAATGTATCTACTGAAATAGAAAAGGTAACAGATGCAAATAATTCATCATTAGGCTGGTCTGGAAATGTAGGTAAAAATTCTTATCTATATAACGGAAACATATATTTTGCATGTAGAACACCTAGTCAAGTTACAATATACAAAGTTTCACAAGCAGGAGGAACACCTCACCAAATCTGGGGTACAGGAATCACAAATTCGAGAGGTATCGCAGTAGTAGGTGATGGGAATACACTTTACACCGTAGTCGGTCAACCAAAAGCGTTAGCTATATTCAAAACAAACTTAGGTACAAATGAAACATCAAAAACTATACTAGATATTGATACTGACCCAATCGACATTAGTGCTACAATGGACAGGAAATTTCGTAACCTTATAGTAGTCATGAAAGGGTTTGTAACTGTAACTACACTATATGGTATTGTAGGATATAGAATTAAGGTAGATAACGTCAACTCACCAGAATTGTATAAAAAGACAGAATTAGACGTGGGATATCCACATAAAAACATAGGTAGCCCCTTTATATTAGACACTGGAGATTATCGTTCAGAAAATCTATCAGTATCATATTTGAGAAATTACTCAGATGGTAAAGGACAGGTAATTGAATGCTTATGGTATGGTGATGAAATATCAAGGAAGGCCCGTGCCGAAATAAATACCACAGAGACAGGTAGTAGTCGTATATCTAGTGCATTGTATACTAATAAATTAGGAGAGCGCACATTCATGATTACTTATAGTTATGTAGGTACAACTGAAGCCGTAGGAGTATTTAAGCAAAAGAAAAACGAGGATGGAACGTTTAGCTCATCTTCTAATGATATAATATATCCGAACGATTTAATAACGACACTTAAAATTAACTATGATAAAGAGCATGGATTTATAGTAGTATTTTCGACTAGTAGGGGATATATACAAACACTTCACTCTTTAGGTTACGACCATGCATGGAGTAGTTCGTCAATTGTTACTAACGTAGCACAACGAGGAACAGCTCCAATATATGAAGTAGTGGAATACAACCCATATTCATATGGTCAGCATCCGGGACTACTTATATTAGAATATGATGAAACAAATAAGGTGGATAAATTAATACTACGATCAGATTACACAATGGAAGAACCAAAAGCTAATAAACTAACACTAGATAAACCAATAACAGCACAGGCGGGGGAAACAATAAAATTCTTAGACTATGACTTAGAAGTAAAAGCAAGAGAAGAAACAGCAACAATAACACCTACAGAAATAACAGACACTTACTATGAGTATGACGCAAGTTTTAGTAAGAAGGAATCTAATAGAGACATAACAATAAAAGGAAGAAATACAAAACTCACAACATTATATTACTATAATTATTAGGAGGTACAAATATGGGAATTTATATTAATAACACAATAATACAAGAAAAACAGAAAAAAGAAAAAAATAATATTACATTGCAAAGCTTAGGACAACAACTAACACAAGAAAAAATTAAGAATATGCAAAAAGATGCTATAATAAATAATTTAGGTAAAGAATTAACCCAAATAAAATTAGAAATGTTACAAAATAAGGGAGGTAATTTATAATGTATTTTTGGAAATTAGCATTTGAACAAAAATGGATAGATGCAGAAGAATTAAAAGGGGCAGTTAAGACAGAACAGTTTCCGTTTGGAGAAATAACACCAGATGAGTATTATAAAATAACAAAAATATATTTTGAAGTAGAATAAATTATAAAGGCAAAGTAGACACCGAATAGGTGTTTTTATTTTGCCTATTTTTAGTTAAGAGAGGTGACATATGAATATTGAAATATCAATATTATACACTATTTTAGGTGCTGCATTAAGCTATTTGGGATATAAAAGACTTAAAGAAAAGGATAATAAAGAAGAAGGGAAAAATGAAGGGATAACTTCTTTAAAGTTAGATTATATTTCAAAAGGGGTAGATGATATAAGATTAGATTTAAAAGCAGCAGATAGAAAAATAGAAGATGTAAATACTAGATTGATTAAAGTAGAAGAAAGCACTAAGAGTGCTCATCATAGAATAGATGGGTTAGAAAAGGAGGATTAAATTATGGAATTTCTAAAACAATTTCTACAGATTAAAAAGATAATAGCAGTATTAACTACTATAGTATTTTGCATTTTAGCACTAAAAACTAATATATCAAGTACAGAATTTTTGAGTGTATTTACATTAATAATAGGGTTTTACTTTGGACAAAGTTCAGCTAGACAGGCAGTAAAAGAAAGTAAAGAGCAGGAATAAACCTATTCTTTTTTACATTAAATTTTAGGAGGAATGTTAAATGGCTACATACGGAATAGATTGTGGGCATACATTAAGTGGTGCAGATTATGGAGCAGTAGGAATAAAAGCAGAATCTAATTTAACTAGAGAAGTAGGAACAAAAGTAATAAGTAAATTACAAGCTTTAGGGCATACAGCTATTAAATGTTATAAGGATAGCTGTTCCAGTTTAAATGATAGTTTAAGTTATAGAACTAATACATCCAATAATAACAATGTAGATTTATATGTATCTATTCATTTTAATTGCTATAATGGTAGTGCTTATGGTACAGAAGTGTTTACATATGGAGGTAAGGAACTACCACAAGCTAGAGCAGTATTAAATAATATTTGTGCTTTAGGCTATACAAATAGAGGGTTAAAAGATGGTTCTGGTCTTTATGTATTAAAGCATACAAAAGCTAAATCAATGCTTATAGAATGTTGTTTTTATGATAATAGAAACGATATGAATAGATATAATGCCGAAAATATGGCTAATGCTATAGTTAAAGGATTAGTAGGAAAAACTACAAGCAATAGTACACCAAGCAAACCAACAGATAACAACAATAATGGATGGATTAATTTAGATGGCAAAACAGGAATTATAAACACACCAAGTGGTGTAAATGTTAGAGAAAAGAAATCAACTTCTAGTAGAATATTAGGTACTTTACCTAATGGATCAAAGGTTAATTTATATCGTAAAGAAGGAGATTGGATACATATTTATTATCCACCACATGGGGGTTATGTCTATGGAAAATATATAAGATATTAATTTTAAAGGTACTCCTGTAATGGGAATACCTTTTTGTATTATTTTATTGAAAAACAATGTAAAATGTCTGAATTTTTGGAAAAAATTATAAAGGGGAAATTGTATAAAAGTAGAATTTATATAATAAGAATCTGTTAAGTTAAAATGATTTAACAGATAAAATAATATAGAGGGGGATGACTAAATGAAAAAAATTGCAATTGGTCTTTTAACAGCATTGATAATTGGGGTAAATGTGTCTACTGCCCATGCAGCATTTATTTGTAATGTATGTGATGCCAGGGTGATGCCAGGACAAAGCCATTCATGTTGTGATTATTTAGGACATGTGGAGGCTGTACATTCACGTAGCGATGGAACAGGTTGGGTCGACTGTTCCCGTTGTCGTAAGATACTAAGAGCCTAGATAAAAGAAAAAAGATTATTTAAATAAAAGAACCCTAATAAACAGGGTTCTTTTTTATGGATTTTTCTATATTGGTGCTTTATTTCAGCTTATTTTTATTATATCCAGGGAAATAAATTAAATCATATGTGAAGGAATTTTTTTACATATGTAGAATTATAAATATAATAGTTTTCTATAAGTTACTCATAGACCTCTGTATTTAAAAAAAAAGAACCCCTTTTATTGGGGTTCTTTTTTTATGGATTTATATATTGGTGCTATGTTTTGGTCTATTTTTATTATATCCAGATGTAGAAAAATTAATCAATTAGAAATATATAAACTTTCAATTTTAAAGGTACTTCTATAATAGAAGTACCTTCTTTTTTTATTGGAAAAATTATTATAATTTATATAAATAATTCTTAAAAAGGTATTGATTTATTATACTATGCATAGTATAATATAAGTATAGTAATTGATAAGGAGGTGAGTAAGTGATAGAAAGTATAGGAAAGCTAATAGCCCTAGTAATTTCACTCCTAACAATCCGTCAACTGAGTTTGCAGAACAACAAGACGGAGTTAGAAATAAAAAAACTAAGGCTAGAAATCAAAAGGTTAAAAGAGGGGGATTAAACCCCTCAACCTTTCCTATATTATATCACAAGTATATGAATAAAATACTAAATTATTTATTAATAATATCAATTATAATAATATTATTACTGCTAATCAAATTGACTTATAATAAAAGGAAGAAAACTAAATTAGAATTAGAAAAACATGAAATTAAAAGTAAAAAGGATGATTATAATGGCAAAGAGTAACCAAACGGAAGCCAATAAAAAATGGTATGACAAAAATAAAGAACACGCCAAATACTTAAATAAGAGATCACACACACGAAGTTTTATAAAAAATTTTGCAACTTTAGAAGACTTGGAAGAATTAAAGGATTTAATAGAACAAAGAGAAAGGAAATTGAAATGCGAAAGGGAATAAGATATTTAATAGTAGGCTTGTTAATTGGAGCTTCCACAAGATTCATCGGCATTGCAAAAGCCATTGAACCTTCAGAGGATAATTGCCCAGAGAATGGAGAGTATATGTATTGTTTAGATAAGACTACACCGCTATGGATATCTATATATGATGTACACGAAGAAGAAAAATTTATTTATTTCCGACAACCAAATACAAATAAAATTATTAAGCTAGCAGAATTAAAATAAAAACAAAGAGGTAGTTTCCCAAGTGGAACTGCCTCTTTTCATATACACAAGATTTGTTGATTTATTTACAAATATAACATTTTTGGTATAATTAAGCTATATTACCAAGAGGGGGATTAGTACATGAAAAAACTAATATCTATATTAATAGCAGGAATTTTAGCCTTAGGATTAGTTGCTTGTGGATCTAAACAAACAACTAAGGAATATAATAAAGAAAATATTAACCAAGATTTAAAACAGGAAGATAAAAAAGATGAAAAAAAAGAATCAATAGATTTAAAAAATACAGAATTAAATAAAGGACTTTCAACCGTAATTCCTTTAGAGATTACTCAATTAAGGGAAGATGGAGAAGGTGATGATAAAGGATTATTTGTAGAATTGAATACTAAGGATGGAAGTGTGGAACAAAAAGTGAAAGATTTTTACACATATTCTAATGTTATATCAGGAATTGTTAGCAGTGATAAAAAATATAATTGTTATAAAAGAATAGCATTTACAACTAAGCAATTAGGAGGCATTTTAATGTACACTTCTAAAGAAAGTGTAGATAATTTTTTGACATTTGATAGTGGTACTTTTGGTAAAGAAGAATACCAAAAAATATTTGATAAATTGATCAAAGAGGGAAAATAAATATATAAACAAAAACTCTAAAGGTTAATCCCCTAGAGTTTTTTATTTGACGTCAAAAATACGTCAAAAATGTTTTTCTAATTATTTTAATTTGTTTAAGTGAAAAAAATTTTTGTTAGATTAAAAACATTGAATTTACTAGGTTTTTCAAAAGTATTCTAAATTGCTGGTAGCATTTACAATATAATTTTTATATATTAAAGTGTATTTAATGATTATAACATAGCTTAAAAAAATCGTTTTAATGATATATTTGTAGAGACATATAAAAATATATTAATATTTTATTTAGTTATAATAAATAATCTATAATTATAAAAAACTAAAATAAAAGTATGTTTCTAGTAATATTATTATAAAATTATTTTGTTTTTATTTTGGACATCAGTTAATTTATGGTTTATTATAAATATATATATTTATATTTGTTAATGATTGGGGGAATATAATTGAATATAAGCAAAAGTGGGCTTACTTTTTTACAATTTGCACTTTCTTTTATAATATATAAGTTATTAATGAATTCTTTTAACTTTAATTATAATTTATTTAGTGATAAGTTTAATATATTAAAGTTTTTTATGGATTTTGGATGCTGGGTTATAGTATATTTAATAGTATGTTTTATTTTTTCAAAGTTAGTTACAATAAAAAAGGTAAGTAGAATTTTATTTTAAATTTTTATAAAAAAGGAGATAAGTATGAAAAACACTATGGAAAACTGTAATTTTTGCAAGATAATAAACAAGGAAAAAAAGGCTAATATTGTATACCAAAATGATTTGGTTTGCTGTTTTTTAGCAGAAGAGCCTATTAATGAAGGACATATGCTAATAGCACCTAAAAAACACTATTTAGATTTAGACCAAATGGATGATGAAACGGCTATAGAAATAATGAAAGTATCTAAAATTATGGTAAAGGTACTGAAAGATACATATAAATCAGATGGATATAGTATAATGCAAAATGGTGGAAGCTTTAATAATGTTGGTCATTATCATATGCATTTATTTCCAAGATATAAAGGAGATAGTTTCAGTTGGAGTTATGGAGAAGAGGATAGTAGCACCCTTGAAGTTGTAAGTAAAAAAATACAACAACAATTAAAAGATTATGTAATAAAATAATTTATATTTAAAGTAAAGTTATTTTAATATGTTTTCTAATTAGATTACTAAAAAATTAATTATAAGAAAATTTTATTTAATTGTAATAGTATATTTTAAATTTTAAAAAGACCTATTTAGTTATTTAACTAAATAGGTCTTTAAATTTTATATTTTTACATAACTCTTCCTGGCAGTATAGCATCTATAACACCAATGACTAAAGCTGCAATTATAGCACCTACTATAGAAACTCTCATGGTTGGTACTAAAAATTGAGTTAAATATATTATTATGGCTGATATAACAAATCCTTTTAGTCCTCTACCAAAAGGAGAGGCATCTACTCCCATAAGTTTTTCTACTAAATAATCTATAGCGCTTATGATTACAGCAGCCAATAGAACTGCCCAAAATCCATGTATAGTAAACCCAGGAGTAAAAAACGCAGTTACACTTAAAACAACCATAGATACTATTAATCTTATAATGTATCCCATTATTCCACTTGACATATTATTTGAATCATTTTCTCTTTTTCTTTCATCCAT
Protein sequences of DBSCAN-SWA_3 >NZ_CP028842|1430643:1476071|1467770_1470434_+|WP_108458226.1|DBSCAN-SWA MEYLGIEKFGSFLDNGAAYTIPDRPWFTDNYPGSLSERGKGNIRAIADRHEISLGNTLSNENSQIPWIHLKDGLKHIYVCKQVLATNISWDYLNERNMIYGTPVTIDGKQYKLRVLTGGVERNPDKPGMVPTDNEWDTIIQNTANITGLPKPTTEDLTEANTYGQLDGKHNQHWNWWGINTICQETRTLTSSKITRGYSSAASFTSYDAIALNSACGWRPVLEYIEIDPPSKPIPVYPTSEDKTYPEPIKGKITLQTKYNGDGYLEQMEVLVYNYTQQKFEYQTEWIDNTTGVMQLPVTFKAGNNYKITVRHKGTGGIAKGWLELYVIGGKLGKYKLSEPVTQKQYDKLTAYTSGDDLIMKPQQFPETENSVIRLVPQTMNTLTVKEDTTTEDLKYSSTTKTPTIGDKLIKDSQIYTISNIVEEQSEINVSTEIEKVTDANNSSLGWSGNVGKNSYLYNGNIYFACRTPSQVTIYKVSQAGGTPHQIWGTGITNSRGIAVVGDGNTLYTVVGQPKALAIFKTNLGTNETSKTILDIDTDPIDISATMDRKFRNLIVVMKGFVTVTTLYGIVGYRIKVDNVNSPELYKKTELDVGYPHKNIGSPFILDTGDYRSENLSVSYLRNYSDGKGQVIECLWYGDEISRKARAEINTTETGSSRISSALYTNKLGERTFMITYSYVGTTEAVGVFKQKKNEDGTFSSSSNDIIYPNDLITTLKINYDKEHGFIVVFSTSRGYIQTLHSLGYDHAWSSSSIVTNVAQRGTAPIYEVVEYNPYSYGQHPGLLILEYDETNKVDKLILRSDYTMEEPKANKLTLDKPITAQAGETIKFLDYDLEVKAREETATITPTEITDTYYEYDASFSKKESNRDITIKGRNTKLTTLYYYNY >NZ_CP028842|1430643:1476071|1473350_1473539_+|WP_053530615.1|DBSCAN-SWA MAKSNQTEANKKWYDKNKEHAKYLNKRSHTRSFIKNFATLEDLEELKDLIEQRERKLKCERE >NZ_CP028842|1430643:1476071|1475112_1475541_+|WP_003358764.1|DBSCAN-SWA MKNTMENCNFCKIINKEKKANIVYQNDLVCCFLAEEPINEGHMLIAPKKHYLDLDQMDDETAIEIMKVSKIMVKVLKDTYKSDGYSIMQNGGSFNNVGHYHMHLFPRYKGDSFSWSYGEEDSSTLEVVSKKIQQQLKDYVIK >NZ_CP028842|1430643:1476071|1452030_1452498_+|WP_024933552.1|terminase|DBSCAN-SWA MARPCKVIDSQSRHNTKAEIEARKEKEERIKSLADKIEKPPEYLSEKQKNIYKFIVEELKMTGILTNLDVYILSTCAIAVDRLRTIETIINKNVGSLCNKDLMSAKDKYTKDLYRCCNELSLSPQSRAKLGNLALNNKEEQEDPLLKALREDDED >NZ_CP028842|1430643:1476071|1472331_1472553_+|WP_108428875.1|DBSCAN-SWA MKKIAIGLLTALIIGVNVSTAHAAFICNVCDARVMPGQSHSCCDYLGHVEAVHSRSDGTGWVDCSRCRKILRA >NZ_CP028842|1430643:1476071|1443982_1444726_+|WP_053530590.1|DBSCAN-SWA MDEQQFLKTMIETVKYDDEYSNKDELLGILRNSKITYDKTSDFSRKYYHCWEYIDLRAPVPMLTVARKFKSVLGKLAADVYIEPSDYEFGGLCIKPKPVELDSEEYTEHNVFFDEIKDTIVQGIRNAKYTIWAAVAWFTDTEIFEELLLRKKDGVNVRIITSDEKSNQYLIEKLESNFEVVKVPLKGTYLSNRLHDKFCIIDFEFVMHGSYNWSKNARGNDETLVTALDRDFVRKFADEFMKLYNEN >NZ_CP028842|1430643:1476071|1452494_1454189_+|WP_108458215.1|terminase|DBSCAN-SWA MILLDKALKYCNDVIEEKEITTDEVKQQCEMFLCDYNINQYKEEFEFCFSEKKLKKINNLLKLFNYATGFVAGKQVLENLEGFQALFIAAIFGWRYKKNKKKFRYRDIVLFIPRKNAKSFIAALVILLLMLTEQNFSEFYSICIDRDLAKETRKAMAQLIASSPDIKKHFFVSDSEIGIIKCLITNSYYVPRTAKANKNNSIRPACFVADEVGAFTTNDNIQAMRKGQLSVLNPIQMQTTTAYAESDSIMLEELEYDRAVLNGVVADPKLFCLLYYCTKEEAWTDRGLYKANPLRVEENYEEIRADREKAKIKTSEQEELLTKNFNIFLETNEKNKYLDIKHWKKWVITEEEFKQRIKGKKVKVGVDLSVTTDLTAVGIEFEDEGIIYCNSHGFLPEDSLPNRREKHIDYRKYEKAGYCDIHSGMTVSYTKVEEYIRNIETEYECEIEVIVTDPMNAKEMMERLAEDYDVVLLKQTFTNLSPATKEYRKAVYDKKIRYVKNELLDWNMNKASTTKGKADDEMLIKENKNKQRIDMVVVLIFAFTELLGGDTNYNPVDELEKTDW >NZ_CP028842|1430643:1476071|1449527_1449830_+|WP_108428859.1|DBSCAN-SWA MEVYCNKCNKDFEIKAKEKKYADGIVELYFKCPYCKERYTSFFTDKNIRHKQKKVRKLYEQYGKETDEHKIIELLKQIDDLKAEIGNDMNKLKNKMLGTQ >NZ_CP028842|1430643:1476071|1437520_1437931_-|WP_012721116.1|DBSCAN-SWA MLGDKIKKLRKSKNITQEELGKNIGVTTSMVGMYETNARKPSYEVLIKIAEFFSVSTDFLLNTEEKLDMTLDSVKKVYNMVKEATEEYGIEEVNQPEKQENKIKTLAAHFEGEEFTDEDVEDIENFIKFIISKKKK >NZ_CP028842|1430643:1476071|1455637_1456243_+|WP_080276077.1|head,protease|DBSCAN-SWA MIQVRVEIRSDHVIIEGYINAVERDSRPMPSPKGKFVEQVRSGVWKNAISKNDNIIFLLNHNNNKKLGTSKENLKLREDNIGLYAETRVYDPEVIKKAKENKLIGWSFGFKKIKDSWGKTDDGIDRRYLDEIELREVSILDDSRIPAYYGTSVETRENEEITTELRSFEDIVIEKIEEDTSKNEDEKRELKLKLLNLELEL >NZ_CP028842|1430643:1476071|1457690_1458062_+|WP_108458219.1|head|DBSCAN-SWA MFKVNIGDLNKRIVIQKYIINQNENGFDIEEWIDYKAVRASMNNLWGKEFYAAKATNSENTVEFIVRYSKDLKNINTKEYRIKTIKDKNATKEKDKYRYFDITFIDNIQYKNKWLKIKAIEVI >NZ_CP028842|1430643:1476071|1438142_1438364_+|WP_012721118.1|DBSCAN-SWA MANHITTLRKKAGFDTAKEAAKALNISNGMMYQMEGGYKTPGSQLAIKMSKQFNCTLEDIFLPFNTTKSCIRS >NZ_CP028842|1430643:1476071|1471379_1472147_+|WP_108458228.1|DBSCAN-SWA MATYGIDCGHTLSGADYGAVGIKAESNLTREVGTKVISKLQALGHTAIKCYKDSCSSLNDSLSYRTNTSNNNNVDLYVSIHFNCYNGSAYGTEVFTYGGKELPQARAVLNNICALGYTNRGLKDGSGLYVLKHTKAKSMLIECCFYDNRNDMNRYNAENMANAIVKGLVGKTTSNSTPSKPTDNNNNGWINLDGKTGIINTPSGVNVREKKSTSSRILGTLPNGSKVNLYRKEGDWIHIYYPPHGGYVYGKYIRY >NZ_CP028842|1430643:1476071|1432699_1433494_+|WP_011948923.1|protease|DBSCAN-SWA MAYDIKLKNKNEEELERIANIIMNLFLYQVVFFIIFIMLANILGYVGLNKNIIQPYSKLAGEILAYIFFIKNYIKDNRYKLKFKNTLHFKGYVFIAMLIIGYILVYDNTIDIVLSKVVKNSWFYDVMTKEMKNPIVGFIGTVIMAPIFEEIVYRGIMLDELLVKYNYKKAIIISALIFAAIHLNFVQLTDAFIAGIILGTVYCKTKCLIPCIIIHFLNNLFCNIAKFYPSIYKTKFNIIRLGIGIAILATLAYIFLKDRKKVIL >NZ_CP028842|1430643:1476071|1440486_1440669_+|WP_003399945.1|DBSCAN-SWA MLRKLLKERGINLTKEEFAIVAEITTDDIKFNRVSFRKCTSLNYVLYIAIRSASIFKRCA >NZ_CP028842|1430643:1476071|1473523_1473769_+|WP_053530616.1|DBSCAN-SWA MRKGIRYLIVGLLIGASTRFIGIAKAIEPSEDNCPENGEYMYCLDKTTPLWISIYDVHEEEKFIYFRQPNTNKIIKLAELK >NZ_CP028842|1430643:1476071|1435960_1437028_-|WP_053530583.1|integrase|DBSCAN-SWA MQYSTLIRKKDKGYQYIITYKVGNKWKTKSKQGFKKRQDAQTAMDKSLVELEKSVKNNMDPSMSEITFKQFTDMYLEHLKIYRTTNTILAFKTVLNHFVTLSNKELAKISNIDIQHIVDSLTLTGLNPSTIQEYIRKLNTIFKSAMDDYNIIDKLPTKNLKFNKSKQQVNKRALNENEENKLLEDFKSNKYYLVILLGLKCGLRLGEILGLTWSDIDEVNKTIIINKQWKQVNPTKYNFGELKSKNSNRIIPISKNTLDELKKHKKIVNINNRIFKFKNTNSSCICLNRLLKLKGYDITVHELRHTYATKLISNGVDFKTVAQLLGHTVEQTMKTYSHVNDDMMKKATKIIENIF >NZ_CP028842|1430643:1476071|1449866_1450079_+|WP_108428860.1|DBSCAN-SWA MLSMYTSYKCICCNKEFVLLTEELEYIKGYLVCPYCSSRKVKKEKVSDILKECMSERSYKRIKGVLRQVR >NZ_CP028842|1430643:1476071|1458061_1458421_+|WP_108458220.1|DBSCAN-SWA MADGIEIEGMEEFTEMLEDMTIDEADEKKAVRKGIEVVAKRVESNTPVLTGKLKKIKKSVKKEGFATVGTVKLGAWWDLFQEFGTSQQKHHVGFFDRAVKDSENEAVEIVVEELLDKVR >NZ_CP028842|1430643:1476071|1445716_1446172_+|WP_053530593.1|DBSCAN-SWA MRLEKVENRNRGYDIYLIIANRDYKSWWTSPPKSVDHAGLEYLKDRYPKINTKARMETFKELYKNLWIDITKTQRQNMKHCIGLDYKKKPYRNYYCTSHKDENWNNLVEKGLAVKSSKEPNSYGCTCFWLSKQGVEFILDKSISDKVYEEL >NZ_CP028842|1430643:1476071|1430643_1432362_+|WP_011948922.1|DBSCAN-SWA MLKEFISYYKPHKELFVLDMIAAFIVALCDLFYPMITRQIINDIIPNGKIRLLFFWAISLLIIYIMKYFLNHFIQYWGHMVGVRIQADMRKRVFNHLQTLPFTYFDENKTGVIMSRIINDLMEISELAHHGPEDLFISIIMLIGSFIILCTINIPLTIISFIFIPILVWFSMKNRLKMEKAFMDSRVKIGDLNAELENSIAGIRVAKAFTNRDYENEKFEMGNKRFVGARQMAYKSMADYFSGMYFFIDILDLIVLIAGGYFVYKNLINFGDLVAYLLFIKMFMTPIRKLISFVEQYQSGVTGFERYRQLLRVKPEEDKEEAEVLENIKGAIEFKNVSFKYDEDTHILNDLSFKVEEGKTLALVGPSGGGKTTLCNLIPRFYNIDNGDILIDNNSIYDVKIGSLRKNIGIVQQDVFLFTGTIKENILYGNPEASYEEVVKAAKLANIHEFIESLPEGYNTYIGERGIKLSGGQKQRLSIARVFLKNPPILILDEATSALDNATEYLIQKSLEKLSNGRTTIVVAHRLSTIKNADEIMVLTDKGIEERGTHEELLALDGIYSELNRNIEKTKG >NZ_CP028842|1430643:1476071|1473032_1473173_+|WP_021106362.1|DBSCAN-SWA MIESIGKLIALVISLLTIRQLSLQNNKTELEIKKLRLEIKRLKEGD >NZ_CP028842|1430643:1476071|1438689_1439490_+|WP_053530585.1|DBSCAN-SWA MKKINLTIENGQPVITEIKPVVVNNKRILTTKQLAEVYQCNETQIQQNFNNHSDKFILNKHYFLLKGNDLRDFKHNIDNIEVAPNVNKLYLWTERGANRHCKILDTDKAWEQFDNLEETYFRVKEKNLPPMSIEDILIENLQQMKDVKQQLNQVNYTALEAKHASEENKEKLEEFPLFTIDSKELSKVVSKIAIKCLGGKGTPAYKELNRKVFSDIYKQVWREFDVTSCAAIKRKYLEDAKKFISEYKLPRALANEIETLNNQVSF >NZ_CP028842|1430643:1476071|1450983_1451466_+|WP_108428862.1|DBSCAN-SWA MARSDSFEDIIEKRLDEIEQWVESNNTDKEIAEKLGIAYSTYRKYKSTNVALKSRIATAKDKKNQEVEKALYKCCIGYHYYEEVITKVKTEDVVNGQIITNEDVKISKVKKYRGPELNAQKYWLNNKEKAKWKEDPHKVSNDKKLTKLKEKEVNSKVIEI >NZ_CP028842|1430643:1476071|1470645_1470792_+|WP_033047576.1|DBSCAN-SWA MYFWKLAFEQKWIDAEELKGAVKTEQFPFGEITPDEYYKITKIYFEVE >NZ_CP028842|1430643:1476071|1464013_1464715_+|WP_108458223.1|tail|DBSCAN-SWA MFSIQFNNYNSYRDLGLVVEHRPNIPAPERNVNNIYIPGKNGTLTEDLETYEDIGISITFGFQDKVNINNKCRQIKMWLLDKIKDCKLYFSDDIETYYKVKNVKIDNIERSIKSLGKFTVLFTCDPFGYIDEEFLIIDKPISIYNEGTYESQPYIKIHGSGDISLNINNEVIKLKNINNYIELDSEIMECYKNNEALNNHMYGEFPIFKVGENKISWTGNINKIEIIPHWRCL >NZ_CP028842|1430643:1476071|1446525_1447575_+|WP_108428855.1|DBSCAN-SWA MQYVKEININEAVVHILDNNSEEPVLNEYKLRLDDECYKYILKHVDKCLKDECLRYAKFNEEKNVVKEVSQEYLNGHNDLLDVSKELAKQLFILMKGNDNISSCDLMIVSISTEYGPMLAILKMDYVKNYIHVVDMVEDKVGIDIVPEFTGLPASAQKIEKCAFIKPIREDQEFNLMVIDKQKKNKTSEEYGSNYFINKYLGCSIIENERDSTKAFVQATEKWSKINLNEDAATSEKIIRTVGKLLKEKDTIDIEEVSNDIFGENSDAKLNYEGFIAEQGIKEKIDVDKEWVDKKFKRIRLKIDRDIDLYIDKESYHDDSRFEVKRVGDGSVNIVIKNVYNYMQKISGK >NZ_CP028842|1430643:1476071|1446219_1446495_+|WP_053530594.1|DBSCAN-SWA MEIYIAGKITGLKDYKEKFNKAQEKLISKGYKCMNPSVLPEGFPWEVYMPICYAMIDACNSVYMLKNWTDSKGAKLELEYAKSKNKKIIFE >NZ_CP028842|1430643:1476071|1441851_1442565_+|WP_053530588.1|DBSCAN-SWA MTSNICHICNGTGWEFDNETETYRRCECYEKEKLQRLWNKYGIDPKDIKKLNEYKPIDDIQISARDKAVKYIKNFENIKDTKENGFGLFGQPGAGKTHILLSIGAALITKGIEVIYMPYVEVMRELKATAMDNEYYIKLSSSYMKAKVLIIDDLFKDKLKNGELVGELREADIKHLYPILNYRYLNNLPTLVSTECIPDILQKLDNAQCGRMIERCGDNITIFKGPKYNYRMRKFVK >NZ_CP028842|1430643:1476071|1475696_1476071_-|WP_003391740.1|holin|DBSCAN-SWA MDERKRENDSNNMSSGIMGYIIRLIVSMVVLSVTAFFTPGFTIHGFWAVLLAAVIISAIDYLVEKLMGVDASPFGRGLKGFVISAIIIYLTQFLVPTMRVSIVGAIIAALVIGVIDAILPGRVM >NZ_CP028842|1430643:1476071|1457413_1457698_+|WP_108458218.1|head,tail|DBSCAN-SWA MTVEEIKDYIIVDDESDSFPEELMEISQIYIDSMVGEGYKQDEKMIKLASLLQRKLCADMYENRSTEVPQNVKQDRITASILDKLSNYDGDINV >NZ_CP028842|1430643:1476071|1440995_1441862_+|WP_003399942.1|DBSCAN-SWA MFVKIGVIIIAKKYYWLKLKEDFFRQKEIKKLRKIAGGDTYTIIYLKMMLLSLKDEGKLFFEGLEDSFIDEIALEIDEDLENVKVTIMFLIKCRLIEELTENEFLMTKAYESIGSETQSAERVRRFRQRKKALLSNGEVTKSNTEIDIEKEREIDIEKDKIKIDWNKILEAWNALPEPIKSVRSITDKRKKKIKIRMKNLKLTQEDILKAIDKISKSNFCKGINKKGWTIEFDWLFKDDNNITKVLEDKYINKDGKYGDRENNSKDKSQYDFNRPYTGPSYSDQEIDF >NZ_CP028842|1430643:1476071|1459501_1459879_+|WP_024933172.1|DBSCAN-SWA MLNKIRKQKIGDKEYSFKMTNKTIRKIDEKYGNYGSVIYSLMEGQQFYTNALKLVSMCCVDKEKVLVNKEENKYEEKIKEWDIEELEDIITGQQYQEITNLSVDLYLDYMGMNQTEDKEDKKEKN >NZ_CP028842|1430643:1476071|1460217_1464021_+|WP_108458242.1|tail|DBSCAN-SWA MVLDSSGFNSSLKGVNAELKNAQSQMKLASSGIQAFGKDSEKLKSVQEALSRQVELHSKKVDVYKQSIEKTTSKMQDNIKERDKLKESLSKTESELKKVINTGSKELQSYIKNREELTKLNKQYDEAKKRYGENSKEAEKLKEQITKLENEQKKLTAGKEKEIKAYEKAKTEVDKTTKEYEKNEKAIDSNAKKIQQYDTNLNKAQSQMNKAQGELKKINEELDKQNNKWVQASEKLGEHSKKLKDTGQKITDVGKSITTKVSAPLAGLGIIAAKTTADYDDSMSQLKAITNSSTEDMKKMSDQAKDLGVKTRYSAKEAADSMVMLGQAGYRTTEIMNTMPAVLNLAQAGAIDLTQSTDVLVSSMSQFGIKTENAAHVADVLSLGANKANLGVNDMAEALKYAGSMANTAGWSIEETASAIGLMSNYGIKGSQAGTALRGAISRLVKPSEASAEKMEALGIKVFDNNGKMKALGEVIDEVKKGTSKLTEEQKMNALVTIFGQEAIAGINALMTEGGDSVRKYADELKKADGSAEKAAQTMEDNMGGAFRSLKSAMEGAAISIGSAAAPAIREITDKITELTRKFSALSPETQRNIVKFGAFAIATGPVIVGIGKIATGFGSILSVGSKVAGIMGKVTLATKGVEVATTTAGVAATSATGAASAGLAGLGSIALPVIGVIAAVGGAVYLAHKNTQYLNDSCVKSAEDMGTMETAMAGLNGHVIHTNKQLEEMNVKHKEWSNKVSKDTQKSLDQCANKIADYSMELKNAEKIDNLVDSEAGIRLKTKLDDICNSAIKKIKEKQPELQKTLADGFAADGKIDENEKKILASINKNGQEQIKKVNDIKSKILELEKKASKQTGEAKKATLAEVDKLTKEIGNIELKNTVKSKEELMAAQADFNVRMKNLDMNGLSKLMESKAKARDTEVKKIKENYDKQIELLKLNSINVDSETKKAIDIKIEQLETAKNKEIGVENEKYKGYLDAAIEKYPQLINYIDMQHGTMLTKEQQQKQAELLEYGSKMEGFLGITETGYYKIKDSVTGQMHNCYVEVDKSTGQIVGAWDKSNNKIYGNPIKAQEKIDQELKNGQKFKPIGDSYDRVKEGIWKRAIEAQAKTNYNLFNWIHDAHSNAQSWLSNHPFIASVVQQVLHPNTPTYIPRRWTGDKYFTGGLTYLHDAPGKNNNYELYDLPRGSRIYNHDASEDLVIKTAENVASKVANSVLKNFKGLTAGGQDQTIIVPVNLDSREIARVTAKPMSEELGKLNRRGGLGYV >NZ_CP028842|1430643:1476071|1473208_1473364_+|WP_080372823.1|DBSCAN-SWA MNKILNYLLIISIIIILLLLIKLTYNKRKKTKLELEKHEIKSKKDDYNGKE >NZ_CP028842|1430643:1476071|1447681_1448398_+|WP_108428856.1|DBSCAN-SWA MAKKQIENVLIDGQVSIWDIDKNIKKSNGKPVIKLENKEIKINNIEQGKIIAKYKTYENLNRIIGYAGGALGIEIKYKDRFETIYVNKKGEEEFVIKKKSSVLPWDKIIYFREDLKINNIQKEKIKKIKGQALKRPGDENIIFNQGNKVISVIENGWVLEYDNIKIAELEKYKKINADSMDQDFKKTLKLGNIVETEYKDEIIQGKVVHIYNNGYTCNIIEGNRYIPIPICGIRQVIA >NZ_CP028842|1430643:1476071|1438387_1438678_+|WP_012721326.1|DBSCAN-SWA MDKLLTKKELAERWQVAEKTIDNWRENGVLTPCSGIPAIRFSLQHIAELEGTKVEKFSPIERRRLEIENEKLKQENEKLKGILANVLSEVSKIINS >NZ_CP028842|1430643:1476071|1448887_1449280_+|WP_108428858.1|DBSCAN-SWA MMNKKIYEKYKKNAENDLRNYPYWLLAIETPGLGAPNRWGQQVNQSGYFKTSTVEEDMIKDMERRWKVDIITKVLKHLDPTSKTIIEEWYFRDNNSREELLKELNIDKNKFYYYRNRALKKFMVAIGYLK >NZ_CP028842|1430643:1476071|1440224_1440485_+|WP_053530586.1|DBSCAN-SWA MSKKIKTTDLNLNVSTGTMLYVDIDIFRFSYDQEIFNLTIKILDGENYEFFEEVDLPEDEAIVDHNDLKIFALNWIFKNVEVVKEI >NZ_CP028842|1430643:1476071|1435362_1435827_-|WP_011948926.1|DBSCAN-SWA MFKEIRRKEKKLNNEESISLLKESNYGILSVCLNNGYAYGVPLNFVYSNGAIYFHCAKEGQKLEAINGNDKVSFSIVNNVELLPSKFDTNYESVITFGKAYEVFEDEKKQALLALINKYSKDYLKEGTAYIERAQDKIKIIKIEIEHITGKGQR >NZ_CP028842|1430643:1476071|1442578_1442896_+|WP_053530641.1|DBSCAN-SWA MQLMILKNSSKLGINNELLTLENLIDKLQEEVKELKDAVEDKNNIDHVAEEAWDSLQMCIEVLDKLESKHNVNLKATLNKHHKKIKDREWKAKKMIVFQIFNDYH >NZ_CP028842|1430643:1476071|1471144_1471339_+|WP_108458227.1|DBSCAN-SWA MEFLKQFLQIKKIIAVLTTIVFCILALKTNISSTEFLSVFTLIIGFYFGQSSARQAVKESKEQE >NZ_CP028842|1430643:1476071|1450079_1450685_+|WP_108428861.1|integrase|DBSCAN-SWA MGIKRPAKAITSTTKVLDIQDYLRYKNERDYVLFILGITTGYRAGDLVKLKVRDIKEALKRNEFTIYEGKKMNCKNIKERNKKPRSVEVLPKLAKILKGWIKNKKDYEYVFQSRKGINQHIGVQAVSNILKDAGEYFGLHDITAHSMRKTYAYKIYMESDKNIVAVKELLGHRSIEETKKYIGLDKEKYHQYSKSLEEYIR >NZ_CP028842|1430643:1476071|1454421_1455669_+|WP_108458216.1|portal|DBSCAN-SWA MIFDKLVERREAVDVNDWKSVYSFENGYDITPFELEMRESTYFSCINNISQDIAKCTLQIKKEIEKGEVLAKEHYLYDLLRLRPNPYMSAIDCYKTFVALAKHWGYAGLFIDRQRGKVKGLYPVKITNCTIDNTGLINSTKNNKILWDFEGVDGETGCCFDKDIIILRDFTLDGIKGKANRSILSESLDSSLKSQNYLNKLFTNGLTNKIVVQMTSDIKEEKELKKVQAKFDRVYSNNGKIFTIPAGYNIQPLNLSLSDAQYTELRKLSKEEIAMSFRVPLTKLGFVKENASSEEQDNIKYLTECLLVIFEQIEQEMDWKLLTPRERELGYKVRFNINVLLRTDSKTQSEVISTYVKNGVYDLDYAKDIVGVEKIGGELIITLPSGQVLLRDLLAGNVSYLNKKGSDTSEGGDKK >NZ_CP028842|1430643:1476071|1433657_1434014_+|WP_011948924.1|DBSCAN-SWA MKIAMPKNEKIINQHFGKSKSFAIVTVDDNKIIDIKDISTESLQHNHGGLSSLLVEEKVELVITGGIGQGAYDALIKEGLKVIRGAKGTIEDVLQQYLRGELQDRKVMCNHHGEHHHH >NZ_CP028842|1430643:1476071|1474860_1475088_+|WP_003391739.1|DBSCAN-SWA MNISKSGLTFLQFALSFIIYKLLMNSFNFNYNLFSDKFNILKFFMDFGCWVIVYLIVCFIFSKLVTIKKVSRILF >NZ_CP028842|1430643:1476071|1473892_1474411_+|WP_053530617.1|DBSCAN-SWA MKKLISILIAGILALGLVACGSKQTTKEYNKENINQDLKQEDKKDEKKESIDLKNTELNKGLSTVIPLEITQLREDGEGDDKGLFVELNTKDGSVEQKVKDFYTYSNVISGIVSSDKKYNCYKRIAFTTKQLGGILMYTSKESVDNFLTFDSGTFGKEEYQKIFDKLIKEGK >NZ_CP028842|1430643:1476071|1459935_1460124_+|WP_108458222.1|DBSCAN-SWA MAKVHLNYTKEEFWDSTHAEIYKMWQRHIKFNKWEIRSDNEENNSTSDVNHKRVNIEDIPFL >NZ_CP028842|1430643:1476071|1464717_1466391_+|WP_108458224.1|tail|DBSCAN-SWA MITLYKEVETNFTHNGIGILKDCLQCELHREINGLFSLELEYPIFSKMGDKIEKHMIIKAPTPQGEQLFRIQERERDLSVIRVYATHIFFDLTKNFIADTNIVGKTRIQAVQQVLDKTLNSHNFTLEGEEGGKQNNCRLVRENPVEALIGDNDNTVKNRWGLELDFDNYKIIAKEKIGKDTGVLIAYRKNLLGIHETLDMSEVATRIIPQGYNGLLLPEFYIDSLNIGAYFQPLVAHIKFEDIKVKEKNLEGEETLEDEDSEGFETKEEAYVEMRKQTQRLFSETKVDIPFFNYEVEFEELGKTEEYKQYKNLEKINLGDTVTIRHEELGLDLKGRMIAYDYDCLLKKYIKIEMGMRKKDLTLQIKQTIADIEFTKEKIEMEVSNLDKSLSSKLEITEKHIMTEVNDVNRSLNSKIEQTADKITFTVNNQISKVNSKIEQQADSISLVVDGGGSIKAAQIALAIANDSSSINMLADTINIIPHDGVINFSNGTSIDTRDSSGQNRDNFIRLRADKYHYVCVDANDGAISLFFPGGGGSHAYWTFKKDGLYKDGVKVL >NZ_CP028842|1430643:1476071|1448394_1448580_+|WP_108428857.1|DBSCAN-SWA MSWIDEILDRALENVKKYLKEKDKPLKRYKKRVKNRNILYKKRMKLGRVKRKVRSGNHGGK >NZ_CP028842|1430643:1476071|1444859_1445291_+|WP_053530591.1|DBSCAN-SWA MSKKCLLLCNRHNSIYGDNWCLWWGERESKSGYTSDIRLAHRFNEEEIKGYAEKGYDIPVPIDVIGVLEEYEPKETYNKNLRVMIEKGTLNELMELELKPLFPDDEIICPNCGSCHYKEDFDYMGNEILICKECEYEFSEDDL >NZ_CP028842|1430643:1476071|1445334_1445685_+|WP_053530592.1|DBSCAN-SWA MSYEKDIEHEYTNEIVCPFCGYEFIDSWEYGEEDLGLIECNECGKEFYANRDISVTYLTCKANYGTCKHCRDDNVVIEDYNSTVGKYSGLCVKCGELEKQRLLKEYFDSIHNKKDC >NZ_CP028842|1430643:1476071|1437040_1437502_-|WP_053530584.1|DBSCAN-SWA MTYNKLLYEAESQGVEVVEMKFKGKCKGLYGDNVIALDKNIETLKEKRCILAEELGHHYTSSGNILDNSNISNLKQEKRARNWGYEKLVGIIDIINAFNAGTKNRYEMAEHLEVTEDFLESSIQHYKEKYGVLFEIDNYIVFFEPNFGVMKKF >NZ_CP028842|1430643:1476071|1434432_1435326_+|WP_011948925.1|DBSCAN-SWA MKEYIIMTDSCCDLPSEYIENNHIPYIPLTCNVEGKEYIDNFGQSLPYKQFYEAMIKGEIPKTSQPSPEAYYKVFKELIDKDKDILYVCVSSGLSGTYNSANIAKNMILDEFRNARIEIVDVLTASLGQGIMVMKAMDMKKNGLTIDEVTSYLEENKLNLNSYMVVNDLIHLKRGGRISTAAALIGTVLNIKPILTLNDEGRVITVRKAKGRKVAIRKLAEIVIERIKNPEEEIVAISHGDSDLDAEKLRERILKEIKVKDIIINYVGPVVGTYGGPGSLNVFFMSDHRQNHIIDIN >NZ_CP028842|1430643:1476071|1470862_1471141_+|WP_024933165.1|DBSCAN-SWA MNIEISILYTILGAALSYLGYKRLKEKDNKEEGKNEGITSLKLDYISKGVDDIRLDLKAADRKIEDVNTRLIKVEESTKSAHHRIDGLEKED >NZ_CP028842|1430643:1476071|1439668_1440160_-|WP_003384822.1|DBSCAN-SWA MGSYRIAQICLNGHIVTDSYDTTPQFGEKFCTKCGSKTIISCPNCSANIRGDYESDTVCYLGSTMHTTPAYCYNCGQPYPWTKSALESARLLINEDENLSQIEKQQFSESIPDLLVESPTPKTKVAVVRFKKLLGKAATYTAEGIRDIFVDVASETIKKSLGL >NZ_CP028842|1430643:1476071|1442936_1443737_+|WP_053530589.1|DBSCAN-SWA MKVLKWPGTKWSIANKIVDLMPEHKIYLEPFFGSGAVFFSKQPCNTEILNDLDSEVVNLFRCIRNTPEELAKLIYFTPYSKEEYKESYNRSGSDIERARQFLIRSNMARAGMQYYSSSWRHAGPVLGGQCKQRVSGDWNKVPERILQAADRLKDAEIENTNALELIKKYNKKNCLIYVDPPYLLSTRRQRYYNVEMTEDQEHEELINLLKKHSGPVMLSGYNSDLYNDLLNDWSKVEIKTNAEQGKERIEVIWTNYEIPKQISLFG >NZ_CP028842|1430643:1476071|1466406_1467771_+|WP_108458225.1|plate|DBSCAN-SWA MDKPFNLLIDTKRTGFNAVRGLKQGDNNSILNVTLVQNSVPFNLTGLTVRINYKRPDNKLFLQMVNIENATEGKIKINILTKVLENAGEVKADLSLFDKDNRKITSATFSMFVDSSVYRNDYIDKEDLDLIQSIWVEEDKRIKQENIREKNEESRVSNESIREKNEKDRTDKEQLRELIEDQRQDNEIEREKSEATRIENEKTRLENENKRIESEENRVTGESKRVEAEEERKVNESARQQGYTEIKNTIDDFSLCEEYNPDKEYKKFNRVVYNGSCCECLKDCTNIYPVNKEYWILIATKGKDGLGSGNMHTDDYDKNQNGIVDKAESITDGFITYNVTDINNIVKNLSINDQNAREEIMDIKLKLKEKLAVDFINKSGIGFFDTFETDDYIESTTATWNKSETTIEFGSPESEQLVYQAVENSDTIELVGDQLRVGDIIKIGDKLITVEEVI >NZ_CP028842|1430643:1476071|1458428_1458791_+|WP_108458221.1|head,protease|DBSCAN-SWA MTIKQYLLKILNNKEILDLLPDKKVFFLHANNPNKSMYLEYEIIDEYGADYSEGKEDYTTYVVQIDIFSTGDYTECEEVVKRIMIQNGFNRDMAADLYEKKTGLNHKPMRFSIDLPTSKG >NZ_CP028842|1430643:1476071|1440685_1440958_+|WP_053530587.1|DBSCAN-SWA MNENWCILAIAALYERPCTIEQAFEVFDKGKLTKNKKKSQEDIEDMVKFRNMGMTFEEIADIYCADKRTVCRLINSFKKKKIAPCQEHNN >NZ_CP028842|1430643:1476071|1458835_1459444_+|WP_025775376.1|tail|DBSCAN-SWA MSEEKVVPIVDLKKLYVAKVLTDRLTTTFDAPRYFEGVKELGLKPKVNSDDFYAEGILWISETTLANIDVEIDITDLKKEEEAFLLGHKLAAEGGIIRSSNDEAPEVALLYKAMKGNNKARYGIMYKGTFSISDESYKGKEGKANFQTKKLKGTFAPLRSNEMWNWKVDEEDGMTDEKFFKEVIIPTPKVDEEVENKKSEEA >NZ_CP028842|1430643:1476071|1470445_1470646_+|WP_024933166.1|DBSCAN-SWA MGIYINNTIIQEKQKKEKNNITLQSLGQQLTQEKIKNMQKDAIINNLGKELTQIKLEMLQNKGGNL >NZ_CP028842|1430643:1476071|1456291_1457368_+|WP_108458217.1|capsid|DBSCAN-SWA MGLEELRAQLEAKKVEIREFIKDKKVAEAEKAMEEKRGLEKLIKAAEELEEEEKRDLENQRKKKTQPEENNEFRAIVKTVMGEETTTEERANIKSVDNAAVIPKQFVNKLIEIQKGFGSLKGLCDVIPVTKNEGTIPVIDLDQNEMADVAEGEDIVDGTLVTTDVPFKCAKVGLIQSLASETVDDAEVEMEGLVKKNFANIATVKENAKILKVIKDNATEVVGVTSYEDVEKAIDGSLPSIKAGLVTLTNVAGYVELKNKKDKQGRSLNLITNINGVEYFHEKPIITVDDILLPVSEGKTQVFYVANMNEAVKYCDRKAVTIARSTEAGFKDDTVKLRILERFVPVLGAKRSIKKIEF |
63 | Clostridium_phage(75.0%) | terminase,head,portal,integrase,tail,capsid,protease,plate,holin | attL 1436255:1436273|attR 1470644:1470662 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
1730069 : 1737135
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >NZ_CP028842|1730069:1737135|DBSCAN-SWA ACTATGTCATATTTGAATATATATCATTAATTTTTTTACATTTATCCTTTATAATTTCTCTAATATGATTGGGTTCAAGTACTTCCACACATTCTCCGTAACTTAATATCATGGAATATATCCAGTCATCTTCTAATAAATATGTATCTACAATTACACTACCATCTTCTTGAAACTTTATTTCATCTTTATCAAAACAATCGTCTATTCTATATCTAACTCTTTCAGAAAACTTTAATACAACTCTTGTAGGTACTTGTTCACTCTCACTAATATTTATATATTCTTTATAGGAAATTCTATTTTCATTAATTTTTTCATGTGGAACAGTTAAATTTTCCATTCTTGATAATTTGAAAAGTCGGTAATCATTTTTTAATTTGCAAAAGGAAAATAAATACCATGAGAAACCTTTAAAAACAAGAGTTAATGGCTCTATCTCCCTCCAATTATATTCACCTTTTGAGTTTCTATAATCAAAGGCTATACAGTTTTTGTTATCTACAGCATCATATATAATTTTGTATTTTAAGTTTTCTTCTTCACATTTTTTAAAGCCCCAAGGTAATGTATCTATACACATTTGCTCAAAATGCAAATCAAATACTTCTTTTTTTTCTTTAGGAACAATATTTTTTACCTTTTCAATGGCCATTTCAACATTTTTATTATCTAAAAATTTATTCATATTTTTTAGAGCTTCTATAATTGAAATCATATCTTCTAATGTTAAAAGTTGATGATTGATTTTATAGTTATCTATAATATAAAATCCTCCATTATTTCCAATTTGAGAAACTATAGGAATTCCAGCAAGATTAATTGCTTCAATATCTCTATAAATTGTTCTTACAGAAACCTCAAATTTTTCAGCTAATTCTGATGCAGATATTTTTTCTCTATTTAAAAGCATTACAACAATTGCCAATAATCTATTAATTTTCATGAATCTATAAACCCCCCATAATTTGAAATGACTATTTTATTATATCAAATTAATAACTTGTAAGATTGGTTAGAGAGAAATTGTTGAGGGAATTGCATAAGAAAGTTTTAAAAGAATAAATTCTAATATGGTAATTTTTGGGTTATCCATGGGTATGAACTTGACTTAACAAATGTACTATAGTAAACTTATATCGTAAAAAAGAATAAAGACAGTTCGTAACCATCCTGTCTATAAATAAAACTAGGACGTAGCTACCGCCTTAGGTAGTTTTTTTGTTGATGGGCATTTAATGCCCTTTTTTATTTGCAAAAAATTTACAAATAGGATTTTTGTTTTAGGTGAAATTTTTAATTTATATAAAGTTTAGAAATTGTTATTTAAGGACGCAGAGGTCTTATCCAATGAATTTTTTAACTTAAATATAACAGTAACAGTATAAGGCTGTTTTTTATAAAGATTGTCCAAATATAACTTAAAAACCTTACAAGGTAGGAAACTTTAAATAGTTGTAAAATATCCTAATAAATAATAATTTATCATAACCATTATAACTGTTTAATGTTTTCAAGTCTAAGTGAGTGTAATAGATTGAAAAATCTATAGCACAAGGAGGAATGAAAATGAAAAAAATAGGACTAACAACTACAGTGCCAGTGGAAGTTATTGTTGCAGCAGGATATACACCAGTAGATTTAAATAATATGTTTATAACTTCAGAGAATTATTTAAAATATATAGACATAGCTGAAAGAGACGGTTTCCCTAAAAGCTTATGTGCTTGGATAAAGGGAATTTATGGAGCATGTCTAGAAAATAATATTAAAGAAATAGTTGGAGTTATGGAGGGGGATTGTTCTAACACTAAAGCCCTCATCGAGGTTTTTAAACTAAGAGGAATAAAAATTTATCCATTTTCATTTCCACATAGCCATAGTTTAAAGGATGTAGAAATTGAAATAAGAAAGTTCATGGATATCTTCAATGTTAACGAGGATAAGGTAGAACAGGTTAGAAAAAGATTAAATAGAGTTAGGAAGCTAGCAAAAAAAATAGATGAAATGACTTATATAGATAATAAGGTTAATGGTTTTGAAAACCACCTATATCAGGTGAGCTTAAGTGACTTTAATGGAAACATAGATGAATTTGAAGAACACCTTAAAAAAGTCATTGAGGGTATGGAGAAAAGAGAGCCAATAAATAAAAAATTAAGATTAGGCTATATAGGAGTTCCTCCAATGACTGGAGATATATATGAGTTTAGTGAAAAATTAAATGCTCATTTTGTATATAACGAAGTTCAAAGAGAATTTGCTTTTCCTAGGGGGATAGAAGCTGCAAATATATTTGAACAGTATTATAATTACACCTATCCTTATGATAATGAGTTTAGAATTAAGGAATTGAAAAAGCAAATAGAAAAGAGAAAAATAGATGCTATAATTCACTACACTCAGGCTTTTTGCCATAGAGCTGTTGAAGATATAGTATTAAAAGAAGAATTAAATATTCCTATGTTAAATATTGAAGGTGATAAGTTAAATACATTAGATGCAAGAACTAAACTAAGATTAGAAGCCTTTCTGGATATGTTGCTGGACTTAAAGCAGAAGTAATAGGTGATCTAGTAAGAATTTTTATCTTAATATATTGTTGGATTTAAAGCAAAAGTAATAGACGGTATATAAAAGAAGTTCATGTTTTCTTTATATTTAGCGAAGGAGGGGAATTAATGAGATTGTTAGGAATAGACCTTGGAAGTAGAGAAGTTAAGATTGTTTTAATGGAAAACAATATTATAGTTCAAAAGAAAAAAGTAAGTACCATGAAATTTTATAGAGATTACTGTAGCTTTCATGGCAAGATTGTAGTAGATTTAGAAAAACTTAATATAGAAGGAATAGATAAAGCGATATCAACGGGTTATGGAAAAAATAATACGGATTTAGAATTTTTTACACCTATAAATGAGATAAAAGCCCATGTTTATGGTGGGATCTATCAAAGTAATTTAAAGGATTTTATACTTTTAGATGTAGGTGGTCAGGACGTTAAGGTGGTAAAGGTAGAAAAGGGTGTTGCAACAGATTTGGAGCTTAATGAAAAATGTGCTGCTTCCTGTGGAAGATACTTGGAGAATATGGCAAATGTACTTGAAATATCCCTAGATGAAATGAGCCAGTACTCGGAAAATCCCGTGGATTTAAATTCCACCTGTGCAGTATTTTCTGAATCAGAATTAATTGGAAAAATAGCCGAAGGGGTACACATAGAAAGGTTATGTGCTGGGGTTAATTACTCTTTGTATAAAAGGCTACAACCTCTTTTAAGTAAGTTTAGGGGGAAGAAATTAGTTATAACCGGTGGTGTTGCAAATAACCATTCAATAAAAAAATATTTAAATAATGATTATGAAGAAATAGTATCCGTAAAAGATCCTCAGTTTAATGGGGCTATTGGATGTTGTTATTACGGAAGCAAATTTTTAAAATAAACTTAGGAGGAAAAAACATGTATACTTTAAAAGTAGAACATAATTTTGATAGTGCTCATTTTCTTGCAGGTTATGAAGGTAAATGTGGAAATATTCATGGACACAGATGGAAGGTTGAAATTCAGGTTCAGGCAGAATCATTAGTACAAGGTGGTCAACTTGACGGGATGATAATAGACTTTGGAGACTTAAAAAAAGATGTTAAATCTATGGTAGATTATTATGATCATGCACTTATAATAGAGAAGGGAACTATGAGGGGGCAATCATTAAGCTCATTAAAGGAGGATGGATTTCGTATAATAGAAGTTAATTTTAGACCAACAGCGGAAAATTTTGCAGCTTTTTTCTATAAAATTATGAAGGATAGAGGATATAATGTAAAAAGTACTACAGTTTATGAAACACCTAATAATAGTGCTACCTATGAAGAAAGTGGGGTAATTTAAAATGGATTTTAAGGTGGTTGAAAGGTTTGTAAGCATAAATGGAGAAGGAAGGCGTTGTGGACAACTGGCTATATTCATAAGATTCGCGGGTTGTAATTTAAACTGTAGCTATTGTGATACACTTTGGGCAAATGAAAAGGATGTACCCTATGAAGTATTAAGTTCCAAAGATATATATGAATATATTAAGTCCAAAGAGGTTAAAAATGTAACTTTAACAGGAGGAGAACCTCTTCTACAAAAGGGAATAATGGAGTTATTAAAACTTTTGTCTAAGGATAAAGAGCTTTATGTGGAAATTGAGACAAATGGCAGCATATTATTAGATGAATTTTTGAATATAGAAAATTCACCAAGTTTTACTATGGATTATAAACTTCCTTTAAGTAATATGGAAAATAAAATGGCATTAGATAACTTTAAATATTTAACTAAGAAGGATACAGTAAAATTTGTATCAGGTAGTATAGAGGATTTAGAAAAAGCTAGAGAAATAATAAATAAGTATAACTTAGTAGATAAAACTAATGTATATATAAGTCCTGTTTTTGGAAAAATTAATTTAGATACTATTGTAGAATTTATGAAAAATAATAGAATGAATGGAGTTAATTTACAACTGCAGCTTCACAAGATTATATGGGAGCCTAGTAAGAGAGGAGTATAGCATATGGCAATTGATGTTAAAGCAATTGAAGAACACATAAGGGGAATTTTGATAGCTTTAGGAGACAACCCAGAAAGAGAAGGTCTAAAGAACACACCAAAACGTGTAGCTAAAATGTATGAAGAAGTATTCAAAGGTATGTGTTATAGCAATGATGAAATTGCAGAAATGTTTAATGTAACCTTTGAAGATGATTTATGTATAAATGATAATGAAAATGACATGGTTTTTATGAAGGAAATAGAAATATTTAGTCATTGTGAACATCATTTAGCACTTATGTACAATATGAAAGTAGCCATAGCATATATACCTAAGAAAAAAATTATTGGTTTAAGCAAAATAGCACGAATAGCAGATATGGTAGGACGTAGACTACAGCTTCAAGAGAGGATTGGAAGTGATATAGCAGAAATACTTCAGAAGATAACTGACTCAGAAGATGTAGCTGTTATTATAGAAGGAGAACATGGCTGTATGACTACTAGAGGAATAAAGAAGCCAGGTACTAAAACTATAACAACTACATTAAGGGGAAAGTTTAACACAGATCCTATTGTAAGCAATAAATTAATGATGCTTTATACGAAATAAAGAAATTTTTAGTTCTAGTTAGAGTTTTATTAAAATAAATATATTAAATTCGTACAAGATTAAAAAATCTTACACATGAGTAGAACAGTTTATATAAAGAGAGTGTATTAAAGAAGCATAACTATAACAAAGATTTTTGTAGATTGTAGGATGATAATAAAATAATAAAGGGATGTGTAGTAGATGAATAAGGAAAAAGCAATAGTAGTATTTAGTGGTGGACAAGATAGTACAACCTGTTTGTTTTGGGCAAAGAAAAAATATAAAGAAGTTATAGCAGTATCCTTTGATTATAATCAAAAACATAAATTAGAGTTAGACTGTGCAAAGGATATATGTAAAAAATATAATATTGAACATCATATTTTAGATTTAAATTTGTTAAATCAATTAGCACCAAATTCACTAACTAGGCAGGATATAACTGTTGATAAAAGCGCACCTAAAGAAGGGGTGCCTAATTCCTTTGTAGATGGAAGAAATTTATTGTTTTTAAGCTTTGTCGCAGTATTTGCAAAACAAAAAGGAATAAACACTATTATAACTGGTGTGTCACAGAGTGATTTTAGTGGATATCCAGATTGTAGAGATGTATTTATAAAATCTTTAAATGTTACATTAAATTTAGCTATGGATTATGAATTTGAAATAATTACACCACTAATGTGGATCAATAAAGCAGAAACGTGGAAAATGGCTTATGATTTAGGGGTTCTTGATATCGTTAAAGAAGAAACCTTAACATGCTACAATGGAATAAAAGCAGATGGATGTGGGGAATGTCCAGCTTGTAAATTAAGAAAAAAGGGATATTGGGAGTTTGAAAAAGAGTATTTAAAATAGTAATTTTATATGTGTTGCTTGAGCAATACCTCCTTTTTATATTTCGTATTTAGTTTTTGTAAATTTTGTCGATAATTTAATATTAGAAGTATGAAATATTAGGAGGATTATACTATGATAAATATTTTTAGTAAAAAAGATAGTGAAAAGGATAATAAAAATGATACTATTGAGCAGGAAGTTATTGTTGAAGAAAAACATGAAGTTGAAACTATAGATACTATGAAATTTCTAAAAGAAATGACTATACAGATAGAGGGTATAATACAGCAGCATAATAAAGTTAATGGTGAACATGAAGTGCTTGAAAAATTAGCAAAACAGATTGAAAATCATATGGTAACAGTATCAAATTTAACTGAAAGGACTAATGAATCAACAGATAAGCTTTTTAGTCAAGGAGAAAGTCTGTTAGAGATTACAAAAGATACTGTAAATAAATCCTTAGAAGGTAAAAAGTCAATTGAGGGTATGGTTAAAGTAATTGAAAATCTTGACATAGAAACAAAGGATACATACGAGAATATTAATGCTTTGGGCGAAAAACTAAAGGAGATTGGAGAAATTGCTCAATTAATAAGTGGAATAGCCTCAAAAACAAATCTTCTTGCTCTTAATGCTGCCATAGAAGCAGCCCGTGCAGGAGAACAAGGCAAAGGCTTTGCAGTAGTTGCTGATGAAGTTAGAAAATTGGCAGAAATGACCGGTGAAAGCAGTAGTAATATAACTAATTTAATTAGTGGCATAGACTCACAAACTGAAAATGTTTTAAATAGTGTTGAAAAGAGTACATTAGTAGTTACAGAAGGAGTAAAATCCTCTAAAGGAGCACTTGAAAAAATAGAAGAAGTTCTAGATTCATTTAACAGAGTTGAAGATGACACTGATAGCCTAATAAAAACAATTAATACTCAAAAAGAAGATATAAGTAAAATTTTTAACGGAATAAATGGAGTAGATAAAATTCTTACTGAAACCAATGAGCAAATTATAAAGCATATAGATGAGGCACACAAAGTAGATGAGAAATTAGAAAAAAGTGTATATCATATAGCTCAATATGTAAAATAA
Protein sequences of DBSCAN-SWA_4 >NZ_CP028842|1730069:1737135|1736178_1737135_+|WP_011986260.1|DBSCAN-SWA MINIFSKKDSEKDNKNDTIEQEVIVEEKHEVETIDTMKFLKEMTIQIEGIIQQHNKVNGEHEVLEKLAKQIENHMVTVSNLTERTNESTDKLFSQGESLLEITKDTVNKSLEGKKSIEGMVKVIENLDIETKDTYENINALGEKLKEIGEIAQLISGIASKTNLLALNAAIEAARAGEQGKGFAVVADEVRKLAEMTGESSSNITNLISGIDSQTENVLNSVEKSTLVVTEGVKSSKGALEKIEEVLDSFNRVEDDTDSLIKTINTQKEDISKIFNGINGVDKILTETNEQIIKHIDEAHKVDEKLEKSVYHIAQYVK >NZ_CP028842|1730069:1737135|1734630_1735221_+|WP_004451708.1|DBSCAN-SWA MAIDVKAIEEHIRGILIALGDNPEREGLKNTPKRVAKMYEEVFKGMCYSNDEIAEMFNVTFEDDLCINDNENDMVFMKEIEIFSHCEHHLALMYNMKVAIAYIPKKKIIGLSKIARIADMVGRRLQLQERIGSDIAEILQKITDSEDVAVIIEGEHGCMTTRGIKKPGTKTITTTLRGKFNTDPIVSNKLMMLYTK >NZ_CP028842|1730069:1737135|1730069_1731014_-|WP_011949098.1|DBSCAN-SWA MKINRLLAIVVMLLNREKISASELAEKFEVSVRTIYRDIEAINLAGIPIVSQIGNNGGFYIIDNYKINHQLLTLEDMISIIEALKNMNKFLDNKNVEMAIEKVKNIVPKEKKEVFDLHFEQMCIDTLPWGFKKCEEENLKYKIIYDAVDNKNCIAFDYRNSKGEYNWREIEPLTLVFKGFSWYLFSFCKLKNDYRLFKLSRMENLTVPHEKINENRISYKEYINISESEQVPTRVVLKFSERVRYRIDDCFDKDEIKFQEDGSVIVDTYLLEDDWIYSMILSYGECVEVLEPNHIREIIKDKCKKINDIYSNMT >NZ_CP028842|1730069:1737135|1733961_1734627_+|WP_011949101.1|DBSCAN-SWA MDFKVVERFVSINGEGRRCGQLAIFIRFAGCNLNCSYCDTLWANEKDVPYEVLSSKDIYEYIKSKEVKNVTLTGGEPLLQKGIMELLKLLSKDKELYVEIETNGSILLDEFLNIENSPSFTMDYKLPLSNMENKMALDNFKYLTKKDTVKFVSGSIEDLEKAREIINKYNLVDKTNVYISPVFGKINLDTIVEFMKNNRMNGVNLQLQLHKIIWEPSKRGV >NZ_CP028842|1730069:1737135|1735404_1736064_+|WP_011949102.1|DBSCAN-SWA MNKEKAIVVFSGGQDSTTCLFWAKKKYKEVIAVSFDYNQKHKLELDCAKDICKKYNIEHHILDLNLLNQLAPNSLTRQDITVDKSAPKEGVPNSFVDGRNLLFLSFVAVFAKQKGINTIITGVSQSDFSGYPDCRDVFIKSLNVTLNLAMDYEFEIITPLMWINKAETWKMAYDLGVLDIVKEETLTCYNGIKADGCGECPACKLRKKGYWEFEKEYLK >NZ_CP028842|1730069:1737135|1732749_1733511_+|WP_003358645.1|DBSCAN-SWA MRLLGIDLGSREVKIVLMENNIIVQKKKVSTMKFYRDYCSFHGKIVVDLEKLNIEGIDKAISTGYGKNNTDLEFFTPINEIKAHVYGGIYQSNLKDFILLDVGGQDVKVVKVEKGVATDLELNEKCAASCGRYLENMANVLEISLDEMSQYSENPVDLNSTCAVFSESELIGKIAEGVHIERLCAGVNYSLYKRLQPLLSKFRGKKLVITGGVANNHSIKKYLNNDYEEIVSVKDPQFNGAIGCCYYGSKFLK >NZ_CP028842|1730069:1737135|1731637_1732633_+|WP_011949099.1|DBSCAN-SWA MKKIGLTTTVPVEVIVAAGYTPVDLNNMFITSENYLKYIDIAERDGFPKSLCAWIKGIYGACLENNIKEIVGVMEGDCSNTKALIEVFKLRGIKIYPFSFPHSHSLKDVEIEIRKFMDIFNVNEDKVEQVRKRLNRVRKLAKKIDEMTYIDNKVNGFENHLYQVSLSDFNGNIDEFEEHLKKVIEGMEKREPINKKLRLGYIGVPPMTGDIYEFSEKLNAHFVYNEVQREFAFPRGIEAANIFEQYYNYTYPYDNEFRIKELKKQIEKRKIDAIIHYTQAFCHRAVEDIVLKEELNIPMLNIEGDKLNTLDARTKLRLEAFLDMLLDLKQK >NZ_CP028842|1730069:1737135|1733528_1733960_+|WP_011949100.1|DBSCAN-SWA MYTLKVEHNFDSAHFLAGYEGKCGNIHGHRWKVEIQVQAESLVQGGQLDGMIIDFGDLKKDVKSMVDYYDHALIIEKGTMRGQSLSSLKEDGFRIIEVNFRPTAENFAAFFYKIMKDRGYNVKSTTVYETPNNSATYEESGVI |
8 | uncultured_phage(33.33%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_5 |
3024872 : 3034356
Sequences of DBSCAN-SWA_5
Nucleotide sequences of DBSCAN-SWA_5 >NZ_CP028842|3024872:3034356|DBSCAN-SWA TCTAGTGTTTAAAATGTCTTATTCCTGTAAATACCATAGAAATCCCTTTTTCATTACATACCTTTATAGATTCTTCATCTCTTATAGAACCGCCTGGTTGAATTATAGCTTTTATTCCCCATTTTGCAGCTTCTTCTGCTACATCTCCAAATGGGAAAAAAGCATCTGAAGCTAAAACTACGCCATCTCCAGCTCTATCTAACGCTTCCTTTGCTGCCCATATTCTATTTACTTGGCCTCCCCCAATACCTTTTGCCATACCATCTTTAACTACTACAATAGCGTTGGATTTCACATATTTAACTACTTTCATACCAAATATAAGATCTTTCATTTCTTGCTCTGTTGGAGATTTTTCTGTAACTACTTTTGTATCTTCTAATAATTTATTATCACTCTTTTGTACTAATATTCCTCCATCTACCTTTGCCATATCTTTTCCTTCTGTAGATTTTTCTTCACATTTTATAACCCTTAAATTTTTCTTGTTTTTTAAGACTTCTAAAGCATCTTCATCAAAATCTGGTGCTACAACTATTTCTAAAAATATTTTTGCAAGATTTTCTGCTGTTTCCTTATCTACTTTTCTATTAAAAGCAACTATGCCACCAAATATAGATATAGGATCACATTCATAGGCCTTAGTATAAGCTTCCTGTACAGTATCCCCTATAGCCACACCACAAGGTGTATTATGTTTTAATGCACAACAAGCCACCTCTTCAAATTCACAAACGGTTTTCCACGCTATATCCATATCCTTTATATTATTGTAGGATAATTCTTTTCCATTTAACTTTTCAAAATTTTTCATAGGATATTTTCCAACAGTAGATGTGTAATAAGCTGCTGTTTGATGAGGATTTTCTCCATATCTTAAATCCATGTTCTTTTTATAGGATAGAGTTAAATATTCTGGATATTCCTCTTCTAATAAGAAATTACTTATAGCTGCATCATAGGCTGACATTAGATTGAAAACTTTTCCTGCTAATTTTTTTCTAGTTTGTATATTAACCTGATTATTTTCTTTTATCTCATTTATGACATTTTCATAATCCTTAGTATCTGTTAGTACTACTACATCTTTAAAATTTTTAGCTGCTGCTCTTATCATAGTAGGTCCACCAATGTCTATAAACTCTACTTTTTCATCAAAACTTAAATTTTCTTCTACTTTATTAAAGAAAGGATATAAATTCACTACTACCATATCTATAGGGTTTATGCCCTTTTCTTCTATTACCTTCATATGCTCTTCATTATCTCTTATAGCTAATATGCCTCCATGAATTAAAGGATTTAATGTTTTTACTCTTCCATCTAACATTTCTGGGAAACCTGTTACCTCTTCTATATCTATTACTTTTACTCCATTTTCTTTTAAATGTTTATAAGTTCCACCTGTAGATATTATTTCTACATCTCTACTTTCTAAAAACTTTGCCAAATCTAAAATTCCTGTTTTATCAAATACACTTATTAATGCTCTTTTTATCACTTAAACTCCCCCAGTTTCAATATTTTTTATTATCTTATTTATCTGTCATAAGTAACTGCCACCAATATACCTTCTTTCAAAGAAAACATATAAGTGGCACTATTTCAATTTACAAACTACAATTTTTTATATTTCAATAAATTTAATCTACTCTAAACACATTTTTCTATTAGTTTCATTTATATTAATAGTAATTTTTTCATTATTATAAATTTAGTATGTTTTAATAAAAACTTTTCTTCCTTGTAATTTTACTTTTTCTTCACTTATAAGTTTTATAGCTTCTGGTAATGCCTCATGTTCTTTTTCTAGAACTCTTTTTTGCAATATTTCTGCTGTATCTTCTGCAAAAACTGGTACAGATTTTTGTATTATTATAGGTCCACTGTCCGTACTCTCATCTACAAAATGAACAGTGCACCCAGATACTTTTACTCCGTATTCTAATGCTTTTTGGTGCACTTTTATACCATACATTCCATCTCCGCAAAAGCTTGGTATTAATGAAGGATGTATGTTTATTATCTTATTTTCAAATTTATTTACCAAATCCCCATTTAATATAGAAAGCCATCCTGCTAAAACTATTAAATCTACGTTTCCATATAAACACTCACATATTTTATTAGACAGATTGCTTTTATATATTTTTCTATCTAGAGTTAAAGTTTTAATTCCCTTTTTTTCTGCTCTTTCTATACCATAAATATTAGATCTATCCCCTATAACCATTTCTATCTTGCAATTTTTTATATATCCCTCTTCTATTTTATCTATTATAGATTGAAGATTGCTTCCTCCCCCTGAAACAAGTACTGCAATTTTAAACATCTTATTCTCCTTTAATTTAAAGAAAATTTTTCATATATACTCTATAAATAATTAATTCCCCAATCAATTATTTTAAAGATCTAACCTATGAACTAATTTTTATTATAAATTTATTTAATGCCTTTTTTTAAATTAGTTCAACAGACTTATCTCCTTTTTTAACATATCCTATTTTATAACCCTTTTCTCCCATTTCTATCAGGTCTTTTATTATATTTTCCCCATCTTTTTCATTTACACATAATACAAAACCAATCCCCATATTAAAAGTATTGTACATATGATCTTCTTCTATCCCTAAACTTATTAGATGGCTAAATATATTTGGTAATGGATAAGATTTTTTATTTATAACTGCTGTAAAATCCTCTTTAAACATTCTAGGAATATTTTCATAAAAACCTCCTCCAGTTACATGAGCCATACCTTTTATATTATATTTTTCTAAAAGTTTCATTACAGGTTTTACATATATTTTTGTAGGAGTTAAAAGAGTATTTCCTATTTTATTTCCTTCAAAATCTTTATGCAAATCTTCTACTAATTTTCTAATAAGAGAATATCCGTTGCTATGAGGTCCTGAAGATGCTATACCTATTAATATATCCCCATCTTCTATTTTACTTCCATCTATTATTTCATCTTTTTCTGCTATACCTACAGCAAAACCAGCTATATCATATTCCCCATCTCTATAAAAGCCTGGCATTTCTGCTGTTTCTCCACCTATTAGAGCACATTCACTTTGGATACAACCATTGCTAACCCCTTCTACAAGCTGAGCTGCAACTTCTGCTTCCAATTTCCCACAAGCTATATAATCTAAGAAAAATAACGGCTTAGCACCATGACATAATATATCATTTATGCACATAGCTACGCAGTCTATTCCCACTGTATTATATTTTTTCATTCTAAAGGCTATATCTAATTTAGTTCCAACTCCGTCAGTTCCTGATACTAATACGGGATTTTTATATTTAGGAAGTTCAAACATTCCTGCAAAACTTCCTAAATTATTTAATACTCCCTTTGTAAATGTCTTTGAAGCATGTTTTTTTATAAGATCTACTGATTTATAACCTTCCTCTATATTAACCCCAGCTTCTTTATAAGATACCATGAATAACATTCCCTTCTTTACATTATTAGTTATTCTCAAAATTTAAAAAACTTAAATTCCCTATTCCAAACTATCTTTAGGCATTTCTATAGGTGCAGATATAGGATATACGCCATTAAAACATCCCAAGCAAAAACCTTTATCTTTATTAAGTGTTTCTACTAAGCCTTCCATACTTATATAAGCTAGACTATCTGCTCCTATTTTTTCTCTTATTTCTTCTACTTCTGAGTGAGCACCTATTAAATCTTTTCTATAAGGAGTATCTATTCCAAAATAGCAAGGATATTTAACCACTGGAGATGATACTCTAAAATGAACTTCCTTAGCTCCAGCTTTTCTTAATATTTGTACTAATCTTTTACTAGTAGTTCCTCTTACTATGGAATCATCTATTATTACTACTCTTTTTCCTTCTACATTTATTTTAAGTGGATTTAGTTTTACAGATACAGCTTTTTCTCTTAATTCTTGAGAAGGTGCTATAAAAGTTCTTCCCACATATTTATTTTTTATAAATCCTATACCATAAGGTATTCCTGAAGCTTCAGCATATCCTACCGCAGCTGGTATACCTGAGTCTGGGACTCCTATAACTATATCTGCCTCTACTGGGTATTCTTCATAAAGTTTTCTTCCCGCTCTAATCCTTGATTCATAAACATTTATACCATCCATAGTACTATCTGGTCTTGCAAAATATATATATTCAAAAGCACAGGTATGACATCTTGTTTTTTCTGTAAACTTAATTGAATTTATTCCACTTTCGTCTATAATAACTATTTCTCCAGGCTCTATATCCCTTATAAACTCTCCACCTACGCAATCAAAAGCACAACTTTCCGAGCTTAATAAATAATCATCCCCAATTTTTCCTAGGCACATAGGCCTTATACCATGAGGATCACGTGCTCCTATTAACTTATCTTCTGTAAGTATAACGATAGCATAGGAACCTTTAATTGCTTGTATTGCATCTACTACTGCTTTATCTATACCTTTTTTAGCGCTTCTTGCTATTAAGTTTAATAATACCTCTGTGTCTATAGAAGTTTGAAAAATACATCCGCCATCTTCTAAAAGTTCTCTTATAACTGCTGCATTAACTAAATTACCATTATGAGCTATAGCAATAGAACCTAACTTATAAGTACCTACTATAGGTTGTGCATTATCTGATTTACTCGCTCCTGTAGTTGAATATCTAACATGTCCTATAGCAGAATTTCCTATTAATCCTTCTATAGTTTCTTTGCTAAAAACATCCGATACAAGACCCATACCCTTATGATATTTAAATTTTTCTCCATCAGATACTACTATTCCTGCACTTTCTTGTCCCCTATGTTGAAGAGCATATAATCCGTAATAAGTTATTTCTGCTGACTTTGATTCATTATCTTTAGAAAATACTCCAAATACCCCACATTCTTCTTTAAACTTATCTCCTTCTAAATCAAAGGGCATATTTTCATTTAAATCATCTAACATATAGCACATACTCATTTTTACTCCCCACTTATTTTCTATTTTAAAAATTTAATCTTCTCTTAGATTATTTCCAGCTGCTGTAAAAATAATTTTAAACTATAACAATCTATTTATTGACTCTTTTTAATATTTCCATATAAGCTTCTTTTACATTTCCCATGTCTCTTCTAAATCTATCTTTATCTAACTTTTCTCCTGTGCTTTTATCCCATAATCTACAAGTATCTGGGGATATTTCATCTGCTAAAAGGAGCTCACCATTAAATCTTCCTATTTCTATTTTAAAATCAACTAGATTTATTCCTTGCTCATCAAAGAATTCTTTTAATGTATTATTTACTTTTTCTGCTATAGAATACATTTCTTTTAGTTCTTCAAAGGTTGTAAGTCCTATAGCCACTGCATGATAGTCATTTATAAGAGGGTCATTTAAATCATCATTTTTATAACTTATTTCAAATACAGTAGTATCTAATTTTCTTCCTTCTGAAAGACCTAATCTTTTTGCCATACTTCCTGCTGCTATATTTCTAACTATAACTTCTAGTGGAACTATTTCTACTTTTTTGCAAAGCTGTTCTCTTTCATTTATCTTTTCTATAAAATGTGTTTTTACGCCCTTTTTTTCTAAAAGTTCAAATAACATTGCCGTTATAGAGTTATTCATAACTCCCTTATCTTCAATAGTTCCTTTCTTTTCCCCATTAAAAGCTGTGGCATCATCCTTATAATACACAACAACTGTATCCTTATCATCCGTTCTGAATATTTTTTTAGCCTTTCCTTCATATAACATATCCTTCTTTTCCATTATAACTCCACTCCCTCTTTGTTATCATTTATAAATTTTTCTTTCATATCTTTTCTATATTCTATAAGTTTTTCTTTTAACTTTTCATACTTTAAAGATAATATTTGTACCGCAAGCATTCCTGCGTTATAACTATTATTTATACCCACTGTAGCTACAGGTATAGATTTAGGCATTTGAACTATAGATAAAAGTGAATCCATTCCTCCAACTGCGGCTTCTATAGGCACTCCTATAACCGGAAGAACCGTATGAGAAGCTATAACCCCAGGTAAATGTGCTGCAAGACCTGCCCCAGCAATTATACATTCATAACCTTCCTTTTCTAAATCTTCAATTGTTTCCATCAACTTTTCTGGTACTCTGTGCGCTGAAAGTATGTAAGCTTTATATTCTATACTAAACTCTTTTAAAGCTTTAGCCGCTCCCTTCATTTTATCAGTATCAGATTTACTTCCAAAAATAATAGCTACTTTCATGTACTAGACCTCCTTATATTTAAATATATAAAAAATTCCGCTAAGATTTCTATGGAGAATCCTAAAGCGGAACTTAAGCGCACTGCAAAAGCATAGCTAAGATTCATCCATAGACAGGGAATTTATGGTTCCCTCGTAGAGACTCTCAAACCTTATTATTGAGATTATATGGATGATATATTCATTTGTTTTATGTACTCATGGTAACATATAATTCTTAATAAATCAACATACTTTTATAAAAACATTCGTATTTTATTGGTATTTTATTTATTTTTTTATAATATTATTCGTAATGTAACGAACAATTAGTTAGGTGAAAAATTCACTGAAATATATATTATATTGTAATAGAAATAATTTATAATAGAAATTTATTTCTGAAAATAAAATAGATTTAATTTTCAGATATCAAGCAAAATAATATATGGTAATAAACATATGAATAAGCTTTAACATTTTCTAATCTTTTTAAATCGAGAGCTTTTGTTATTAATCAAAGAATGAAGGTAAAAAACCGATGGCCAAGCCACACATAGCTTTTCCACCGGGTAAAAAATTTTTAATGAAAAAATTTGAGATTCCTAGTCAAGTAAGTTATCTATCTATACATGTATTTTTTATATTTGCATGGTTAAAATTAAATCTATTTTAAAATATTACTATCTAAGATAATTATTTTTTTCTTCTATAAGCAGTATCCTCAAGTGGAAGCTTTTTTCTAAAGTTTCCATCAAATTTATAGTAAGCACCTTGAGCTGCTGGGGCTGTTGGTATGGTTGTAATTTCTCCTATTCCTTTTGCACCATAAGCTAAATCATTAGTATTCTTTTCAATTATTGTTGTTTCAATTTCTGGTATATCAGTAGCTCTAAACAAACCTAATGTGCCAAACTTAGCAGTTGGGATAGATTTATTTAATGGATAATCTTCTGTAAATGCATACCCAAGTCCCATAACTATTCCACCTTCAATTTGTCCTTCTACATTAGTTAAATTTATAGCTTTTCCCACATCATGTGCTGCAACTACTCTTTCTACTTTTCCATCATCATCAAGAATAACAACTTGTGTTGCATAGCCATAAGCCACGTGACTTACTGGATTCTTTTTATCAGAATTAATAGGATCTGTAATACTTTGATATTCCCCATAAAATTCTTCACCTTCACACTCTTCTAATGATGTAGTTAATAATTTTTCCTTAAGCTTTAATGATGCCATTCTTGTGGCTTCTCCAGTAAATACTGTTTGTCTTGATGCTGTAGTTGTCCCTGAATCTGGTGCAAATTTTGTATCTGGTAAATCTAAAATTATCTGTTCTGGTAATAAACCTATTGTTTCACATATTATTTGTGTAAGAATTGTTCCAAGACCTTGACCTATGCAAGCTGCACTAGTTCTTATATGAACCTTTCCATCTATTACTATTAAGTTACATCTTCCAATATCCGGTATTCCAACACCAACTCCTGAATTTTTCATACAACAGGCTATTCCTGCACATTTACTCTTTTTATATACATCTTTCACAGCTAATATAGTTTCTTTAATTGCAGTTCCTTTATCAGCAATTTGTCCATTAGGTAGTGCATCTCCAGGTTCTACTGCGTTTTTAAATCTTATTTCCCAAGGAGATATACCAACTTTTTCAGCTAAAAGATTTAAGTTGCACTCTGATCCAAAAACTGATTGTGTTACTCCAAATCCCCTAAAAGCTCCTCCTGGGGGATTGTTAGTATATACAGCGGTACCTTTTATTTTCACATTAGGACATTTATATGGGCCAGCTGCATGAGTACAAGCTCTTTGGAGTACAGGTCCTCCTAATGATGCATAGGCACCAGTATCTGATATAATATCTGCTTTAAAAGCAGTTAAATTTCCTTTTTCATCACATGCAGTAGTAATTGTCATTTCCATAGCATGTCTTTTAGGATGAATCTTTATACTTTCCTTACGACTTAAAGTTATTTTAACGGGCTTTTTAATAGTCCATGCAAGAAGAGCGGCATGATGTTGTACACTCATATCTTCTTTTCCACCAAAGCCTCCACCCACATATTTGCTAATAGTCCTTACTTTTTCTTTAGGAAGCCCTAAAAGCTCAGAAATCTCTCTCTGCTCATCATATATACCTTGGCTTCCTGTATAAATAATAACTCCATCCCCATCTGGCATAGCTAAAGCACTTTCAGGCTCTAAAAAAGCATGTTCAGTAAAGGGAGTAGAATAATGATTAGTAACCACATACTTAGAATTGGCTATTGCCTCATCTACATCTCCTCTATTAACTTTTTCCACTGTTAAAATATTTCCCTTAGGATGAATTTTAGGAGCATCTTCAGCTATTGCAATATTAGGATTAGAAATAGGTTCTAATTCTTCATATTCTACCTTTATTAAATTAAGTATTTCTTTTAAAGCCTTCTTGCTTTTTGCTGCCACTAAAGCCACTGCATCACCAACATACCTTGTTCCTTCTCCTACGGCTATCATTGCTGGCCAATCCTTTACAATATGTCCTATAAGCCTATTTCCTGGGACATCTTCTGCTGTAAGAATAGCTTCAACTTCTGGATGTTTTAAAGCTACACTTATATCAATGCTTTTTACTAAAGCTCTAGGATATTTTGATCTTAAAGCAGAACCATAAACCATTCCTTCTATCTTCATGTCATCTACATATTTTCCTATACCTAAAATTTTATCTTTTGCATCTATTCTTGGAATATTTTCACCTATTTTCCCTTTATATTCTTTCGCAAATGGAAGTTTACCATTTCTAAATGCCCCTGCTGCCATTTCAATGGCTTTTATTATTTTCACATATCCAGTACATCTACATACATTTCCTCTAATAGCAGTTTTAATTTCTTTCTTATTTGGATTTAGATTTTTATCTAAAAGTGCCTTTGCACTTATTATCATCCCTGGAATACAATATCCACACTGTACTGCTCCAGCTTTAGAAAAAGCCCAAGTAAAAACATCCTTTTCAAATTCTGTTAACCCCTCTACAGTCTTAACATCTTTTCCATTCACCTTTGCAGTTGTACATATACAGGCTCTAAGCGCCTTACCATTAACAAGTATCATACAGGCTCCACAGGCTCCTTCTGCACACCCATTTTTTACTGAAGTTAAATCCTCATTATCCCTCAAATATTCAAGTAAATTAATATCCTCTGAAACAGATACATTTCTTTCATTTAATATAAATTCATACACATTTATTACCCCCAT
Protein sequences of DBSCAN-SWA_5 >NZ_CP028842|3024872:3034356|3031785_3034356_-|WP_012047944.1|DBSCAN-SWA MGVINVYEFILNERNVSVSEDINLLEYLRDNEDLTSVKNGCAEGACGACMILVNGKALRACICTTAKVNGKDVKTVEGLTEFEKDVFTWAFSKAGAVQCGYCIPGMIISAKALLDKNLNPNKKEIKTAIRGNVCRCTGYVKIIKAIEMAAGAFRNGKLPFAKEYKGKIGENIPRIDAKDKILGIGKYVDDMKIEGMVYGSALRSKYPRALVKSIDISVALKHPEVEAILTAEDVPGNRLIGHIVKDWPAMIAVGEGTRYVGDAVALVAAKSKKALKEILNLIKVEYEELEPISNPNIAIAEDAPKIHPKGNILTVEKVNRGDVDEAIANSKYVVTNHYSTPFTEHAFLEPESALAMPDGDGVIIYTGSQGIYDEQREISELLGLPKEKVRTISKYVGGGFGGKEDMSVQHHAALLAWTIKKPVKITLSRKESIKIHPKRHAMEMTITTACDEKGNLTAFKADIISDTGAYASLGGPVLQRACTHAAGPYKCPNVKIKGTAVYTNNPPGGAFRGFGVTQSVFGSECNLNLLAEKVGISPWEIRFKNAVEPGDALPNGQIADKGTAIKETILAVKDVYKKSKCAGIACCMKNSGVGVGIPDIGRCNLIVIDGKVHIRTSAACIGQGLGTILTQIICETIGLLPEQIILDLPDTKFAPDSGTTTASRQTVFTGEATRMASLKLKEKLLTTSLEECEGEEFYGEYQSITDPINSDKKNPVSHVAYGYATQVVILDDDGKVERVVAAHDVGKAINLTNVEGQIEGGIVMGLGYAFTEDYPLNKSIPTAKFGTLGLFRATDIPEIETTIIEKNTNDLAYGAKGIGEITTIPTAPAAQGAYYKFDGNFRKKLPLEDTAYRRKK >NZ_CP028842|3024872:3034356|3031630_3031765_+|WP_003357858.1|DBSCAN-SWA MAKPHIAFPPGKKFLMKKFEIPSQVSYLSIHVFFIFAWLKLNLF >NZ_CP028842|3024872:3034356|3028386_3029835_-|WP_012047942.1|DBSCAN-SWA MSMCYMLDDLNENMPFDLEGDKFKEECGVFGVFSKDNESKSAEITYYGLYALQHRGQESAGIVVSDGEKFKYHKGMGLVSDVFSKETIEGLIGNSAIGHVRYSTTGASKSDNAQPIVGTYKLGSIAIAHNGNLVNAAVIRELLEDGGCIFQTSIDTEVLLNLIARSAKKGIDKAVVDAIQAIKGSYAIVILTEDKLIGARDPHGIRPMCLGKIGDDYLLSSESCAFDCVGGEFIRDIEPGEIVIIDESGINSIKFTEKTRCHTCAFEYIYFARPDSTMDGINVYESRIRAGRKLYEEYPVEADIVIGVPDSGIPAAVGYAEASGIPYGIGFIKNKYVGRTFIAPSQELREKAVSVKLNPLKINVEGKRVVIIDDSIVRGTTSKRLVQILRKAGAKEVHFRVSSPVVKYPCYFGIDTPYRKDLIGAHSEVEEIREKIGADSLAYISMEGLVETLNKDKGFCLGCFNGVYPISAPIEMPKDSLE >NZ_CP028842|3024872:3034356|3027330_3028326_-|WP_012099415.1|DBSCAN-SWA MVSYKEAGVNIEEGYKSVDLIKKHASKTFTKGVLNNLGSFAGMFELPKYKNPVLVSGTDGVGTKLDIAFRMKKYNTVGIDCVAMCINDILCHGAKPLFFLDYIACGKLEAEVAAQLVEGVSNGCIQSECALIGGETAEMPGFYRDGEYDIAGFAVGIAEKDEIIDGSKIEDGDILIGIASSGPHSNGYSLIRKLVEDLHKDFEGNKIGNTLLTPTKIYVKPVMKLLEKYNIKGMAHVTGGGFYENIPRMFKEDFTAVINKKSYPLPNIFSHLISLGIEEDHMYNTFNMGIGFVLCVNEKDGENIIKDLIEMGEKGYKIGYVKKGDKSVELI >NZ_CP028842|3024872:3034356|3030630_3031110_-|WP_003357851.1|DBSCAN-SWA MKVAIIFGSKSDTDKMKGAAKALKEFSIEYKAYILSAHRVPEKLMETIEDLEKEGYECIIAGAGLAAHLPGVIASHTVLPVIGVPIEAAVGGMDSLLSIVQMPKSIPVATVGINNSYNAGMLAVQILSLKYEKLKEKLIEYRKDMKEKFINDNKEGVEL >NZ_CP028842|3024872:3034356|3026585_3027203_-|WP_012047940.1|DBSCAN-SWA MFKIAVLVSGGGSNLQSIIDKIEEGYIKNCKIEMVIGDRSNIYGIERAEKKGIKTLTLDRKIYKSNLSNKICECLYGNVDLIVLAGWLSILNGDLVNKFENKIINIHPSLIPSFCGDGMYGIKVHQKALEYGVKVSGCTVHFVDESTDSGPIIIQKSVPVFAEDTAEILQKRVLEKEHEALPEAIKLISEEKVKLQGRKVFIKTY >NZ_CP028842|3024872:3034356|3029926_3030631_-|WP_012047943.1|DBSCAN-SWA MEKKDMLYEGKAKKIFRTDDKDTVVVYYKDDATAFNGEKKGTIEDKGVMNNSITAMLFELLEKKGVKTHFIEKINEREQLCKKVEIVPLEVIVRNIAAGSMAKRLGLSEGRKLDTTVFEISYKNDDLNDPLINDYHAVAIGLTTFEELKEMYSIAEKVNNTLKEFFDEQGINLVDFKIEIGRFNGELLLADEISPDTCRLWDKSTGEKLDKDRFRRDMGNVKEAYMEILKRVNK >NZ_CP028842|3024872:3034356|3024872_3026372_-|WP_003385254.1|DBSCAN-SWA MIKRALISVFDKTGILDLAKFLESRDVEIISTGGTYKHLKENGVKVIDIEEVTGFPEMLDGRVKTLNPLIHGGILAIRDNEEHMKVIEEKGINPIDMVVVNLYPFFNKVEENLSFDEKVEFIDIGGPTMIRAAAKNFKDVVVLTDTKDYENVINEIKENNQVNIQTRKKLAGKVFNLMSAYDAAISNFLLEEEYPEYLTLSYKKNMDLRYGENPHQTAAYYTSTVGKYPMKNFEKLNGKELSYNNIKDMDIAWKTVCEFEEVACCALKHNTPCGVAIGDTVQEAYTKAYECDPISIFGGIVAFNRKVDKETAENLAKIFLEIVVAPDFDEDALEVLKNKKNLRVIKCEEKSTEGKDMAKVDGGILVQKSDNKLLEDTKVVTEKSPTEQEMKDLIFGMKVVKYVKSNAIVVVKDGMAKGIGGGQVNRIWAAKEALDRAGDGVVLASDAFFPFGDVAEEAAKWGIKAIIQPGGSIRDEESIKVCNEKGISMVFTGIRHFKH |
8 | Synechococcus_phage(42.86%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_6 |
3182792 : 3204692
Sequences of DBSCAN-SWA_6
Nucleotide sequences of DBSCAN-SWA_6 >NZ_CP028842|3182792:3204692|DBSCAN-SWA GCTAATAATTAATTTTAATATTTCCACTAAATTTACATTCTACTTGCAATAATGTGTTACTAGCATAAATTACTTCATATAAGTCTTCTTTAACCTGTTTCCATCTTCCAACACCATCATATTGCAAATCTAGTTTATCTATCTCTTCAATATCTGTTATGCTGTCCATGCTAAACAAATAAGCAAATCTTATCTTTTTAGTAGTAATTAATTCATTCCAGAATACATCATTAATAGCATTAAAAGTAGCAATATTCATCCCACTTTTCCTTACGTCATCTACAGTTAAATTAACATTTACCCATTTTTCTCCACTAAATGTTTTCCATGTGTTACCGCTATCCACACTACAAACTATTCTTATATTGTTACCATTAGCAGTTAATCTAAAATAATCTATATGATCTACATTACTTAAATTCATATCACCTTTTGGAATAAGTAAACGATCAAATGGGATAGCCTTTGTCTTTAATTTTTGAATAACTCCATCTTCAAATGTTTCAAAACCTTCTATTTTTTTAAATAGCGTTTTATCCACATTAACACTATATTCTGTAAAGCTTTCTGTATCTTGAACAACTTCAAAATCACTTATATGATTTGTTTCTAAATGTGCTTTACCATCAAAGGTCATCATTCTATCGTCAATAAAATCATTACTCTCATCATTAGTAAATTCGTTTTTAACTGATATTAAATCCTGTGTATTTTCTGTATCATACCTCAAAACATTCACACGAGGCACTTTAAAATCTACTGTGTTAACAGGGATGTTAACGATTCTAGGCGTTTCAGCACTTCCCACTATACCCATTTTGGATATTTGTTTCATCCCTGCGCCAACTATTTCTCCTGCATCTATACCATCAATAGTTGTAAACTTTCCTGTTTCCTCTGAATAAGCTACTAATTGTTTATTTTTCTTATTAGTAACATCTACATCCTCAAGCTCCTCAAATTTTGTAATTCTTTTATCTATTATTTCCTTTTGTATTTTCTCACTTGACCATCCAGTTTTATTAGAAATTACACTATCATCTAAAATTATATCCTTGTCCAAAGTTACATTAAAAAATTCACTCATTAAGCCACCTCCTATTCACTAATAACTAAGTGAAAGTCTCTAACTGCAAAATTATGATTTTCTGCATTTTTAGTTATTTTTACATATATACCTTTACTTTCACGCTGTTTTATACTATCTATAGTTAAAGAGTCTGCATAATTTATACCATCGAAGGATAATTGTATTAAATCATTACTAGGTGTTTCAGTTCCTATTTTAATATTGTTATAATCCTTATCTCCTATATTTTTAATTGTTATTAGCTCTTCTAAATCTTGGAGCATAGCAGGACTAACATTAGTTACTACATTTCCATGATATATAATTTCAAAATTATATGGACTAAATACCCACATATCACCATATTGTAACTGAAGAGCATCACTAGTATATATCACTTTTCCATCCCTATCTTTAAATGTAAAATATCCACTTATTTTGCTATCTATAAATACTTTACATTCCATATCTGAATTAAATAATCTAGTTTTAATTAAATTATTATCTAAATCATATAATTCACATAAAGTATTTTCTGGGAAATTCTGAATAGTTACATAGGGATTAGCGTAAACCTTGTAATTATTTAATATAAAATCTTCATCACTATACTTCATAAAACCTTGCTTTGTAAGTGGCTCTGCAAATTCCATTCCGCCCATGTTTGTATAATTTTTGCCATCATTACTTGAATAAGCTTGTATATAATTATCTTTCTTAAGTATTTTCCAATATCTATTTTGTTCATTTGATTTTAAATCCTTAATACCAAAAATATGATCGCTATTCCCTAAATAAAGCATGGAATAATCCATATCTTTTATATCATTGAAATTTTCTTTTTCAACCTCAATAACAAATTCTTTATAATTAAATTTTCTTTCTATTTTATTATTACTTATTAGTTTTAATTTACCTGTTTTAATATCTCTAGTTATATTGCTTTCTCCCGCAAAATCAGCAAAAGAAGAAGCCAAGAAAAAATTCTCAGCTTCTAATAATCCATTTTTAACTTGTATAAGTTTCATTGAGATCACCTCTAAACTCTAGGCTGCATTATATAATCATATGGTACAAACTCAACTATTTGTATATCTTTAGTTCCTATACCATTTGCTAATAATGTATGTGCTTCCTCTAGTGCATCTTCATAACAATTAGTAGCGTAAGATGTTATTTCACTTCCATTTTTATCTGTTTCATGGCCGTATGGTAATTGGGCTAAGGTTTTATTTTTTAATATTCCCCACATCTTTTGTCTAGTTTTTTTAAAATCTATTGTACTTGTTAACATACTATCTACCTCCCAAATATATTTTTCTTTTCAAAGTTCTGTGTTTCTATCATGTAATTTCTCTTACCTTTTAGTTTATCTAAATCTTTCATAATATCACCATTAGTTGCTACTTTATTAAATTTCCTTTCAATATCCATAGCTTTCGGATTATGCCAAATTGGTACTAAATTAAAATGATGTTGTTTTAGATAATCTATTAAATTAGCTATAAGTAATCCTATAGCTTGTAATCCATTTTCAGTATTAAGGAAGTATACCTTTTCAGCCTCCCACCTGATCCATCTATATGCTCTAATATAATCTGCATTTGGACTTGATGTATCTAACGTATACCAATCATAAATTAATTCCATTATAAATTGGATAGATTCTTTACCTGTGCAATTTAACCAAGCTTGCGTATTTTTATGCCATATCATTATTAAGATATTTATTAAATCTAACATTATTTCAATACTAATTGTCATAGGTGGAATGTTATAATCCACTCCCCAATCTTTCCCCCATTCAATAGGATGATTATTAAATCTTAGATATTCATAATCTAAATTATTTAATAGATCATTATTATATATATAATCTTTATTAGGAACAATTAGCCTATCCGTTGGATTTGTAGGTTTTAACCACCACCATCTTTTGGTCATTTCAATAAACTTATTTTTATTAGGTGTATATATTTGTCTTATAGCTCCATTATTTAAATATTTATTACTTTGTCTATAAATTTGCCATATACTTAAATTTAATAAATCTCTTTCTATCTGCTTATAGATATTAATTATAGGGCTATTATCTAAATATTTTTCGTTATGTTTAAATATATTAGTTGTATATTCCCTATCTAAATATCTATTATTATATTTAAATATAGATCTTATAGCTTGCCTATATAAATACCCATTGATACTTTTATCTATAAATTTAAATACATCTTTATAAAAATATTTTTTATTATGGTCTTTGCATATTTCTTTATGTGCTATTTTATTTAATGCATTTTTAATTCTATATTTTTCTATATCCTTTAGAGCTATATTATACATTAACATAGTTTTATAATTTCTATCTATATCTTTTAAATCTAATATTTTTAAATTATTTATACTTGTATCTATATCTATTCCAATTATAATATCTTTGTTTAACATTGTTTTATTACTTATTTTAGCCACTTCTTTTAAATTGGATCTATCTATAAATCTATATTTATTTTTATTTATATTTTTAAATCCATGTTTCTCAGCAAACTTCAATTTATCTATATCTATTTCCTTGCAATAGATTCTATAAAGATAATATCCAATATTCTTTTCTATATTTATATACTTCTCTAGTTTTAAATTTTGTAAAGATTCACCTTTAAATATTTCTTTTTCTACTATTAGATCTGTATATATACTTTTGAATTTATTCAGTTGTAGATTTTCTCTATCTATAGATAAATTTATTAAATTATTAGCTTTATTTAGTTGTAGAATTTCTCTTACCAATAACTTATTGTTATAACATATAGATATATCTGTATTTTTTCTTACATCAAGTTCCTTACTTGTTATTCTATTTATACTTATATATTTTATTTTATCTAAAGATATAGTATTGTTTTTATTTACTTCTTTATTTCTTAATTCTAACTCTTTTTCAAATTCTTTTTTTATATCAGTAATTTTCTTGGATATATATTTATTCTTTTCTTTCTCTATATTATCTTTAGGTTCTTTATAAAATAATTTATCTCCTTTAATTTTATCTATTTCACCCATTGTTTCTTTGTAAAATAATTTTTCTGTAGTCTTTACTACTTTTTCTGTAGTATCGTATATAAAAGTTCCACTAGAAAAAGCATTGTCCCCTACATATTCAAAACTACATAGGGGTATTTTATGTAGGGGCATTTATACCACCTCTCTTATTTAGTTGTTTTATAACATCTAATAGCAACACAATAATTTATATTAGCACTATTGTTTAAGAAACAATATGGCGCAGTAATTTTAAATTTCTTATAATATTCTTCCTCTTCTGTATCTTTCTTATATGCTAATCTATCTGTATCGTTTATTGCACTGGCATCACCTACAAGTACATTAATCATTTTACCTCTTTCCATATCAACTGGATGTACAAGTGTTATATCTGAGAATTGATGTTTTTTATGATTATATCTACTACCTTCTACATTACATTTATCCATAAAAGGATTAGTAGCATAAAAAGCTGGATAATGTGGTTGATATGGCATACCTATTTTATTAGCTATCATACAAACATCTGTTACTCCTGTTGCAGTTCTTTCTCCATAAACCTTTGAATAATTTGGTTCTATATCAGAAGATACAGTTATACCAAAATTATATTTATCATCTGTATAAGCTGAATCCTCTACTGGTTTTAAAGCTCCAATATAAGCATAAGATGTAAGATAGTTTTCATAAGGATGAACATCCGCAGATGGATCTCCACATAATACTAAGTTTATACTATCTTTAGTTACATTTATCCAATATTGAACGGGTAAAAAGTCTTTTATTTCTGGTTGTAATTTTCTATACCATGCTAATCTATAATTATATTCAGCTTGTATATTTTTAGATATACCTAGATCTGTTTTATCTGCGTTTAATTTATCTGATATTTGCAATTTTATATTGTTTATAGAATTGCTTTTAGTCATAGCACTGACATAAACATCATAATCACCACTTTTACTCCATCTATCAGAAACTCCAGCCATCATTTCTAATACTTGTGCATCTGTTCTACTAAAACTATCCCCATTGCCGTTATAATAAGTATGCAACTTATTAAAGTCAATTAATGCCTTTTTTTCTTCTTTTGTTAAGTCCGCTTCTTCTCTATCTATTTTTACATAAAACTCTTTTCCATAGGTTGTTGTTGCTTTTATAATACACTTATCATTTTGAGAACCTACTGTAAATACAGTATCTACTTTATCTGTCTTAGAGTTATCTTTTATAAGATTTATTGTACTTCCTTCTCCTGCTGACCCTATTTTATTTATGCTATCTGGATAAACTAAATCCCATTTATATATACCTGAATTTTGTGTTATTTCAGCTGCTAATGTTTTTACTAAGTTTTTTACACTTGTATTTCCTTCAACAAAATAAAAATTATCTGTAGCCATTTTATCTACCTCCTGTTATCAATTATTTATTTAAATTTGTTATTTTTAAAGTATTTAAGTCCATTATAAATATATCTTTTAAATCTCTATTTGTATCTAAATTCACATTAAATTTTTTAAGTAGTTTATTACCATAAGGTCTATATTGATATATTTCCAAAGTTACAGGTTCTTTTAGTTCTACTCCATTAAAATTCTTTATACTTATAAGAAGCTTTTTATTTTTGTACCCTTTAACACTTATTATTTCAGGATTTTTGTTTGTTTTATGACTTGTATAATCAAAATTAAGATAAAATCCATCATAGGATTTATTCCCATACCAAACTTTTTTATCATCTATCTTGCCATGTAAATCTATATCTGCATCTGTATTTTCTTCCCAATTCATTACTACTGCTATATCCCATTCATTATCTATATCCTCTATGCCTGGTGGTGGCTCTACTGTAATACTAGAATCTTCTCCATCTATATACTCTAAATCCACAATTATCTGTCTACTATTGCCGCTTAAATTATGAAAAACAAAAGAAATAGGCGTATTAGCATTTACTTTATAGAATGTATTAAAGTATTTATGCTCTCCTATTTCCTTAGTTGTTACATTATCTATTATTTTAATTTTATTAATTTCTAAGCTATATTTATCTTCCTTTTTCCAGCCTGTTTGATTAAAATGCAATCCTGTAATATATACATCTTTATCAAATTTAAATTGTTCTTTGTAATCATTTTGTATTGCTGGGATATCTAATAATATACCTTTCACCTTTTGAATGCCTTCAATTTTTCTGTATATAAAGGCATCAATTTTTTTCTTTAATCCTTCATATTGTACACTTGGCAATAAATTCTTTAATTGTTGTAGTAAATCTTGTATATTGTTGGTATTTATCTCTGGATAATTAGTTCTTATATTATCATCTATCAGACTTAATAAATGATTTTTTAAATCCTCTGTAAGCTCTTCAAAATTAATTATATACTTAGGTAGGCTCAAATTAAGCACCTTCTTTATATTCAAAGATTGAACTTGTATCATTTCTTGGATAAACTTGAGCTGTTTGTGTTATCTTTAAATAAGGATTTTTAATATTAAATTCATCATAAAAATGTAATACACTTTGATATAATTCTTCCAAAGTTACAATTCTATTTTTATCTTTATCAGATTTTTTAGTTTTAATGCTTTGTGTTAATGCCCATGTAAAAGCTCCTGAAGGATTAGGATTTCCATTATATCCAGCGCTCAAGTCACCGGATGTTTCTGACCCTGCACTAGCTGTTAAAACCTTATATCCTTGTTTATTTAATGTTTTGTCTATACTTCTAAGTTTCTCCTCCACTACAGCTAATGTATATGCAAAATTTTTATCTATAGCAAGTCCACTGTGGCAAGTATCAATAAATATTACCTTAGTGCCTTTTATATCATCCAGTATTGTTTGTAATTCATATACTGTTATTATGTTATCTTTTGCTACTAAAGCAAACTTATCTTCATATACAGTACCATGTCCAGACCAAAACAAATAACTAATATCATTATCTTGTGCATCTTGAAAAGTGTTTTTTATTAAATTTAATGCTTCTGATTTAGTTTTATTTTTTGCAACTATATTTTTTGTAAATTTAGCACTTTCTTTATGCTCTTTAAATAAATTAGATATATTGTCAGCATCATATGTGCAACCCATAAGGTTATTAGCGCCTTGTAAAGTATATTCACTTTCTCCTATAGCTAAAAATCTATAGTTTTTTTCACTAGTGGTAGGTATAGTAGGTGTAGGTAAATTACTATTTTCTAATATATTAAAATCTACCCATAAAACTTTACTAGTTCCACTAATATTATTGTAAATAAATTTGACTGTACCATTTATAGGATAAAATACATTTAAAAATTTATGTTCACCATATTCTTTAGTGCGTACACTTTCAAATAATTTATCATTACCTACTTGTAAATCCCAGCTATCTTCAAATCTCCAACTAGATTGAGAATATGTTATACCTGTTATTTGTCCATTTCCCTTAAATTCTATTATATGCTGTCCTTTTACTGCAGGAATCTCTAGCATTTTCCCATAAATTTTCTGTGTGCCTGATATACCTAAATTTCCACTTAAATTATCTAACTTTACACCTAAAGCATTTAACGCATTTATTAAATCATTATAATCTACACCTTGTATTTTATCTTTAATTTCTGATAATAAATTTTCCATATCTTTGGTAGAAAAATTTATATTGCCTATGTCAACTTTCACACCATTTTGTAAATAATCTTTAATAAGATCTGATAGTTCATCAAAGTTGACTACATAGGAAGGTAATCCCATATTATTGCCACCTCCTATACATAATCTATTGTTTCTAATTTACCATGATTATCTTTAATTAATTGTATTGTTTTATTTGTATTATTAGGGTACGTTGTTTTAATTCTATATACCTTACCTTCTGCATTTCTAATTAGTTCTTCTTGCCATTGCATATCTGTTCCACTAGCATATATAAATTTATATGCCTTATTATTACTATCTCTAATTATTCTACATGGATATTCGGGTAATTCCCCAGCATATTTTGAATCTTCATTTGTATTTATTTGATTTTTGAAATTTCTTTTTCTTAATTCTTGATTTAAAATATATACTACTGGCTCCCTAAAATTTTTATATCCCATATGTGCCATTTTAATCACCTACTATTGTTTCAATCTTCCACTGCCTATTTGGATACATTGGTCATACACTTTTGTTTTATCTCGCATACCTTGTAATTGCAATGTATCTACATATGTGTCAGCATTTATTTCTGTACTTATTCCTACAATTAAATACCAGCCATTACCTCTTTGATTATTTACTAATTTAACTACTTGTCCTAAATCAATATTAGGTATTCCAGTTACTGGTACTACATTTAAAGCAGTACTCTCCCTCCACATATCTAAAAATTTATATCCTGCTACCTTTTGTTTTAATAATGGAGTACTAGCTAATGGATTATCAATTATATCTACCCATCTTTCACCATTTAAATAACTAGTCATAGCTTTGGATTCAAAAATAGAATATTTATCATTACAACAAATCTTTAATATATTTCTCATTAAACTAGAATCTCTACTGGCAGTTTCACTAGATAAATTAGTATCAACAGATAAAACATAATCATGGTGATTTGCTTCATGATTTGATTCATTATAAGCAGGATATTGCTCTTCTAATATTATTGTACCGTTTTTGTTTGCCCTTATTCTGGCATACATAGTTTCTACCAAATTACTAATTATATCATTATACATAGTACCTATTTCACATTCTAATTTAGGCACAGTATAATTATTTCCTCCACCTCTTTGAAAACTACATTTTGCATCGGATACAACAGTAGAAATTATATCTGCTGCGGTTTTATTATAAAATTTTAATTCCTTATCACATAAATTTAACATTCTATAATACATATCATGACAAGTAATTTCTATTGTTTTATCAAGTGTATTATAATCGTATTTTTTAATTACACCTGTAAATTGAAGTACATCCTCTATATAAATTTTTATCTGTGCAAAATTATCTATTACACCTTGCGTTCCTCCTGCAAAAATAGCTGTGGGTAGATTCTCATATTGTGCTGTAACAGTAGCTTCAGCAGTAGGTGTAGTTAAAGTTCTATTTATTTTAACTGACACTAAACAATGTTCTAAGGTTATTTTATTAGCATCACCATTTTCAAAGGCTTGATAGCCATTTTTTTTATAAAATTCTACTTTACATTTTGCCATTATCTTTCACCCATCCACTAGCTTCATGATTACATAAAAGCTCTAAATTTATATAATATATATCACCTTCGATAGGAGTATCTATCTCAAACTTATTTTGTAAATATCCTTTATATTGAATTCCAAATTCATCTACAAATATGAATCTACCTGAATAACTTTTTCTAAAGTCTAAAAACTTAGTTATATTACTTTGTGTTTCCTCATCATTTTCTCCTTTTATATTAAAAGCAACTGTAAACTCAATAATACAGTCACTTTTAACACTTTTTTCAAAATATGTGTATCCTTGTACTGTTCTAATACCCTTACGAAAATAAGCAGGACGAGGTGGCTTATAATTAGTTATTACGCCACCTGTATTTTTTCTATCTTCATAAAGCAAATCTACTTTAAAATCTTTTATTCTATTTAAGTCCATATAAGCCACCCCCTAATCTCTCAATACATCATTCATAAATAATCCTGTCATAACATTTTTCATAGAACTTTCTGTCATTTGTTTAAATTCATTAGCTATCTTATTAGCCCCTTCTTTATCTGCATTTGGTATAGTTACATACATTTTTATATCCTGTGTAAGTCCCATACTTTTATTCATGTTATTAGGTCCATATGGAGATGCATAAGTACCACCATATGCTCCACTAAGTGACATATTATTTAATCCATTAAAATTTGGTCTTACATTTCCTAATCCTTTAATTTTATTAGCTATACCTTTAAATTTATTATTTATGGCGCTTTCTTGATTATCTATACCTTGTATAAGACCTTCTCCAATAAAATTACCATAATCAGCAAATACACGTGATGGAGAGTTTATTCCTAACATTTTCTTAAATCTACTAGATATTTCACTAGCTAGATTTCCTATTACCTGTCCTACTCTTCCAAACATAGCTCTTATACCATTTATAAGACCTTCAACTATATTTCTGCCTATGTTGAAAAGTGCTCCTGCTAAATTACCTAATCCTCGAAATATATTAATCCAACCTTGTACAATTCCATGTAATATAGTTCCAACACCTCGAAATATTGCTATACATCCGTTTATTATGTTGTGTACCATTCCACCTACCCATTGAAGGATTCTAATAAATCCTTGAAATGCATGAATAGCCCCCTGTATAATTGAATTTATAACTCTACCTATTCCTTTAAATATATTTGCTATGAAATTTCCAAACCGGGTAGCATATTTTTTCAAAGTATCCCAATGTTTAATCACTTCATATACTATAAGTCCTATTGCTGCAATAGCAACTAAAATTAGAAGTGTTTTTGAAGTTATTATGGTCTTTAATAATCCAAATATCCCTCCAGCTTTCTTTAATTTACCAAATATACCTATCACATTATTTATAGTACCTACTAATTTGCTAAGTACCGTAAATGTTTTAGCAACTCCAGCTATTGACACAATTATTATTGCAATAGCGTTTTTCACAGGATTAGGCAATTTATTAAATGAATTCATTAATTCTACTGCTTTATTAGCTAGCTTTGTAAATATTGGGATTAATTTATTATTCAATATAGGTACTAATTGATTATTAAATATAGGTATCAACTGTTTTACTATAGATGTTTGTAATTGTGCAAAAGAATCTTGTACTTTTTTTATGGAAGCTTGTATATCTTTTTGAATTTTATCATAATTGCCCTTTGCAATATTAGCAGGACCCTTTTTGGGGTTCTTACTCTTTGTCTCTTCAGCAAGAGTATTTTTCATCCCAGTTTTAAGAAGATTTTGTGCCGCAGCACTAGGTTTTTCCATAGATTTTCCTATTTTGCTTAAAGTTCCTGCTTCTTTGGCTAATGCTTCTTGTAATTTTTCAATTCTAGTTTTTTCTTTCTCAACTTTATGCACAAATATTTCTAAGTCTTTTCCAGCTCCATTAAGTGCTTTTTTAAATTCACTAGTATCTAATGTTAAATGGGCAACTGCCTCTCCTACATTTACTGCCATGTTGTTTCTCACCTCCCACCTTTGGGAATAAAAAGTTTTCTAACTTCATTTAAATAATAATTTAAATTTAAAAATCTATTTTCTATTATTAGCATTTAACCATTGAATCACATCTTCATTATTAGCTTTATTTATTCTATCTCCATCTATAAACTTAGGCTCTCTAGCATCTTCTTTACTAATCTCATTTAATATATAAACGCAGGCCTCATCAAAACAAAAAGCCTCATAATCATTAGTCAACCCTATAATTTCACTGGGCCTTTGTCTATATTGTTTACTTATTGATATTACACTCAGTATTCTCTGACTCTTCACGAAAGGAGTCTAATTCACTTACACCTTCCTGTGTATAATTAAACAATGCTACTATTTGTTCATCTGTAAGCTCTAATCCTACACTTTTTAAATCTTCTATGGAAGGTTCTACAAGTGCATTTTCGGCCATAATATACATAACATCTGTCATTTGTGCTAAATCAACATTCTCTTTTGAACTCTGTTTACCATAAAATAGTTCCTCTGCTGCACTTAATAATTTGTTAGGCACTACTCCTTTTCTTACCAAATTTAAAAGAGATACTCTTTTAACTCTAGCATTAAAAGGTATCCCTTGGCTAAATTGTGGCAACTGAATTACTTCATCTTGAGCTGCTTTTTTTAAATCTTCTATATTAGTTACCTTTAAATCCATTTTATTATCCCCTCACTATCTAATCTTTATTGTTTTAAATTCTGTGGATAATGCTGTGGTTTTACCACTTCCATCTAATTTGTTTATTTCTTTAGCTTCAGCAATATAAACTGTATCTATTGCTAAAGAATCAGGTACAAATGTTACTATTTTCTTAGTATCATCTATAGTTACATTTCCATTTACTCTAGAATTATCAGATTTTCTCTTTATAATAAAGTTTTCTAGGTTAACATCATCTTGATTAATTTTATTTGAAAAACTCCACACTACCCTGTTAGTTATACTTACCCCTACATCTGGATTTTTATTTTCTACTTCTCCACCTTCTACTCCTATATCTTCAATTGGAGTAGATTCTCCTGGCTTTTCTCCATTATTATTCTCTTGTAATTTATTTAAAAATTCTATTTCTACAGGTTTCTCATTTCTAAATGGTATACTTTCAGCCTCATATGAAGACACTAAGAATTTTCCATCTTGAATTTTATATTTAGCTGGCTTACCTTTACAATGCTTATACACGAATTTAACATAGCCTGTGGTTCTAGAATAGTCTTTTTCTTCTGTGAATATTTCCATAGTGAATGGATGTCTTTCTACTGCTATACCTACTTCTGTTCCACAATATTTATTATCTTGTATAGTTCCTCCATCTATTAAAGCCATAGTTTCTATATTAAATAGATTGTCCTTCATTTTTAACTTGTAACCTATAACAATATCATCTGTTTCATTTATTCCATAAATTTTATTTTTAATCCTTAATATATCTCTTTTGCCCTTACTGTTTATAGGTTCTATATCTATTTCATTGCTTGTTTCTATTGTATGTTTTGTATTTGTTACCTCATCAATAAAATTAACTTTCACAACATTAACTAAAGTTTTTCCGCTTGTCATTAAATTACCTCCTTAAACTTTTAAATTGTTGATATTCTATGCTTGTAGTGTAAGCTTGTACATCGTAATCTATAACGCTTGGTGTTTCATTCCCTGTAGGCCTAAGATCTTCTATTTTTTTTAAAGCTTCTTTTATATTCTCTACATAAAATTCTATAGTGGAATATTGATCCATAGGGCTATAGACTATAATATCAAATAGTTTATAACCAGATATATTTCCAACTAAGGCATGTACACCATTTTCCTTTATAACTACATAGCTTTCTGTACATTTGTTTCTCTTTTGTCCAGGAGCATACACATTATATCCTAATTTTTTTAAATATAAATATACATTTTGCCATAAAGTTTCTGGTATAACATTATTAATTATATCTTGCTGTATGCAATCCCCTGGAACCTTGTAATTAAATTTAGACATTTACATCACTTCCCAAATAAATTACTCATCCCCTTAAGTATTTGTGGACTCAGTTTATCTATAGTTGGTTTTAATATTGCATATTTTTTATCATTACATAACTCTAAAGACGGATAGTAATCCTCATTTCCAGTAATATAAATATTACACCTATCGCCTTTCCACTGTTTTCCACCTTTAATTGTTTCAATATCCATATCTAATTGATCCTTCCAAGGTGCATTCTTTTTAGCATCTTCTTCTAGCTTCTTTGCGGCAATATCTGCATACCCACTTATAGCAGTTTTAGATTGCATCTCAAATTCAGATAATCCATCAATAACACTATCTATATTTACTTCAAATTCCCTCATATCATCACACCCTGTTTAATATCATATCAAATACTAGGTTTTGAATATTTCCTGTGTCAACTATTTCATACTTAGTTCCATCTAATATAAAATAATCATCCTTTTGTATTTTAGAGCTTATATCATTATAGATAATTAATAATTTATCATTATATAAATTATTAAATTCCAGTCCTTCCATAGAAGTTGTAATTATATTACTATTATTTCTATAATAATATCCCCTTATAGTGCATACATACACTTCATCTAGTTTTTCTTCAAAAGCATTTTTACCTATTCTTAATATTTTTATTTCTCTTAATAAGTCTTTTTTTTCTAGATGTTCATATATATTTTTACTTATTTTTGCCCTATTTATATTATTCATTAATGTTCATCAACTCTTTCCATAGAAGTTTGATTCTTTAGAATCTTTTGCTCTTCTTTGAAATGCTCTGCTAGAGTTAACCAATAGGCTCTATTACTTTGTAACTTTATATCTGCAACTTCTATTCCATCATCTGCAATTGCTTTTAGAATACACCCTTTATAACTTGCTTTTTCTACATCATTATTATTGATTTCTAGTAGCAATTCTAGCTCTTTATCCTCAAAATAAGGATACTGTTTTTCTTGTAAATTAAATTTCAAAATCTCTAAAGGTGTTCTCACTTTTTCTCACCTTCCTTAGTTAAATTTTATTTGTTTAAGGTTACTAATTTTTCTGCAAATATTTTCAATAATAGTTTAATCATTTATTTAGTCAGTCTATTACATAACCTCAAATCATCCTCATTATGATAAATTATTGAATATAGCTCACCTCCTATGCTTACTGTACAACCTTTAAGTTTTCTTGAAATGAATAAGCATTAGATTTTATAAAAGCCTTAATTTATAACTTTATTTATAAGAAGTTATAAGAATTAAAACTTATTTTGCAAATCTAATGCATTATTTACGAATAATAAAATTTTTAGTTCAAATTATTCAGTTTTTTAGCTTACTCTTAAAAGCTGTAAATTTTAATTTGATTTCATAATATTCATTTATTTTTTAATGAATACTTTACAGTTGTTTTATATAATAAAACCTCTGCTATTTTTATAATACTATTATATTTCATTTGAATACTTTATTTATCCCAACTTTGTCTCATTTTTGTCCCAAAATATTTTTATCAGATGACTACCCGCTCTAATACTCCCATCTTTTTCAAAGTGAGAGTAAAGAGCGGGTACGTCCCTGGATAACGATTTCCCCTAAAGGATAACGACTTCTAAGGAGTAAAACTCCTAAGAATTCTGTTAATAAGCTTTAGAGGGAGTAAAAACTCCCTCTGAAGCCAAGAACTCTGTTTATACTATAAGGTTATTCAATTGTGCTACATGTTCTACTAATTCATTCTTTTTTCTATAAGCTGTACTCCTTGCTCTTCCAAACATTTCTACGGCTATCCAATCTACACTTTTATTTTCTCCATACTTCAACTCTATAAATTTTTTATTTTCTTCATTTAGTGATGAAATATTATCTTCCATTACTGATATTTCTTCTTCTATTTCTCTTATTTTATATTCTACTTTCCCTTTCTTCTTAATTTTTTCTCCTAGTTCTATCTCTAATCTTTCTATTTGTCTTATTAGCTCTTTCTCTGCATAGCCTGTTCCATTGCTAGAGGTTTGTACTATTTCATCATATGTTCTACTTCTAGACTCTTCTTCTAATGTTACATCATTATTTTTAATTTTATCCATTATAATTTCTATTCTATTAGAAAGATGCTTGGCTCTATTTTTTAGCTTATTCAATTCTTTTTTACTTCTAAAATGCCTATATAATCTTTCTTCTGTTTTTATATATAATTTTTTATCCAACATATCTAACCTCCTATAATAATTCTTTAATATATTTTCTTATAACTATAATGTTACTTTTTGATATCTTTAAAGGCCTTTAGAAATGCCTTTTGGTTTGAATTTTATATACTTTTTTACATTTCTTTATTATTTTTATTTAACTCATATATCATTATTTCTTTTCCCACAATATCTAAAAATCTTTTATTGTAAAGTAATGCTTAACCACTTCGTCCGTCCATCTATTTTTTGCAACTCTTAAAAATTCTAATTCCTCTTGATATTTGTCTAATAAATTTATACTTTCCTTTAATAATTTCTCATAATCTATGCTTTTCTTTACATACTCCTTTAATAAAATCTTTAATACTACATTTTCTTTTCTAAATGACTCTATCTCTTCAAAATATTTATTTTCTATTTCTTTAACTAATACAATTGACATCTTATGCCTCCATCATACTTAATTTTCTATTATATTACTAAAGACAATCAATATTCTTATTTCAATAATTCTTTTAATATTTCTGTTTTCTCTTTAGCTTTTTCTTCCCTTATATTTTTACCATCATTTAAAATAGGAGTACACATTTCTAAAATTCTATAGTATGTCCTCTTTTCATATCTATTTTTAAGTTCTATAAGAGATAAATTTGTTGTAATTATAAGTGGTAATCCATTCCTATATCTACTATCTAAAATATTATAGATTTTAGTTCTAGTCCATTCTGTATCCTGTTCTGTTCCCAAATCATCTATTATCAATAGATCTGCATTATCTAATCCTCTCAATATATCTTCTTCTACTTCTTTTCCAGATTTTTTATATGTGTCTTTAATTCTATTTAATAAGCTATCTGCATTTACACATATAACTGGTAACATTTTCTCTATAAGAAAGTTTGCTATACATGCCACAGTATAGGTTTTACCATTTCCCGGAGAACCATATAATAAAAGTCCTACAGATTCTTTTTTCATGTTTTCAAATTTTTTAGTATATTTATTAGCTATTTTATACATTTTGTCATTACCTTTAGTAAAATCCCAATTTTTAAATTTACTATTTCTAAATTTTTCATCTATTAAACTATTTTTAATAATCTTTTTTAATCTTAATTGCTTTTCTTTATTTATTTTTTCTTTCTCTTTTGCCATTAGAGCTTCTCTTTTGCACTTGCACATTACAGGACCTTTTATATACCTATTTAACCCTGGAATATAAGTAATCTTTTCAATAGCTTCTCCACATACAGAACATATTTCAACTCTTTCATTTTCACCAGTAATATTATAATCCAATTCCCTGCTTTTTAAGGTCTTCTCCAAAGCTTGTCCTACTTGTTTCATATACCTCGCCTTCTCTCCATTTCTTACTTATCTCGTTTCTCTTTACATCTTGTGGTAATTTATATCCTTTATTTATCCAGCTTTCGAAGATTGACATTGTATATTTAAATCCTTTTATTTTGCCCTGTTCCTGTTCTCTTTTTTTTGTAATATCTAATGCATATATTAATAAATCAGTATAATCTTCTTTAGCCATGACTTTTAATACTTGATTTAAATAAGTGGCACTTATTTGCCTATAAAAGGTATTAAAATATGCTTCATTAATTTTATCTAAATTTTTTCTAATATCACTCTTTCTATCTTCTTTTATTTCTATATCTATATCTTCTATATCTATATCTCTGCCGTTACTTAACGTTTCATGTAACATTATATTTTTTTTATTGTCATTATTTTTGCAACTTTGTCTTTTAGTTTCTTCTAATAGTTCTTTTTTCTTAGCTCTATGTTTAGCTACCCTTTCCCTTGTTTGTTGTCTAACTTTCTCCATACCTTCTATATTTTGATGTTTGGACCAGTTAGCTATTTTTATTAATTTATCTTCTTGTATCTGTATCATGCCAAAATCTCTAAGTACTTTTAATGCAAACCTTAAACTATTTAATGGCCTATTAAAAATTGTACTTAACATTTCTTCTGTATATGGAACATTATCATTTAGAAAAATATATCCATTTGAATTTGTTTTACCTGCTTGAACTAAAAGTCTCATCCAAATATAATGAACAGTATCTCTTTCTGGCATAGCATCTATTAATTTTATTTTTTCGTCATCAAACATATTTGTTGTTATCTTTATCCACTTAACTTCTGCCAACATATCACCACTTTCTTTTTTATCCATAGTATACAAAATAAAATATTGCTATAATTAAATCAATCCATAATTTATATATAGTTTTTCTATACTTCTTTAATAATTATTGATTTACTATGTTTACCACCACCTCCATAGTTCTTGATCTATCAATTCATTAGGTGTAATTTTCAATATTTTGCATAGATTACAAATAACCTTTAGCCCTGGATTTTCATATTTACCTTCCTCTAATTCTGTAATATAACTTCTAGCTATTTTACTTTTGTAACTCAATTTTGAAATAGATAAGTTTCTTATTCTTCTATATTCTTTTGTTTTTATTACTGCCACTTGAGGATTCCTCCTTAGGATTTATTCCTCTCAATATTAAACTATAAATTTTTAAGTATTCCTAAAGTTGACCATTTCTTTTAAAAAAAAGTTCGTCTATGGTAGTATCAAAAAAATCTGATATAATCTTAGCCTCATTTAAAGTAAAAGACTTCTTACCATTTTCTTTAAAATTATAAGTATTTAGAGATACCCCTATTAGTCTTGCTATATCCTCTTGCTTTGCTCCTCTTAAGCATCTATAAGCTTTTAATTTTTTTGCTGTTGTCATAAAGCTCACCCCTTAATAACTATTTTTAAGTAAACTATAAGAATACTATTTATATTTTTATTATAGTCAACATTAAGAATACTTTCAACTGTATTTTATCATTTTTCTGAAAAAATATTCCTATAGTTTACATTAGTTTTAAAAAGTCAACATATGGTTTATAATATAGTATAAATAGAGGGGTGAAAAAGTTGGCAGAAATAAAAGATAGGTTAAAATGTGAAAGATTAAGAAAAGATTTAAATCAAACTGAATTGGCAAAATTTTTAAATGTATCAAAACAAACAGTTTCCAATTGGGAAAATGGTAACAGAATTCCTGATACCCTTACCTTATCTAAGTTAGCTGACTTCTTTAATTGCTCCGTAGATTATATTTTAGGAAGATCTGAAAATAGAAATGGCATAATTTCTAAAGCTAATATAGATGGAAGTAATTACGAATTTGAATTAGATAAGAGTATATTTCCAAATGGCATAACTAGAGAACAAATGATAAATTATATTAAGGAACTAGAAGATAGAAATAAAGAATTAGAAAAAGAAGCTGAGATATCTAGAAAATTAAAAGAAGCTGGCTTCGATTTCAATCCCGATAAATAAAATATTCTAAAAATTAATTATTTAAAATTAAAATACAAATATGCAAAACTAACAAATATATATGTATTCATGATGTTATGTTTATAATTACATGAAATTCGTATATGTTTGTTAGTTTTTTATTTTGTCTAAAAAAGTAAATACTTGTCCTAAAATTCTGTATACAGACAATTACATTTTCAAAATAAATATGTAATAATTTTCACATAAAGTAATTTAATTATATAAACTTGCAAATTTTATTAAAAGATATTAAAATATACTTGAACACATGTTCGATTTCAGAAAGGAGTCTTAATTTATGTTTAATTTTAGTGGGGTATTAAGTATAAAAAAAGAAGGGGAAATAATATATGAAAAAAAAGATACCTTTACACTGAATAGAAAAAAAACTTCTTGTGAAAAATCTTCTAAGGATAAAATACAATTAGTGCAGAAGGTTAATACATAATATAAAGAATATATAATAACTTCAAAATATAGTTGAAAGAAAAGTGTTAAGAAAGATGAGACTAAAGAACTACTTTAGAACAGTATATACACAACTTAATCGTTACAACTTATAAATTAAATAAGATAAAAAAACAAGTGCTGCTCCTTAGAAAATAAAATTACAACAACTTGATCTTTTTCATTTTAAAAATTTTTATAATTTTATAGTTAAATCATTGAATTCTAAAACTGTATTACAATATCATATAGTAATACATAAAATATTAAATAAAAATCATAGACTAAAATATATCTAACCTAATAGAATTATATAAAATAAAACTGGAACATTAAATATTAAAGAAGCTATTCAAACCTTAACACTTTTTAATAACTTTAGAGTATAAATGCTAATTTAGAAAATGCTTTGCTATTAAGCACTAAGGAAATTCTAAAGCCAGAATATTTAAAGAATTAATGAATGTTATTTACTTTTAATTCTTCTACTAACTTTCTAATGATATTTTAAAATAAAAAAGACTTTGGAAAACTAATCCAAAGCCCTCAAAGTTATATCTATAATGGTGCCGAAGGCGGGAGTCGAACCCGCACGAAGTTACCCTCGACGGATTTTGAATCCGTTGCGTCTGCCAATTCCACCACTCCGGCAAGAAAGATTTAACGTTATAATAATAACATATTAATAGTCTTTAGTCAACCAACATTTTTATTTTCTATATTATATAGAAAGGCTGGTAATCCCACAAAACATCAATTCTTAAGATAATTATGCTTCCTCTCTAAAAAATCAAATAATTTATCCCTCCCAAATAAAATTTATAGTTTTATATTAAACATTAATAGATTATTATAAAAATTTATAAAAAGTTAACCATATCTTATCAGGCTATTCATTGAGTCTTTACATATAAGGCTTATAATAATTCTTGTAAATTTTTGTCGAAAAATATGAAAATATTAGTAAACTAAAAATTAAAAAAGGAGGAGAACGTCTATAAAAATTGTTTCTAAAAAGTTGATGTAATCTAGTATTTATCATATTGGGATTATGAATTAATTAAGAAGGAGTGTATGATAATTGTTATTTAACTCGATGCATTTTTTATTGTTTTTTCCAATCGTTACTTTTATATATTTTTTTATCCCCCATAAATTTCGTTATATCTGGTTACTTATAACTAGTTATTATTTTTATATGAGTTGGAATCCTAAATATGCATTATTAATTGGTATTTCAACAATAATTACATATTTAAGTGGTATATTAATAGAAAAATCAAATAAAATAACTGATAAACAAAAATCAAAATTTTTTAAAAAACTTTGGGTTTTCTTAAGTTTATTTATTAATTTAAGCATATTGTTTTTATTTAAATATTGTAATTTTTTCACATATACCCTTACAAAAATATTTTCCTTAATTAATATTACAATTAAAGTACCCTCCTTTGACTTTATATTACCTGTAGGAATCTCTTTCTACACATTCCAGGCTCTTAGCTATACTATAGATGTCTACAGAGGTAATATTAAATTTGAAAAAAATCTAGGCAAATATGCTTTGTTTGTGTCATTTTTTCCTCAATTAGTGGCTGGACCTATAGAAAAATCAAAAGATTTATTGAATCAATTTAATGAAAAACATATATTTGATTATAATAGAGTAAAAAATGGTTTAGTACTAATGCTATGGGGATTTTTCCAAAAGGTATTCATTTCTGATAGATTAGCCATTCTAGTAGATACTGTATTTAATAACCCTAGTAATTATAAAGGTTTAGAAATTATTGTTGCATCTGTTTTTTTTGCCATTCAAATCTATTGCGACTTTTCTTCTTATTCAAATATAGCTAGAGGAGCTGCTGAAGTTATGGGATTTGATTTATCACTAAACTTTAAACAACCTTATTTTTCAAAATCAATACAAGAATTTTGGAGACGTTGGCATATTACTCTCGGAGCTTGGTTTAAGGATTACTTATATATACCTTTAGGTGGAAATAAGTGCAGCAAATGGAGAAGATATTTTAATAATATGGTTGTATTCTTAATAAGTGGATTATGGCATGGAGCAGCTATAAATTTTATAATCTGGGGTGGCCTACATGGATTTTACATAATAATAGGAGATATGCTAAAGCCACTTAAAGAAAAAATAATAAATAATTTAAAGATAAAAACTAATGTATTTAGCTTTAAATTATTCCAAACATTGTTTACTTTCATATTAGTTGATTTTTCATGGATATTTTTTAGAGCAAATTCATTTTCTGAAGCTAAACTATTAATTAAAAATATGTTTTATTTTAATCCATGGATATTTACCTCTGGTTCCATCTATAAATTAGGATTAGATCAAAAAGATTTTAAAATGTCAATACTAGGTATATTAATAGTTTTTATTATAGATAATATTGCGAGAAATAAAGATGTACGTGTTGAACTCTCTAATCAAAATATAGTATTTAGATGGGCTATTTATTTATCTGCTATTTGCTTTATATTAATATTGGGTATATATGGAGCAGGGTATGATGCCAATCAATTTATTTATTTTCAGTTTTAA
Protein sequences of DBSCAN-SWA_6 >NZ_CP028842|3182792:3204692|3200587_3200821_-|WP_012048065.1|DBSCAN-SWA MLRRNPQVAVIKTKEYRRIRNLSISKLSYKSKIARSYITELEEGKYENPGLKVICNLCKILKITPNELIDQELWRWW >NZ_CP028842|3182792:3204692|3185159_3187055_-|WP_012048047.1|DBSCAN-SWA MPLHKIPLCSFEYVGDNAFSSGTFIYDTTEKVVKTTEKLFYKETMGEIDKIKGDKLFYKEPKDNIEKEKNKYISKKITDIKKEFEKELELRNKEVNKNNTISLDKIKYISINRITSKELDVRKNTDISICYNNKLLVREILQLNKANNLINLSIDRENLQLNKFKSIYTDLIVEKEIFKGESLQNLKLEKYINIEKNIGYYLYRIYCKEIDIDKLKFAEKHGFKNINKNKYRFIDRSNLKEVAKISNKTMLNKDIIIGIDIDTSINNLKILDLKDIDRNYKTMLMYNIALKDIEKYRIKNALNKIAHKEICKDHNKKYFYKDVFKFIDKSINGYLYRQAIRSIFKYNNRYLDREYTTNIFKHNEKYLDNSPIINIYKQIERDLLNLSIWQIYRQSNKYLNNGAIRQIYTPNKNKFIEMTKRWWWLKPTNPTDRLIVPNKDYIYNNDLLNNLDYEYLRFNNHPIEWGKDWGVDYNIPPMTISIEIMLDLINILIMIWHKNTQAWLNCTGKESIQFIMELIYDWYTLDTSSPNADYIRAYRWIRWEAEKVYFLNTENGLQAIGLLIANLIDYLKQHHFNLVPIWHNPKAMDIERKFNKVATNGDIMKDLDKLKGKRNYMIETQNFEKKNIFGR >NZ_CP028842|3182792:3204692|3192540_3194082_-|WP_012048053.1|DBSCAN-SWA MAVNVGEAVAHLTLDTSEFKKALNGAGKDLEIFVHKVEKEKTRIEKLQEALAKEAGTLSKIGKSMEKPSAAAQNLLKTGMKNTLAEETKSKNPKKGPANIAKGNYDKIQKDIQASIKKVQDSFAQLQTSIVKQLIPIFNNQLVPILNNKLIPIFTKLANKAVELMNSFNKLPNPVKNAIAIIIVSIAGVAKTFTVLSKLVGTINNVIGIFGKLKKAGGIFGLLKTIITSKTLLILVAIAAIGLIVYEVIKHWDTLKKYATRFGNFIANIFKGIGRVINSIIQGAIHAFQGFIRILQWVGGMVHNIINGCIAIFRGVGTILHGIVQGWINIFRGLGNLAGALFNIGRNIVEGLINGIRAMFGRVGQVIGNLASEISSRFKKMLGINSPSRVFADYGNFIGEGLIQGIDNQESAINNKFKGIANKIKGLGNVRPNFNGLNNMSLSGAYGGTYASPYGPNNMNKSMGLTQDIKMYVTIPNADKEGANKIANEFKQMTESSMKNVMTGLFMNDVLRD >NZ_CP028842|3182792:3204692|3201974_3202124_+|WP_003403583.1|DBSCAN-SWA MFNFSGVLSIKKEGEIIYEKKDTFTLNRKKTSCEKSSKDKIQLVQKVNT >NZ_CP028842|3182792:3204692|3192093_3192528_-|WP_012099497.1|DBSCAN-SWA MDLNRIKDFKVDLLYEDRKNTGGVITNYKPPRPAYFRKGIRTVQGYTYFEKSVKSDCIIEFTVAFNIKGENDEETQSNITKFLDFRKSYSGRFIFVDEFGIQYKGYLQNKFEIDTPIEGDIYYINLELLCNHEASGWVKDNGKM >NZ_CP028842|3182792:3204692|3203204_3204692_+|WP_012048068.1|DBSCAN-SWA MLFNSMHFLLFFPIVTFIYFFIPHKFRYIWLLITSYYFYMSWNPKYALLIGISTIITYLSGILIEKSNKITDKQKSKFFKKLWVFLSLFINLSILFLFKYCNFFTYTLTKIFSLINITIKVPSFDFILPVGISFYTFQALSYTIDVYRGNIKFEKNLGKYALFVSFFPQLVAGPIEKSKDLLNQFNEKHIFDYNRVKNGLVLMLWGFFQKVFISDRLAILVDTVFNNPSNYKGLEIIVASVFFAIQIYCDFSSYSNIARGAAEVMGFDLSLNFKQPYFSKSIQEFWRRWHITLGAWFKDYLYIPLGGNKCSKWRRYFNNMVVFLISGLWHGAAINFIIWGGLHGFYIIIGDMLKPLKEKIINNLKIKTNVFSFKLFQTLFTFILVDFSWIFFRANSFSEAKLLIKNMFYFNPWIFTSGSIYKLGLDQKDFKMSILGILIVFIIDNIARNKDVRVELSNQNIVFRWAIYLSAICFILILGIYGAGYDANQFIYFQF >NZ_CP028842|3182792:3204692|3194359_3194776_-|WP_012048055.1|DBSCAN-SWA MDLKVTNIEDLKKAAQDEVIQLPQFSQGIPFNARVKRVSLLNLVRKGVVPNKLLSAAEELFYGKQSSKENVDLAQMTDVMYIMAENALVEPSIEDLKSVGLELTDEQIVALFNYTQEGVSELDSFREESENTECNINK >NZ_CP028842|3182792:3204692|3190667_3191009_-|WP_012048051.1|DBSCAN-SWA MAHMGYKNFREPVVYILNQELRKRNFKNQINTNEDSKYAGELPEYPCRIIRDSNNKAYKFIYASGTDMQWQEELIRNAEGKVYRIKTTYPNNTNKTIQLIKDNHGKLETIDYV >NZ_CP028842|3182792:3204692|3196108_3196456_-|WP_012048058.1|DBSCAN-SWA MREFEVNIDSVIDGLSEFEMQSKTAISGYADIAAKKLEEDAKKNAPWKDQLDMDIETIKGGKQWKGDRCNIYITGNEDYYPSLELCNDKKYAILKPTIDKLSPQILKGMSNLFGK >NZ_CP028842|3182792:3204692|3182792_3183878_-|WP_012048045.1|DBSCAN-SWA MSEFFNVTLDKDIILDDSVISNKTGWSSEKIQKEIIDKRITKFEELEDVDVTNKKNKQLVAYSEETGKFTTIDGIDAGEIVGAGMKQISKMGIVGSAETPRIVNIPVNTVDFKVPRVNVLRYDTENTQDLISVKNEFTNDESNDFIDDRMMTFDGKAHLETNHISDFEVVQDTESFTEYSVNVDKTLFKKIEGFETFEDGVIQKLKTKAIPFDRLLIPKGDMNLSNVDHIDYFRLTANGNNIRIVCSVDSGNTWKTFSGEKWVNVNLTVDDVRKSGMNIATFNAINDVFWNELITTKKIRFAYLFSMDSITDIEEIDKLDLQYDGVGRWKQVKEDLYEVIYASNTLLQVECKFSGNIKINY >NZ_CP028842|3182792:3204692|3184899_3185154_-|WP_003360052.1|DBSCAN-SWA MLTSTIDFKKTRQKMWGILKNKTLAQLPYGHETDKNGSEITSYATNCYEDALEEAHTLLANGIGTKDIQIVEFVPYDYIMQPRV >NZ_CP028842|3182792:3204692|3196825_3197110_-|WP_012048060.1|DBSCAN-SWA MRTPLEILKFNLQEKQYPYFEDKELELLLEINNNDVEKASYKGCILKAIADDGIEVADIKLQSNRAYWLTLAEHFKEEQKILKNQTSMERVDEH >NZ_CP028842|3182792:3204692|3191021_3192107_-|WP_003403529.1|DBSCAN-SWA MAKCKVEFYKKNGYQAFENGDANKITLEHCLVSVKINRTLTTPTAEATVTAQYENLPTAIFAGGTQGVIDNFAQIKIYIEDVLQFTGVIKKYDYNTLDKTIEITCHDMYYRMLNLCDKELKFYNKTAADIISTVVSDAKCSFQRGGGNNYTVPKLECEIGTMYNDIISNLVETMYARIRANKNGTIILEEQYPAYNESNHEANHHDYVLSVDTNLSSETASRDSSLMRNILKICCNDKYSIFESKAMTSYLNGERWVDIIDNPLASTPLLKQKVAGYKFLDMWRESTALNVVPVTGIPNIDLGQVVKLVNNQRGNGWYLIVGISTEINADTYVDTLQLQGMRDKTKVYDQCIQIGSGRLKQ >NZ_CP028842|3182792:3204692|3197796_3198318_-|WP_012048061.1|DBSCAN-SWA MLDKKLYIKTEERLYRHFRSKKELNKLKNRAKHLSNRIEIIMDKIKNNDVTLEEESRSRTYDEIVQTSSNGTGYAEKELIRQIERLEIELGEKIKKKGKVEYKIREIEEEISVMEDNISSLNEENKKFIELKYGENKSVDWIAVEMFGRARSTAYRKKNELVEHVAQLNNLIV >NZ_CP028842|3182792:3204692|3188330_3189311_-|WP_012048049.1|DBSCAN-SWA MSLPKYIINFEELTEDLKNHLLSLIDDNIRTNYPEINTNNIQDLLQQLKNLLPSVQYEGLKKKIDAFIYRKIEGIQKVKGILLDIPAIQNDYKEQFKFDKDVYITGLHFNQTGWKKEDKYSLEINKIKIIDNVTTKEIGEHKYFNTFYKVNANTPISFVFHNLSGNSRQIIVDLEYIDGEDSSITVEPPPGIEDIDNEWDIAVVMNWEENTDADIDLHGKIDDKKVWYGNKSYDGFYLNFDYTSHKTNKNPEIISVKGYKNKKLLISIKNFNGVELKEPVTLEIYQYRPYGNKLLKKFNVNLDTNRDLKDIFIMDLNTLKITNLNK >NZ_CP028842|3182792:3204692|3194791_3195679_-|WP_012048056.1|DBSCAN-SWA MTSGKTLVNVVKVNFIDEVTNTKHTIETSNEIDIEPINSKGKRDILRIKNKIYGINETDDIVIGYKLKMKDNLFNIETMALIDGGTIQDNKYCGTEVGIAVERHPFTMEIFTEEKDYSRTTGYVKFVYKHCKGKPAKYKIQDGKFLVSSYEAESIPFRNEKPVEIEFLNKLQENNNGEKPGESTPIEDIGVEGGEVENKNPDVGVSITNRVVWSFSNKINQDDVNLENFIIKRKSDNSRVNGNVTIDDTKKIVTFVPDSLAIDTVYIAEAKEINKLDGSGKTTALSTEFKTIKIR >NZ_CP028842|3182792:3204692|3198490_3198742_-|WP_012048062.1|DBSCAN-SWA MSIVLVKEIENKYFEEIESFRKENVVLKILLKEYVKKSIDYEKLLKESINLLDKYQEELEFLRVAKNRWTDEVVKHYFTIKDF >NZ_CP028842|3182792:3204692|3194157_3194325_-|WP_003393374.1|DBSCAN-SWA MTNDYEAFCFDEACVYILNEISKEDAREPKFIDGDRINKANNEDVIQWLNANNRK >NZ_CP028842|3182792:3204692|3195683_3196103_-|WP_012048057.1|DBSCAN-SWA MSKFNYKVPGDCIQQDIINNVIPETLWQNVYLYLKKLGYNVYAPGQKRNKCTESYVVIKENGVHALVGNISGYKLFDIIVYSPMDQYSTIEFYVENIKEALKKIEDLRPTGNETPSVIDYDVQAYTTSIEYQQFKSLRR >NZ_CP028842|3182792:3204692|3201262_3201673_+|WP_012048067.1|DBSCAN-SWA MAEIKDRLKCERLRKDLNQTELAKFLNVSKQTVSNWENGNRIPDTLTLSKLADFFNCSVDYILGRSENRNGIISKANIDGSNYEFELDKSIFPNGITREQMINYIKELEDRNKELEKEAEISRKLKEAGFDFNPDK >NZ_CP028842|3182792:3204692|3198798_3199647_-|WP_012048063.1|DBSCAN-SWA MKQVGQALEKTLKSRELDYNITGENERVEICSVCGEAIEKITYIPGLNRYIKGPVMCKCKREALMAKEKEKINKEKQLRLKKIIKNSLIDEKFRNSKFKNWDFTKGNDKMYKIANKYTKKFENMKKESVGLLLYGSPGNGKTYTVACIANFLIEKMLPVICVNADSLLNRIKDTYKKSGKEVEEDILRGLDNADLLIIDDLGTEQDTEWTRTKIYNILDSRYRNGLPLIITTNLSLIELKNRYEKRTYYRILEMCTPILNDGKNIREEKAKEKTEILKELLK >NZ_CP028842|3182792:3204692|3187069_3188308_-|WP_012048048.1|DBSCAN-SWA MATDNFYFVEGNTSVKNLVKTLAAEITQNSGIYKWDLVYPDSINKIGSAGEGSTINLIKDNSKTDKVDTVFTVGSQNDKCIIKATTTYGKEFYVKIDREEADLTKEEKKALIDFNKLHTYYNGNGDSFSRTDAQVLEMMAGVSDRWSKSGDYDVYVSAMTKSNSINNIKLQISDKLNADKTDLGISKNIQAEYNYRLAWYRKLQPEIKDFLPVQYWINVTKDSINLVLCGDPSADVHPYENYLTSYAYIGALKPVEDSAYTDDKYNFGITVSSDIEPNYSKVYGERTATGVTDVCMIANKIGMPYQPHYPAFYATNPFMDKCNVEGSRYNHKKHQFSDITLVHPVDMERGKMINVLVGDASAINDTDRLAYKKDTEEEEYYKKFKITAPYCFLNNSANINYCVAIRCYKTTK >NZ_CP028842|3182792:3204692|3199588_3200503_-|WP_012048064.1|DBSCAN-SWA MYTMDKKESGDMLAEVKWIKITTNMFDDEKIKLIDAMPERDTVHYIWMRLLVQAGKTNSNGYIFLNDNVPYTEEMLSTIFNRPLNSLRFALKVLRDFGMIQIQEDKLIKIANWSKHQNIEGMEKVRQQTRERVAKHRAKKKELLEETKRQSCKNNDNKKNIMLHETLSNGRDIDIEDIDIEIKEDRKSDIRKNLDKINEAYFNTFYRQISATYLNQVLKVMAKEDYTDLLIYALDITKKREQEQGKIKGFKYTMSIFESWINKGYKLPQDVKRNEISKKWREGEVYETSRTSFGEDLKKQGIGL >NZ_CP028842|3182792:3204692|3200861_3201071_-|WP_012099500.1|DBSCAN-SWA MTTAKKLKAYRCLRGAKQEDIARLIGVSLNTYNFKENGKKSFTLNEAKIISDFFDTTIDELFFKRNGQL >NZ_CP028842|3182792:3204692|3183889_3184888_-|WP_012048046.1|DBSCAN-SWA MKLIQVKNGLLEAENFFLASSFADFAGESNITRDIKTGKLKLISNNKIERKFNYKEFVIEVEKENFNDIKDMDYSMLYLGNSDHIFGIKDLKSNEQNRYWKILKKDNYIQAYSSNDGKNYTNMGGMEFAEPLTKQGFMKYSDEDFILNNYKVYANPYVTIQNFPENTLCELYDLDNNLIKTRLFNSDMECKVFIDSKISGYFTFKDRDGKVIYTSDALQLQYGDMWVFSPYNFEIIYHGNVVTNVSPAMLQDLEELITIKNIGDKDYNNIKIGTETPSNDLIQLSFDGINYADSLTIDSIKQRESKGIYVKITKNAENHNFAVRDFHLVISE >NZ_CP028842|3182792:3204692|3189312_3190653_-|WP_012099496.1|DBSCAN-SWA MGLPSYVVNFDELSDLIKDYLQNGVKVDIGNINFSTKDMENLLSEIKDKIQGVDYNDLINALNALGVKLDNLSGNLGISGTQKIYGKMLEIPAVKGQHIIEFKGNGQITGITYSQSSWRFEDSWDLQVGNDKLFESVRTKEYGEHKFLNVFYPINGTVKFIYNNISGTSKVLWVDFNILENSNLPTPTIPTTSEKNYRFLAIGESEYTLQGANNLMGCTYDADNISNLFKEHKESAKFTKNIVAKNKTKSEALNLIKNTFQDAQDNDISYLFWSGHGTVYEDKFALVAKDNIITVYELQTILDDIKGTKVIFIDTCHSGLAIDKNFAYTLAVVEEKLRSIDKTLNKQGYKVLTASAGSETSGDLSAGYNGNPNPSGAFTWALTQSIKTKKSDKDKNRIVTLEELYQSVLHFYDEFNIKNPYLKITQTAQVYPRNDTSSIFEYKEGA >NZ_CP028842|3182792:3204692|3196460_3196826_-|WP_012048059.1|DBSCAN-SWA MNNINRAKISKNIYEHLEKKDLLREIKILRIGKNAFEEKLDEVYVCTIRGYYYRNNSNIITTSMEGLEFNNLYNDKLLIIYNDISSKIQKDDYFILDGTKYEIVDTGNIQNLVFDMILNRV |
27 | Clostridium_phage(85.71%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|