Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NZ_CP043998 | Clostridium diolis strain DSM 15410 chromosome, complete genome | 8 crisprs | DEDDh,RT,cas3,csa3,DinG,WYL,cas6,csm2gr11,csm3gr7,csx10gr5,cas10,csx1 | 0 | 6 | 9 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_1 | 350180-350262 | Orphan |
NA
Consensus repeat of NZ_CP043998_1
|
1 spacers
spacers of NZ_CP043998_1
>1.1|350203|37|NZ_CP043998|CRISPRCasFinder GTGTAAAAAATGCACCTAGTGGAGAAATCACTCCATC |
CRISPR arrays and Neighbor proteins around NZ_CP043998_1
The CRISPR arrays of NZ_CP043998_1 >merge|NZ_CP043998|1|350180-350262|CRISPRCasFinder AGTAGGTGGAGAAATTACACCTAGTGTAAAAAATGCACCTAGTGGAGAAATCACTCCATCAGTAGGTGGAGAAATTACACCTA >NZ_CP043998|1|1|350180-350262|CRISPRCasFinder AGTAGGTGGAGAAATTACACCTA GTGTAAAAAATGCACCTAGTGGAGAAATCACTCCATC AGTAGGTGGAGAAATTACACCTA
>NZ_CP043998.1|WP_039771192.1|349587_349791_+|helix-turn-helix-domain-containing-protein MNKEKADYPIVLQTKDVMEIMGCSSTTAAQYIKIASAKLKEQGKIPPVDVVKNLRIPRDQFYFIYGI >NZ_CP043998.1|WP_039771194.1|349245_349458_+|helix-turn-helix-transcriptional-regulator MLKLDVKKLLLLQAKACLNTNELAKRASMPRTTITNIVHRKRNATPKSIGLLAKALGVDVSELLLNEKDN >NZ_CP043998.1|WP_051144814.1|348121_349111_-|helix-turn-helix-domain-containing-protein MPLSDKLKRIRKYRNLTQKELAEISEVTRESIGNYERGDRTPPADILKKIALALNVSVDALTSDDSFSSEVYSRAMQIAFKLASNSDEILRLLGNYADYNTLVAFNGESISRLPISSIKGLLRFIAANSLVEFNKIYEDLIKTDIYNLDSEFEDYCQQMYTKLNNPLNYINSDNKKFLESQGYIKDGHLSVDAIKLDKSNQKIKGVQIGNQITFLPESFDEIKNSVDKAFPILNAEVNFLSNPKLEMVFGYSYNDLAVAGYDNLLIMAIEKVIETTLSDIKEHEKNGDLFDGVSSWISKESPVYEILKETRKKNSDAINTLKKDSEDNN >NZ_CP043998.1|WP_039771196.1|346906_348070_-|site-specific-integrase MANENIKTDKKTGLYYFDVSLGFDPATGKRRRTTRRGFKKKKDAEQAYNDLKNQYYDGVLTYNQSTKFKNFIDEYLKWYKTQVRKTTFDNRASSIKKNIIEIFGEYKLEQITPIIVQKWQQQLLDNGKDQNYVRSLHIALSQILERAVNLDVIKTNPAKKAGNVKRKRKEVEFWTEDELNKVLDTMKLDDTLQYFGYVMIKFLFYTGLRFSEMQALQWSDFDDINKSISITKDLDYRNQNDWDFDDTKNSTSNRLVVLDDDTFDMLLKWQEYQKTLFEVKKDTFIFSYDNGIPTNKHFPGHVLTRHSKLADIKRIKPHALRHSHASFLISLDVNIIAIAKRLGHKDVQEVLKTYGHLYPKHQFDVAENINTHIQNKKSGVKLESNSN >NZ_CP043998.1|WP_023976022.1|345327_346860_+|glutamine-hydrolyzing-GMP-synthase MKRDLVLVVDFGGQYNQLIARRVRECGVYCEIIPYDYTIEKIKAKNPKGIIFTGGPNSVYGEDTPTVEKEVFELGVPVLGICYGDQLMAHLLGGKVATAPVREYGKTNVKLDKSSKLFEGIETDGIAWMSHTDYIEEAPKGFKVIATTEVCPVAAMENEEKRLYGVQFHAEVEHTQFGQKMLENFIHNICGLENSWSMGSFAEEKIKEIKELVGDKKVLCALSGGVDSSVAAMIVHKAIGHNLTCIFVDHGLLRKDEGDTVERVFKKEFDMNIKRVNVSDRFLGKLAGVSDPETKRKIIGEEFIRVFEEEAKKLGQIDYLVQGTIYPDIVESGTKTSATIKSHHNVGGLPEDMQFELIEPLRELFKDEVRAVGEELGIPHKLVWRQPFPGPGLAIRVLGEITEEKLEIVREADAIFREEIANANLDESIWQYFACLPNIRSVGVMGDERTYSHTIALRAVTSSDAMTSEWARIPYEILDLVSRRIVNEVKGVNRIVYDITSKPPATIEWE >NZ_CP043998.1|WP_011967680.1|343682_345140_+|IMP-dehydrogenase MGKIIKTAYTFDDVLLVPNKSDILPREVSTKTKITKTIELNIPLMSAGMDTVTESKMAIAVAREGGIGIIHKNMTIEEQAKEVDRVKRQENGVITDPIFLSQDHLIQDAENLMAQYRISGVPITTQDGKLIGIITNRDIIFETNYQRKISEVMTKDNLITASENTTVEEAKEILKKHKVEKLPLVDSEGRLKGLITMKDIEKVRKFPNAAKDKKGRLLCGAAVGVTGNMMERVDALVKAQVDVITLDTAHGHSKGVLDAVSQIKKVYPDLQVIAGNVATAEATEDLIKAGADCVKVGIGPGSICTTRVVAGVGVPQLTAVMDCAEVGKKYGVPIIADGGLKYSGDIVKALAAGASAAMMGSLFAGCEEAPGEMEIYQGRSYKVYRGMGSLAAMECGSKDRYFQEGNKKLVPEGVEGRVAYKGFVSDTIFQLLGGIKSGMGYLGAKNFEILYETANFVVQTASGQRESHPHDINITKEAPNYSVGQ >NZ_CP043998.1|WP_011967679.1|342849_343326_+|type-II-secretion-system-protein MISLYIKCKFRFKDSMSKKRFCKKRKREAFTLIEMIAVIAIIGILAVAILPKVNGYINEAKKVKVVDQCRKVIMAVESYNLKNDSPLSESTSVSSAISNKGISKYLDGVEFGNLNTSSTSLKNCYDVVNGAEFDFTENTDILNPTTIDNGSTKDDVKK >NZ_CP043998.1|WP_011967678.1|340899_342525_+|chaperonin-GroEL MAKMLKFGEDARRSMQIGVDKLADTVKVTLGPKGRNVVLDKKFGAPLITNDGVSIAREIELEDPYENMGAQLVKEVATKTNDVAGDGTTTATLLAQAIIREGLKNVTAGANPILIRTGIKMAVDKAVEEIQKISKQVDGKEDIARVAAISAADEEVGKLIADAMEKVGNEGVITIEESKSMGTELDVVEGMQFDRGYVSPYMATDTEKMEAVLENPYILITDKKISNIQEILPVLEQIVQSGKKLLIIAEDIEGEAMATLVVNKLRGTFTCVAVKAPGFGDRRKEMLQDIATLTGGTVIAEELGRELKDVTIDMLGTADSVKVSKENTVIVNGKGDSNAIKERINQIKAQIEETSSEFDKEKLQERLAKLAGGVAVIKVGAATETELKEKKLRIEDALAATKAAVEEGIVAGGGTAYVNVINEVAKLTSDVADTQIGINIIVKSLEEPVRQIATNAGVEGSVIIEKVKNSEPGIGYDALHGEYINMIKGGIVDPTKVTRSALQNAASVASTFLTTEAAVADIPAKETPMPGAPGMGMDGMY >NZ_CP043998.1|WP_008427174.1|340523_340808_+|co-chaperone-GroES MNIKPLGERVVIKKLEAEEKTKSGIVLTGTAKERPQEAEVVAVGPGAVVDGNRVAMEVKVGDKVLYSKYAGTEVKVDGEEYTILKQDDILAIVE >NZ_CP043998.1|WP_017209826.1|338626_340117_+|4Fe-4S-dicluster-domain-containing-protein MFQFENQLLALKHEVLTRVAVLAKENNISKEEIEKIPYAMIVGEEPKYRDSVERERNVVLERAKLAAGFKPTGKHGQDLVDIEEEKQILYVIKEACDRCPTKKFQVTDACRNCIAHKCQSACNFGAITYVDGRAYIDPDKCKECGMCKKACPYDAVAEDMRPCKKSCPTGALSYNAEDLSAEITESKCVNCGACMSACPFGAIEDKSSLVKVINRLMDKEEKIYAVVAPAITGQFGPKTTYGQVKNAIKALGFEDMVEAACGADAVTVHESNEFVERMENGDSYMTNSCCPGFLSYIEKMMPDQANKISGTVSPMVATGRYIKSKDKDAKVIFIGPCTAKKSEVLIESIKDAIDYALTFEELVALFDAFGVDPTTCEDIVVDGASIFGRNFAVGGGLTAAIENYVQEKGVNIDFKPVKISGGVEIKKTMTMAKVGKLQGNFIEGMMCEGGCINGAAKIVSVMKAKAPFTKLNQQTSTKSVLANTTLDEYNEINLER >NZ_CP043998.1|WP_039771189.1|350610_351903_+|DNA-helicase MQELDKVIESEREVLGNIIKDNSLLLKAIDALKEDDFYSGPHQLLYKTMKELYKQDNNFDAVILLNKLKDKIKENLITVTEISNISLCGIKSTFKSHLEAVIESSRQRKISKLMQNVANSEKSSEDKINYIQDELIKMNVETEEDKILTTKDLMRMAADKVQEAYETKGGITGVPTGINILDNATNGLERQDMIVLAARPSIGKTAIVLKILENIQGNALLVQLDMGLKAIGCRMLATDTNMENGRISRGRLDDDEWIEFTKSLNRLAQKDNLFFYSPSSATIGKIRTKAKQLKIKHGLDVIILDHIGKLKPEIKGSKYEQASDNSNKIKQVARELEVAFVALSQLSRAVEQRPDKHPILADLRDSGSIEEDADTIGMLYREGYYTAREKGERIRSDTLEVSFQKVRNGRLGTVKFHYDLETQKLLPLNE >NZ_CP043998.1|WP_167514400.1|351913_352072_+|hypothetical-protein MCEYKVIAIIKNIEKEYSNSSTPKELRITIGEILISKIKLGQSKNKKSDNHE >NZ_CP043998.1|WP_039771187.1|352167_352479_+|hypothetical-protein MRMEELRKLINNIIGNEFDHISEFKEKEDFDSNDTIKELSEKVNDVLDKLNELLPDQQDLIGELDDLYSNYCTNACKYYFREGVAAGTTNLKFLEETKIMHLV >NZ_CP043998.1|WP_167514401.1|352637_352781_+|hypothetical-protein MVKLQISYKTDEEKTKIIEILSAAAIVKKISRPRKSGQYYRVYLDIE >NZ_CP043998.1|WP_039771185.1|352836_353730_+|hypothetical-protein MERGKRKEINKLLDKLLKMELEGLRKRFMPYKRRPFLDCKVIIALDCKYKSNNALGYYINTQKDKMQHRYIHKIFITGASVENYFKASQYKKHKQFYKRCAIDELRRVIRHELMHAFVYEEFDSWYWSDIKNINSDYSPIFLSCLYWGGGSTGHNYAYKFLESELYSKIEKCFKYDHVRTILLNYMFEFERIVGNINRNQNEHNVMGLKISFNDKGAGFKKLSYIKAYVKYKEDGEFKKGVTQTMTLGIGFLVTPPKLLENYKRIFDNGAIANAHIEEVLYVDKEENFKNPVIIFEK >NZ_CP043998.1|WP_039771183.1|353926_354106_+|hypothetical-protein MIYFPDQEEPITLTREEYPDLPFKKVYIRNPHKVREGLAKYYEYMIEKFGDGRISISRK >NZ_CP043998.1|WP_084670531.1|354399_354633_+|hypothetical-protein MIRKKVSNGGPQRKRRTTAKKLYDFLELNPTHYSKWIKRNILENDFAIENEDYEVLAIECENPQGGRPSQDYKLSAI >NZ_CP043998.1|WP_167514402.1|354711_354873_+|hypothetical-protein MEEDFVYDGVTMKCLNPEAIPIFKKNLAKLILKLSKIDIDEEASETNFSHYED >NZ_CP043998.1|WP_069187759.1|355066_355390_+|hypothetical-protein MEKTLITRKGLCERWGLSYNTICNYESNGTLTRNPNFESPMYYMEEIIKIESLSEPNPLSPMERRSLENKVRDLKRMVDLLQEQLTKYTMINTESVSLLSIVQKCIK >NZ_CP043998.1|WP_084670533.1|355617_356298_+|ORF6N-domain-containing-protein MKNLIKINNHVLQIKEFNNQRVVTFKDIDLLHDRIEGTAKSNFYENKKHFIENEDYFIIPKSLKCEIPTLKVPNRGITVLTESGYLMLVKSLQDDLAWKVQRELVNNYFRIKNFVNVQKSINEIKVQLETQFNEMVQVKINEIESKCSNYYRPSSLEKSNISRYIKQRLGILKADEEYESVKQRVLLKLGANKWEDVPIETLKDSLNIIDESIRVVKLDRPQQYSM |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_2 | 1316154-1316268 | Orphan |
NA
Consensus repeat of NZ_CP043998_2
|
1 spacers
spacers of NZ_CP043998_2
>2.1|1316187|49|NZ_CP043998|CRISPRCasFinder TAGCTATGCACTAATGAAAAGAGCAGCTACGCTGCAATACGGAACTTTT |
CRISPR arrays and Neighbor proteins around NZ_CP043998_2
The CRISPR arrays of NZ_CP043998_2 >merge|NZ_CP043998|2|1316154-1316268|CRISPRCasFinder CTGCAATTAGGATCTTTTCACCTATAAAAAGAGTAGCTATGCACTAATGAAAAGAGCAGCTACGCTGCAATACGGAACTTTTCTGCAATTAGGATCTTTTCGCCTATAAAAAGAG >NZ_CP043998|2|2|1316154-1316268|CRISPRCasFinder CTGCAATTAGGATCTTTTCACCTATAAAAAGAG TAGCTATGCACTAATGAAAAGAGCAGCTACGCTGCAATACGGAACTTTT CTGCAATTAGGATCTTTTCGCCTATAAAAAGAG
>NZ_CP043998.1|WP_039772330.1|1314451_1315480_+|AI-2E-family-transporter MQLRKHKKAILLGITLLCFICLILAYIFNKSINSIINIIVASFILAYTLTPIRDGFEAKFRISKKISSIVVILIIIGIITACIIVIVPTLFNEISNISNIFDNVSNLLEGMLKKNNLDDFSTTNVIYNEILEKGNAFWTNFSENAVENLMSIGDNAMSLAIIPIMVYYFLCDGNKIYSKMLLLLPTSKRGLTKKILSDIDRVLTRYITSQLMLSGLIGGLTLILLLLLKVKFPLWISILNAILNIIPYFGPIFGAVPAVIVALLDSPIKAFWVIVGMFIIQQLEGDILSPKITGDSTEMHPFVIIILLLIGDKFGGFVGMVLVVPIAVIIKVLYDDINYYLF >NZ_CP043998.1|WP_011968443.1|1313970_1314471_+|photosystem-reaction-center-subunit-H MFKTRDFYFKKVYNIKGKKIGIIEDLYIDFFWGKIVGFKVSNSHLFSKNNYIDMEDVIDIGEDVIIENIKKGEGLTFKEIKYMEVIDTLGNVKGVLEDIIIDIQDYSIKAIVISSGLVDKMIKGKQIILLNRCILGEEYILYTGNEGVMFKTLPHNMDRHNAIKKA >NZ_CP043998.1|WP_023973364.1|1313069_1313366_+|hypothetical-protein MDIFKALKRYDEHGFNSKGFHKNGTKYDEYGFGKRGMHRNGTYYNEEGYDREGYDKKGYDRNGFNSAGFDKEGYNKNGYNILGYDRGGEYLEVRYKWK >NZ_CP043998.1|WP_011968441.1|1311591_1312668_+|tRNA-2-thiouridine(34)-synthase-MnmA MKKKVLVGMSGGVDSSVAAYLLKQQGYDVIGATMQIWQHDEEFEEREGGCCSLSAVDDARRVCDKLDIPFYVLNFRDYFKEKVIDKFVQEYIDGKTPNPCIECNKHLKFDELLRRARGIGADYVATGHYAKIEKRDDRYLLIRSDDDRKDQTYALYNFTQDQLEHTLMPCGDYEKTKIREIAKEIGLAVHNKKDSEEICFISDNNHGKYISEAEPNRVKPGNFVDKSGNILGKHKGIVYYTIGQRKGLGLSLGRPVFVTNINAKTNEVVLGSEDDIFKTELIATDVNFIPFDKLEKEIEVTAKIRYSARPAEATLIPLPNGRVKVIFKEKQRAITKGQSVVFYDDEIVVGGGIIESII >NZ_CP043998.1|WP_011968440.1|1311142_1311580_+|Fe-S-cluster-assembly-scaffold-protein-NifU MIYSEKVMEHFQNPRNVGEIVDANGVGEVGNAKCGDIMKIYLKVEDNIIKDVKFKTFGCGSAIASSSMATELIKGKTLDEAWELTNKAVAEALDGLPPVKMHCSVLAEEAIHKAINDYRAKNGLEVIPMEEHSDEDLHAAVHGEE >NZ_CP043998.1|WP_039772333.1|1309959_1311141_+|cysteine-desulfurase-NifS MKNVYMDYSATTYVKPEVLEEMLPYFTEKFGNPSSFYGISRETKRAIDKAREQIAEALNCLPDEVYFTGGGSEADNWAIKGIASAHKNKGNHIITTKIEHHAVLHTCEYLEKNGFDVTYLDVDEEGFINLDDLRNAITDKTILVSIMFANNEIGTIQPIKEIGEICREKKVFFHTDAVQAVGNVPVDVKEMNIDMLSLAGHKIYGPKGIGVLYIKKGIKIDNLIHGGAQEKNRRAGTENIASIVGLGKALELATNNLEEHMKRLTALREKLIAGLLEVPYTKLNGPRGDKRLPGNVNVCFRFIEGESILLSLDFKGVCASSGSACTSGSLDPSHVLLAIGLPHEIAHGSLRLSMGEGSTEEDVDYVLEVVPPIIERLRNMSPLWDDFLKKGEN >NZ_CP043998.1|WP_039772335.1|1309504_1309957_+|Rrf2-family-transcriptional-regulator MKLSTKGRYGVRAMVDLASNYGGAPVSIKTISKRENLSEYYLEQLFSPLRRANMIRSIRGAQGGYVLCKPPKDITVGDIMTILEGPVEIADCIDGVECDSSDCCATKAVWEKIKRSIDDVMNSITLQDILDDYETIKNNKNNIKIVDRSE >NZ_CP043998.1|WP_077868349.1|1308137_1309382_+|replication-associated-recombination-protein-A MRPLADLMRPNKLEDFVGQQHILGQGKPLYNLIAGKNICNCIFYGPPGTGKTTLANIMANYVDKKFYKLNATVASVKDIQDITNNIDSLLNYNGVVLYIDELQHFNKKQQQALLEFIEDGRITLIASTTENPYFVIHKAIISRCNIFSFKPLTTGDIIVGLKRSIQKLIDEGIEIEYSDEALEYIGEISQGDYRKAYNILELAVNSQVKQVRVISSEYIESLGQSSMRADSSGDEFYNLLSALQKSIRGSDPNAAVHYLARLIKGGNLTAIIRRISVIAAEDIGLAFPNALSVVNSGIELSLKVGLPEARIILSEIVVYLATLPKSNSAYLAIDSAMSDLENINFGDVPMHLKDAHYSGAANLGVGGYKYPHDYPNHYVKQSYLPQELLGKIYYNEQNNKYEESLRKYWAEIKK >NZ_CP043998.1|WP_039773936.1|1306539_1307559_+|N-acetylmuramoyl-L-alanine-amidase-family-protein MKSLKLKKLVAVALVGLTVAALSPIGASAEWKQDSNGWWNTEGNSYSTGWRSINGNWYYFDSTGYMKTGWANDGGTWYYMQPSGEMKTGWINDGATWYYADPSGAMKTGWVNDSGTWYYLQSSGAMKTGWINDGGAWYFASASGAMQTGVVEVNGKVYYLAPNGAMATGNVTINGAVYTFAASGEATGDKIPTPTVAFSGNGAKVTPSTTGGNTGSTGSNGSSGGGGSNHSSGGSTTTFQGDINSKYADYAKVTINKNASDAKATFTVSFNKAADSTTGGDKDYVTQDILVTNANGTDEGIEYNNGEYTAPLGSIVYSTARVYRDGQVGYVTTKQTITK >NZ_CP043998.1|WP_039773935.1|1305123_1306440_+|hypothetical-protein MKNSSIKNVVLEILLMASIMLAVLSVFFKYVLLNEATYLNIFNESGTYRELKDYIYEKIDKVLSSKGINIDIKESIITEDDVKKEADNVVHELLEYLKTGENNVKPMDTSIYKQRVSDMLDSIMDNMIKPTSSDLSFNDKFQIENMGYTKSISQVNGISYIKPALKDGQGNIKVEQLMSKSEAEAKVKEILRQKGLTEEEAIEKATKKGITEEQALKMLKDYGITIDDYESGESNSSTEPENSNDDVTKSQDSNNQRSKEEASSSLNNEGQNAANNIQDGKNPKSKLDSIKGKLGDEASKSIDKEVEKMNFNKIIESNKVHKLALITSTIYKLFWLFIIMPIIIIGILIKVNANGLDSSLKYIGTAFFIAGLILVIVSSSIYHLKIYENINAIPVYLKDTVYNIAGYSLVGLVKYGATALATGILLFIPGVWKRVLNK >NZ_CP043998.1|WP_039772328.1|1316406_1319046_+|alanine--tRNA-ligase MKFMKTNDLREAYLKFFESKDHLRMDSFSLVPKNDKSLLLINAGMAPLKPYFTGLQEPPKRRITTCQKCIRTGDIENVGITSRHGTFFEMLGNFSFADYFKKEIIPWAWEFITEVLELPKDRLYVTIYLDDDEAYEYWTTLTDVDKTHIFRLGKEDNFWEHGAGPCGPCTEIHFNRSEEIPTNADEFVKLADEDKIIEFWNLVFTQFDGDGKGNYEKLANTNIDTGMGLERLATIMQEKNSIFEIDTLENILSEVAKLANVKYGENQKTDISLRLITDHIRSITFMISDDVMPSNEGRGYVLRRLLRRAARHGKTLGIKEAFLCNLCDTVIRDSSEAYPELNSKKEYIKKVIKIEEDKFRETLDSGMEILNGFISELKAKNEKVLSGVDGFKLYDTFGFPMELTKEILEDEGLALDEEAFHEEMKVQRERARSARKVSNYMGTDVKTLDIIPGEIETVFDGYDNDTLNAEVKVLIEGEDFTDAITEGNKAIIVTDVTPLYAEMGGQIGDTGVIFNDGFKANVLDTKKNIGGKIVHFVEVVSGELKVGDTVTIEVDKVRRENIKKNHTATHLLDKALTEVLGSHVHQAGSYVSNDRLRFDFSHFEAMTEEEISRVEDLVNEAITSVTPVVTEVMDLQEAKNSGAIGIFDDKYADKVRVVSAGEYSKELCGGTHIDNTGKIGLFKIISESGIAAGTRRIEAVIGKEAYKIVNEKKDLLKEISTKLKCSEKELLAKLDQQVKELKEKDKEITALKSKFASMGIDDIVSSSRNVKDINVISYELKDVDSDTLRDVCEKVRDKAPNSIVLLMSANAGKVIICAMATKDAVAKGAHCGKLIKEISSMLGGGGGGRPDMAQAGGKMPEKIQEAIEESYKIVETLAK >NZ_CP043998.1|WP_008424959.1|1319182_1319440_+|IreB-family-regulatory-phosphoprotein MSNNIEHTMQFDLSKNKEALTKTILTEVYNSLQEKGYNPINQLVGYLISGDPTYITNYNGARALVRKLERDDILEEVIKSYLEIK >NZ_CP043998.1|WP_011968446.1|1319548_1319965_+|Holliday-junction-resolvase-RuvX MRILGLDLGSKTIGVAVSDPLGFTAQGLTTVRRTNKEKDIAEIKKFCDEYDAKVIVIGLPKNMNGTIGPSGEIAMAFGKVIEEELNVEVKFWDERLTTVAAHKAMLEADLSRNKRKKIVDKVASTYILQGYLDMISRK >NZ_CP043998.1|WP_017210790.1|1320166_1320445_+|DUF1292-domain-containing-protein MDKEAKYVYIPDQEGNDVKFEVVIYFEIEKLKGQYIIATPAFEETDEAYAFKIFKDEDGSDIFIALEDDDEEFEMVLETYETLMNEDGLIEE >NZ_CP043998.1|WP_011968448.1|1320530_1320995_+|transcriptional-repressor MDASNLIDMNALKEDLKKKGYKLTPQRRSIVDTIIENEGQHLTAEEIYDSVKKSCPEIGLATVYRTILLLEELGVISRLDLNDGCSRYEIVHSNETHRHHHLICNICHKVLEVQDDLLEDLESGIEKQYKFKILDHSLKFFGVCDECQKKLSDE >NZ_CP043998.1|WP_039772325.1|1321358_1323026_+|ribonuclease-J MKNERAKIKIIPLGGINEIGKNITAIEYKEDIIIIDCGLKFPDDDMFGIDIVIPDVSYLIKNSEKIKGIFLTHGHEDHIGALPYVLRQLNVPVYGTKLTLGIVETKLKEHGLLASTELVRVKPKDIIKLDSVSVEFIKTNHSIADSVAIAVHTPLGVVLHTGDFKIDYTPIDGEMMDFGRLAELGRKGVLVLMADSTNVERPGYTMTEKVVGETFLRLFSKAKGRLIVATFASNVHRIQQIITAAEAYEKKVAVSGRSMENIVQVAIELGYLTVGKDVLVPVDQISKYPNEKIVVITTGSQGEPMSALARMAASEHRKINVIPGDTVIISATPIPGNEKFVSKVINQLFKKGAQVIYDSQEKIHVSGHACQEELKLMQALVKPKFFVPVHGEYRHLKKHGELAMEVGLSEKNLLIPENGDVIEVARNYIKKNGTVVSGQVFVDGLGVGDVGNIVLRDRKHLSQDGILTIVVTIEKQTGRVVSGPDIISRGFVYVRESEGLMDEAREIVKSVLKTCEEKQITDWATLKSKMRDQLREYLYEKTKRKPMILPIIMEF >NZ_CP043998.1|WP_039772323.1|1323425_1325252_+|translational-GTPase-TypA MELIKREDIRNIAIIAHVDHGKTTLVDALLKQSHTFRANEKVEERVMDSNDLEKERGITILSKNTAVIYNDIKINIVDTPGHADFGGEVERVLKMVDSVLLVVDSYEGPMPQTKFVLKKSLELGLKPIVIINKIDKPNARPTDVIDEVFDLFVELGANDEQLDFQIIYASAREGFAKYNVDDQNNDMTPIFDTILKYVAPPEGYMDEPLQMLVSTLDTNAFVGKIAIGKIHRGTVKRNQTVALLKNDGSSANYKITSIFTYKGLKREEAEEASMGDIVAVSGVIDANIGDTIADSSSPEALPFLEIDEPTLNMNFMVNDSPFAGQEGEFVTSRHLRDRLMKELETNVSLRVKELTPDCFEVSGRGELHLSVLIETMRREGYEFQVSKANVIFREVDGHKEEPIEYLTIDVPEEFMGPVMEKLGPRKAEMVNMTSAVNGYTRLEFTVPARGLIGFRSELMTDTKGNGIMNHVFHSYEKYKGDIPGRSRGSIVSFEAGDSIAYGLYSAQERGQLFIGAGVPVYGGMIVGVSARAEDLEINVCKMKKLTNTRSSGADDALKLTPPVEMSLEQCLEFINADELVEVTPKNIRMRKRVLDSAERRRMISRNKK >NZ_CP043998.1|WP_039772321.1|1325360_1326386_+|endolytic-transglycosylase-MltG MNKYKSFRKLILLIILFLFVITLTFVISYSSTIRKPLKSTEDSIIIEVKQGEGFYDILDKLDKENKLTNKLLIKVNQAIDKRKVNLTEGIYEINTNSSLEELIKSLENKDGDKDLVKLTIPEGYSIEDIAKSVEDKGICSKDEFIKDVKDYKLPSFVKNNNKKRYNLEGYLYPDTYLIEKGSNANDVIKSMLDRFEDVLKQAEDETKVEISDEDVEKIVTIASMIEREARVPGDRPLISSVIYNRLEKDMKLQIDAAVIYALGYHVDVVLNKHLEVDSPYNVYKYKGLPVGPIANPGLDCIKAALLPEKTDYLYYIMKDDGSHYFTNNYEDFLNKKKELGY >NZ_CP043998.1|WP_011968452.1|1326897_1327542_+|O-methyltransferase MSEITYDYMEEYIRSLIPEREGTLKEIEAFARANGVPIVQKETGVFLEFMTSMKKPKRILELGTAIGFSSILMYQAAGTEPEIVTIERDEKMIELANINLKKFNLDHKIKIEEGDCLEILEKLNEPFDLIFMDAGKGHYNHFLPHCLRLLNPDGVIVADNVLFRGMVASQELVKRRKITIVKRMRTYLELVTQDENLITSVIPMGDGIAVTKRR >NZ_CP043998.1|WP_011968453.1|1327548_1328769_+|U32-family-peptidase MIRPEILAPAGNLDKLKIAIDFGADAVYLGGSKLNLRAFADNFTNEQLKEGVEYAHDRNRKVYVTMNVFPHNADLGGVEDYIKELYETGVDAIIASDPAIISAAREVAPNLEIHLSTQANNVNWRAAKFWYEQGVKRIVMARELSLTEIKEMRDNLPEECEIEAFVHGSMCISYSGRCLISNYMVGRDANRGACAQACRFKYHLVEEKRPNEFYPVVEDENGTYIMNSKDLCMIEHIDDVIKAGVYSLKIEGRMKSLYYVAAVVKSYRQAVDAYMKDPDNYKFDPKWMENLNKVSHRVYHTGFYYGQSGEQVYEDSAYIRHADIIGIVRAYDEETKIATIEQKNKVLNGDTVEVLRPEGDNFEVVLHDMTEENGTPIESANRAKMIYKVRVDIPLKEKDLIVKDKE |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_3 | 3575113-3575534 | TypeIII |
II-B
Consensus repeat of NZ_CP043998_3
|
6 spacers
spacers of NZ_CP043998_3
>3.1|3575143|36|NZ_CP043998|CRISPRCasFinder AATTCAAGTCCAAGATGGAGAAAAGCAAAAAACTAA >3.2|3575209|36|NZ_CP043998|CRISPRCasFinder GTGGTTAAACTTTCAAAACTTTGCTAAATGGTTTGA >3.3|3575275|34|NZ_CP043998|CRISPRCasFinder CATATCTTAGAAACGAAGCTGAACTCACTCAGAC >3.4|3575339|35|NZ_CP043998|CRISPRCasFinder GTAGGTGACAACAGTACAGGCAAGTCAGAAATCGG >3.5|3575404|34|NZ_CP043998|CRISPRCasFinder ATGAAAACGTAGTAATAGCTGATGCACAATATGC >3.6|3575468|36|NZ_CP043998|CRISPRCasFinder AGTTTGGTTAAACGAATCTTCTAACGATATATACGT |
cas3,cas6,csm2gr11,csm3gr7,csx10gr5,cas10,csx1 |
CRISPR arrays and Neighbor proteins around NZ_CP043998_3
The CRISPR arrays of NZ_CP043998_3 >merge|NZ_CP043998|3|3575113-3575534|CRISPRCasFinder ATTTAAATACATCTTATGTTAAAGTTAATCAATTCAAGTCCAAGATGGAGAAAAGCAAAAAACTAAGTTTAAATACATCATATGTTAATGTTAATCGTGGTTAAACTTTCAAAACTTTGCTAAATGGTTTGAAATTAAATACATCTCATGTTGAAATTAATCCATATCTTAGAAACGAAGCTGAACTCACTCAGACATTTAAATACATCTCATGTTGAAGTTAATCGTAGGTGACAACAGTACAGGCAAGTCAGAAATCGGATTTAAATACATCATGTGTTAAAGTTAATCATGAAAACGTAGTAATAGCTGATGCACAATATGCATTTAAATACATCCCATGTTAATGTTAATCAGTTTGGTTAAACGAATCTTCTAACGATATATACGTATTTAAATACATCCCATGTTAATGTTAATCT >NZ_CP043998|3|3|3575113-3575534|CRISPRCasFinder ATTTAAATACATCTTATGTTAAAGTTAATC AATTCAAGTCCAAGATGGAGAAAAGCAAAAAACTAA GTTTAAATACATCATATGTTAATGTTAATC GTGGTTAAACTTTCAAAACTTTGCTAAATGGTTTGA AATTAAATACATCTCATGTTGAAATTAATC CATATCTTAGAAACGAAGCTGAACTCACTCAGAC ATTTAAATACATCTCATGTTGAAGTTAATC GTAGGTGACAACAGTACAGGCAAGTCAGAAATCGG ATTTAAATACATCATGTGTTAAAGTTAATC ATGAAAACGTAGTAATAGCTGATGCACAATATGC ATTTAAATACATCCCATGTTAATGTTAATC AGTTTGGTTAAACGAATCTTCTAACGATATATACGT ATTTAAATACATCCCATGTTAATGTTAATCT
>NZ_CP043998.1|WP_039773609.1|3571942_3574606_-|DEAD/DEAH-box-helicase MNISDLIIYNKTMPKREAAYVDYPSNLSEELCGYLSQNGIDKLYSHQAEMFEKAMDRNNIVITTSTASGKTLSFLLPVIQEILSNPLARAIFIYPTKALASDQYRAILPYLEYFGSNRISAGVYDGDTPVNERSRIRKNANIILTNPEMINAAFLPNHSKFGFDFIFSNLKYIVIDELHTYRGAFGSHLANVFRRLGRVCRYYNSSPQYLCSSATIANSVELAEEICGYKFLEVCRDGSPAPKKNYKLVQPPKIMGHDKKYYGQVQSTSVAADLIPDLVENDNSFIAFAKSRRNVEVVLKEARDKLETENFFGASLKDKISGYRGGYTPLERKEIENKMITGVLRGLVSTNALELGIDIGKIDTTVIVGYPGTRASFWQQSGRAGRNGKESTNYLILDNLPFDQYIAINPDWLFESGSENAVIDKNNLLIELAHIRAAAAEIPLTLDDISIFPDLGETIPVLIRASELTNQSGKFAWCGNSFPAGDFSLRNIDKARYKLINKDNNKEITEMDEMQAFREIHNGAIYMHDGVQYQVVKLDLESRTAFAIPFNGNYYTMPGGTTNIRIIQGSKDMEYERTKVTFGDVNVDEIVYMYKKLQFHNHQNLGFEQLEKPLSKDYDTESTWIKIPDNVVTVYRRLLQESQNGNFIRNNHFEGICYAIKNAAMMATMTEQEDIGVVMSNNAIEISQNYDSEVYMFIYDKYVGGLGYSEKVFDLTANIIENAIKMVGGCTCDNGCAACIGDYQLNKAMVLWGLKNLLEEIEAPKDIKLAQYAPATFIKKAFKFNELQKKWKEFCEYMQENGDAFAKFLSTISKVEIDNRTLILVLNNAFYREWVMEESNKKSIINIISFHTDAPMGIELSVRLEDIDEDRNNVKSKLQRRYEDLTE >NZ_CP043998.1|WP_039773611.1|3569857_3571933_-|ATP-dependent-helicase MHYEKELKRLNEYQREAVLDESNACVVNANVGSGKTTVLISKIVYLHYAKNISYKDMIVLTFTNKAANEIKERLMVSDESIKAEELEGFGTFHSVALHLLKEVLPIEKIRYEKDFLVIEPDEELDIALQIIQEEKLKIKYKNRLKKRLEQAMIIEKEEEKISPYDDDIFKLVELLKEEKIKQNKMSFSDILQNANLLLGEHKIEPKWIIIDEVQDSDKIQLDFIDKLEGENTKLFAVGDPNQVIYSWRGSSLNVVYTLKHKYNAKELSLPINYRSSNAILEAARCFQQNGSRLMGDRETENKIIVKNHYNPFNEACYLADKIKEIHKSGVPYKEIAIFYRLQNQSQVFEDVFLKNDIPFEVSMKKTISDSPVLNWMIKLFRFCVNPNDFSSAIYVLSNKEYGEKMTEKTARKIVKEQNIIKSELLEKMHEFLNKCSEIKLAEEIYNYFEFDKYIKPTSATYIDDKEAINALLNIIIEYVKEKQMTFLDGLREFINSSALYGVNILKKDISSDIDSVKLMTLHASKGLEFSYVFITGVNYGLIPLHTRDMEEEEEQRLFFVGITRAKDYLELSYYTNPDYQKAAPGESRYIHMIPEKLIQNDKVKSNNVNLQELKKQIQEAKAQGKKEEVSVTEKVELPVVEEINETLIKQVNHKKYGTGKVLKEDDMMIEVEFENYGVKEFIKAFSELESL >NZ_CP043998.1|WP_039773612.1|3568632_3569739_-|MBL-fold-metallo-hydrolase MIIYIFSFIILLCVGITAFIKLNPAFGGKPTKEQQEFYKNLDNYVNGKFVNETPTGLGMSASDILSMLKDSIAGAENRKPHGEIPVESIDWEKIKSEKDSLTWLGHSSFLLSIDNKKLLIDPILSTIASPVSFAGSKKYKYSENILDIIDKIPPIDAIFISHDHYDHLDYKSIVKLSSKVSHFFVPLGVSSHLMRWGISKEKITELNWWDEMNYQGLTIALTPSRHFSKRGIFGSDATLWGGYAIIGKNINLYYSGDGGYDSHFKKIGEKYGPFDITLIEGAQYDRRWFWAHMKPEEAVHAHLDVKGRNMMLMHWSAFTLAYHGWKEPIERALKEAKKSEISLIAPKIGKTVLLDSNINVPFSSWWDF >NZ_CP043998.1|WP_017212361.1|3568118_3568394_-|hypothetical-protein MGYKDYEMYLESEEVEFDSTKKCGCEDEEKDKKGCYKRNYPTGAALEEAYRAGRKDGYKEGYCEGYDKGSKDGCKQIKEKIAGCIDKIECC >NZ_CP043998.1|WP_017212360.1|3566539_3567583_+|galactose-ABC-transporter-substrate-binding-protein MWILKKVLAMLLLMNITVKFTEISTFYSLNLNNKNTTNIAVLLYKFDPFMSSLKQSLEAIQKDNSDKIKFTFFDGKNNIALQNETIDSISKNDFDLILANLADTSENFVEDIIFNVRSKNLPIVFLDIDPKVVYKVSKYYDKAAFILANSDLAGTVQGKILVNLWNSNKSSLDKNNDNTLQYVLLHGQAKDPVTIDRTKYAISTISNSGINTEQLALVNANWLKSLSKDSIESLFLRYDGRIEAIISNNDAMAIGAVEALQKYGYNKGEKSKNIAIVGIDGLPEAKSLIDKGFMAGTVIQDPKVLAEVFYNVGMNLVNNLSPIENTNYNVVDGEIIVPFPYEEYIKK >NZ_CP043998.1|WP_012059328.1|3565818_3566001_-|hypothetical-protein MVIKDKELDINLINSVEKYLKLNYSELYDKNDLGAVFDEAKKDDELKLKIFNSIRRFIMN >NZ_CP043998.1|WP_039773614.1|3565140_3565767_-|glutamine-amidotransferase MKNTVYLYVFDTMADWEIGYLIAEINSGRYYKKGLMPLKVVTVGITKAPITTMGGLTILPEIELEECSTHDTAALILPGGNTWTEAIHAPIIRMAEKYLEKGIVVGAICGATIGLAMGGVLDKRDHTSNDLGYLKMVCPNYDGEVYYKQECVVNDGSLITASGIAPLEFALHTLKILDVFSPQTLDSWYNLYKTQESKYFFELMNSIQ >NZ_CP043998.1|WP_039773615.1|3564562_3564985_+|membrane-protein MYYISMIITVLATVIYNISQKSINQSTNPFISMIVTYITAIIFSILALIILPIDRNIISSLKQLNWASYVLGISALGLEIGYLYIYRSGWNIAVAPLFVSIISTIILIVVGIFVYKTKLSPMNALGICLSIVGLILMNKK >NZ_CP043998.1|WP_039773617.1|3564160_3564469_+|cupin-domain-containing-protein MKILNINDTTEKIKRKALFTEGTMDSGILFYEPGETMTPHKHSDLDEIFYVISGKGIITINGKDFSIKENDVMLSPHEESHGFTNNGDEKLVILQIKNTIMK >NZ_CP043998.1|WP_023974991.1|3563600_3563936_-|helix-turn-helix-transcriptional-regulator MTCGKLCPIEETVKLIGHKWKVLILRNLHDDGTQRFNQLENGINGISQKMLTQQLRQMEADGLIIRKVYPEVPPRVEYSLSELGKSLKPVLDSMNIWGENYINANKHLYED >NZ_CP043998.1|WP_039773608.1|3575738_3576431_-|CRISPR-associated-endoribonuclease-Cas6 MKVFEILLKVYLLEDIELNDSQNKILKLIDKTLGQDERTLELHNKNDFKNYCFNSFYPLEKDGIYKEGNIYTITIRTVDKYLATYLNNKLANSYTYSIKGLKADLRIIPIKKLKKIYSITPLVIKNDDGYWKNLISFEDFERRLKENLIKKHNNIFQEKINEDFKLYDSIELKNNKPIGTPYKDKTLLGDKISIDISEDDISQDLAYMALGVGMGEMNARGFGFMGYRWV >NZ_CP043998.1|WP_039773607.1|3578080_3578611_-|hypothetical-protein MDIERKKELLLLVDSIAKDIRNDNCGNYTPKIINAIEIAKKYNDMKKFGVVLEKLKSTTFGGNSEKEGYANFVDNIVNKREYKINTLNFEELEFVFSWVGRIIKTKKSNENYDNKNNNFHDRNKNNNYHDRNSNKFNKSNINKYSKEKTKSYYSTKSDSNEGLSSMAEQLMKWKSK >NZ_CP043998.1|WP_051144941.1|3578627_3579497_-|hypothetical-protein MSKPYNFIPLLKTKHTERDDKKCILKGRIDLEIKVLNAMHISEDSYDMNEEEILYKKFYTIGGKYSVPGTSLKGMIRNLAEMVSNSCISPTKDEQRILPNGKEKSCSVAQRCIICDVFGAMGKKSKVKVSDFLYEENSGIVNILGLPVLRTPNVKVSSIYLNEGVLKGYKIYNHGIESILKKGNYNCECLMKNATFKGYILYEDLDEEELKLLCYSIGLAGDFNHKLGYGKPAYYGSIEMTTKDDKYVQYAKDYIADCPDDIKKNIDLLSNIYSFKNAKKTPDYEGIEY >NZ_CP043998.1|WP_051144940.1|3579480_3580281_-|CRISPR-associated-RAMP-protein MFGKLKNEAILTFDIVTQSPLYIREGTDNSLDPSAVDGKYMTTYKDGKLEPFIPGTSLKGAFRSRAERVLRNNGACDIINRHECIPNNKLKPRTGQERYKKSCPICRLFGSNVIKSRVSFSDAYVFNEYKVGQRTCVAIDRITGSAKGSALYSFEYIEDAVFKEKIALQNFEPYQIKLLLYLIEEMNEGFLTLGGLTSKGFGCVKAENLELKIKQYGKDDLSSKNYEFKDYYNAKNVKGFDEISKLVSYVDFTKLKRDGDIDEQTI >NZ_CP043998.1|WP_039773605.1|3580280_3581072_-|CRISPR-associated-RAMP-protein MYLLDRFENKYIIKGILKAESPIHIGTGTVDFSPTAVDTPVIRDENNNPFIPGSSLKGVLRSFMERLLCSGIFNEYKSCNILDKDSGKKMELCISDKEVKEIKEKYKNDSNKEEKIASDIYKKECDVCKLFGGDYFASKLNILDARLISDKAYVQIRDGIAIDRDTLTVNDGAKFGFECVAAGTEFNFEMTVDNLDDNHKDLLKIILNFLQEGEMKVGGKTSAGLGNVKLISKSAYCITKENMREYFINGINDDNKSLLEVSL >NZ_CP043998.1|WP_039773603.1|3581088_3581481_-|hypothetical-protein MEKVNYKKEIIGMVEELGKDKEFWNRINQSRDYRNKEGKLGSSNIRSVATVCQNADCYEEIRLYIEYKIGKGNGWDDTLSNKKKFGQAVIDNMDKIYEMAGRDDKETLKIVSLYFGYLFWKKTAIEKGNL >NZ_CP043998.1|WP_039773602.1|3581486_3582665_-|hypothetical-protein MKVLLDFKSPLLIGSKKHSSNFIESDDVLKGSVVRAAFAKVILDNCCERNEADVKEVNGEKKMNWVYFRDKAGCLQCCFNNICKEFSNVRFSYFYPKGTEIIPQTSMVCKTDKNHGFIDLLVDDTSKGCTKCEGGSRVEFTSGLRTTDENKKPYSVIKSFTTKNKINPYSKTSADGMLYSIETVSCTPIKEDSDNEDESKLLFEGSIEGISENDLILFKRVRVGGDITTGLGKCVVSKLDSLKNEIEFKQIEKFSIDYKARNKNKGFIDKESNYISIKFIGDCILNFDFDGDVYLDTDELKKLWRKPLELEEDIKIEKIYTEVINYRGYDNSSISEDKREEAMTLISKGTVMVFSSKKSLRDLYSYFQVKQKCGFGLENENGFGDFEIYLGR >NZ_CP043998.1|WP_039773600.1|3582664_3583174_-|hypothetical-protein MSIEIYKVTIKTETPFNISSGTQDSGFIKDVSIKDANGKPYISGSTIKGKIRENYRMIQGEEKTKELFGDGGYRPSKIIVDNFYLTENEYSSNIRYGNAIDRYRKVTLDKALYSKEVISGTFHGEIEVNYNGDDSMKENLYLAIKMITSIGGSKSTGLGKVNIDIEEVV >NZ_CP043998.1|WP_051144939.1|3583189_3584932_-|hypothetical-protein MNDDNRGYKSQLYPSNDVYLSNKDIDSKEKRWMYKVNNEEFVPSEYDAEKMYCLISKLKGIDKETNELKKMFSSKDNDEVKDFLRDIYLSLSKGNKNSEKLGWASELKVDVVKGSIYKIKKYFLENNNLKDIRGGSILIDYLNNEVVIETLSKSGFSEENIVYCGGGNIFIVVPSGEGKQICKYLEQAFGNIALTAMNAFESITISLYEFAFDFKHISGVLSEKLEERKKLRLYKVNPDNDLKSINIKGKSINFSEYEEAVELKGSGVVCKLCDIRDAKYLIEESDGLASVCPSCLRKHLSGKAKSIFYDEFKEQTQVELKYNNIKSIDDISDDIAVIYGDGNNMGKIVMEIQNVFEMMYFSRKTDTITKRSVYEAINETMGEDAKFEVIALGGDDIFIIVPAKDSFNITTKIIDKFDKGFNNEITMSIGIVISKSNTPIASLFSIAQQKLKSAKAIIKKSKDIKEGSVDIIELLGNMHINLNHKGVFPVTNSRLKLMLKEMEEFKIKNRASAQLHKISYAQKNMIEEEFELFYYYHESKKKNKDESIDQLIKRIYGKSKERAQPYKIRWDDLILIWKMV >NZ_CP043998.1|WP_039773596.1|3584962_3586660_-|TIGR02221-family-CRISPR-associated-protein MSKKLFTFLGTTDYKPTVYYFNDDSVSEDNYEKLKTPYVQLSLCKKLGYDTELIVFLTPEAREANWISKDKKEGLQEILKKEGINAKAVDIKSGKDVNELWDNFNTIFEEFDKETDVYVDITYSLRSIPIIFMSLLSYARAVKKINIKGIYYGAFEVSETINIDNEELKLAPIFDLTFFNRIQDWANGTEKFLTTGDSRLLSDEILSVKNSVKEIFKTGTIDERNEARLMESIAKSLKAYSEDLFSCRGKKIVTDCKRLKDELNKIKKITISDFTPFSKIIDQLIDKFMPYTGEVINDSIYAIEQGREFRLLQQSYTMLQETLITYLTIGIGLDYKEKKQRKIAEDIMKEFYYRDESNCKLSEEEELFKAKSDEKIMVKIGQLYKEISDYRNDINHNGFSSGMHYSTFENNLYVFIEKFKEIVNNSYETNAEENLHKSAVSILSHKLLKSQEEELNRDWKVKRIVTLPEELRNEWSNINPNVEIEDDFNLVYKLKTFILENTNQEDYVIVQGEWGMTFTIVNMCFELNRVPIYATTERKTKETVKDGQVHSEKVFEHIRFRKYRI |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_4 | 3576519-3577887 | TypeIII |
II-B
Consensus repeat of NZ_CP043998_4
|
20 spacers
spacers of NZ_CP043998_4
>4.1|3576549|36|NZ_CP043998|CRISPRCasFinder TTTAATTCACAAGGAAACAGGGACAGTTATTAAATA >4.2|3576615|38|NZ_CP043998|CRISPRCasFinder ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGA >4.3|3576683|33|NZ_CP043998|CRISPRCasFinder CCATTTCCAAAAAAGACAACTCAGAAAGTTCAT >4.4|3576746|35|NZ_CP043998|CRISPRCasFinder ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAA >4.5|3576811|36|NZ_CP043998|CRISPRCasFinder ATACGAAGCAATATATAAGTACAAAGTAGAAATAAC >4.6|3576877|37|NZ_CP043998|CRISPRCasFinder GTATTGCTGCATTAGCACATAAAGTAACTCAACAATA >4.7|3576549|37|NZ_CP043998|CRT TTTAATTCACAAGGAAACAGGGACAGTTATTAAATAA >4.8|3576615|39|NZ_CP043998|CRT ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGAG >4.9|3576683|34|NZ_CP043998|CRT CCATTTCCAAAAAAGACAACTCAGAAAGTTCATG >4.10|3576746|36|NZ_CP043998|CRT ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAAA >4.11|3576811|37|NZ_CP043998|CRT ATACGAAGCAATATATAAGTACAAAGTAGAAATAACA >4.12|3576877|38|NZ_CP043998|CRT GTATTGCTGCATTAGCACATAAAGTAACTCAACAATAA >4.13|3576944|35|NZ_CP043998|CRT CCCAATAATCTGTCAATATGCGATATACAAAATTA >4.14|3577008|38|NZ_CP043998|CRT GACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGA >4.15|3577075|36|NZ_CP043998|CRT CCAGCAATAGCATATATTGAAAAATACTATAACGCA >4.16|3577140|60|NZ_CP043998|CRT CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGTA >4.17|3577229|37|NZ_CP043998|CRT ACAATCTTATTATAAAATAGCAATATAATTTGCAAAG >4.18|3577295|36|NZ_CP043998|CRT GCAATGGCTAGACATAAAGAACAAAAGATATTCACG >4.19|3577360|37|NZ_CP043998|CRT GTGTGGGTATAATAATTATGGTCAATTAGTATTAGGG >4.20|3577426|37|NZ_CP043998|CRT ATATAATGATCCTAACTTTCAACCTAGTCCTTACGTA >4.21|3577492|35|NZ_CP043998|CRT AAATAGAGCTTGATAAGTATGGACATTTCTTCTTA >4.22|3577556|37|NZ_CP043998|CRT ATTCGTTGGATACCATATCATTGATGCAGACGGAAAA >4.23|3577622|38|NZ_CP043998|CRT AATGATTAAATATTTGATAAAATAATAATGTAAGGAAA >4.24|3577689|37|NZ_CP043998|CRT TGATGACTTCGAAATAATATATGATTCTGAATTTACA >4.25|3577755|37|NZ_CP043998|CRT ATTTGCAAAGATAATATATGAAATGGCTAACAAGTTA >4.26|3577821|38|NZ_CP043998|CRT CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGAA >4.27|3577075|35|NZ_CP043998|CRISPRCasFinder CCAGCAATAGCATATATTGAAAAATACTATAACGC >4.28|3577140|59|NZ_CP043998|CRISPRCasFinder CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGT >4.29|3577229|36|NZ_CP043998|CRISPRCasFinder ACAATCTTATTATAAAATAGCAATATAATTTGCAAA >4.30|3577295|35|NZ_CP043998|CRISPRCasFinder GCAATGGCTAGACATAAAGAACAAAAGATATTCAC >4.31|3577360|36|NZ_CP043998|CRISPRCasFinder GTGTGGGTATAATAATTATGGTCAATTAGTATTAGG >4.32|3577426|36|NZ_CP043998|CRISPRCasFinder ATATAATGATCCTAACTTTCAACCTAGTCCTTACGT >4.33|3577492|34|NZ_CP043998|CRISPRCasFinder AAATAGAGCTTGATAAGTATGGACATTTCTTCTT >4.34|3577556|36|NZ_CP043998|CRISPRCasFinder ATTCGTTGGATACCATATCATTGATGCAGACGGAAA >4.35|3577622|37|NZ_CP043998|CRISPRCasFinder AATGATTAAATATTTGATAAAATAATAATGTAAGGAA >4.36|3577689|36|NZ_CP043998|CRISPRCasFinder,PILER-CR TGATGACTTCGAAATAATATATGATTCTGAATTTAC >4.37|3577755|36|NZ_CP043998|CRISPRCasFinder,PILER-CR ATTTGCAAAGATAATATATGAAATGGCTAACAAGTT >4.38|3577821|37|NZ_CP043998|CRISPRCasFinder,PILER-CR CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGA |
cas6,cas3,csm2gr11,csm3gr7,csx10gr5,cas10,csx1 |
CRISPR arrays and Neighbor proteins around NZ_CP043998_4
The CRISPR arrays of NZ_CP043998_4 >merge|NZ_CP043998|4|3576519-3577887|CRISPRCasFinder,CRT,CRISPRCasFinder,PILER-CR TGTTGAATACATCTAATGTTAAAGTTAATCTTTAATTCACAAGGAAACAGGGACAGTTATTAAATAATTTAAATACATCCCATGTTAAAGTTAATAACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGAGTTTAAATACATCTTATGATAAAGTTAATTCCATTTCCAAAAAAGACAACTCAGAAAGTTCATGTTTAAATACATTATATATTAAAGTTGACCATAGTTGCTGATCAAATCTTTGATGCCGACGGAAAATTTCAATACACCCTATGTTAAGGTTAATCATACGAAGCAATATATAAGTACAAAGTAGAAATAACATTTTAATACATCTCATGTTAAAGTTAATCGTATTGCTGCATTAGCACATAAAGTAACTCAACAATAATTTAAATACATCTTATGTTAAAGTTAATCCCCAATAATCTGTCAATATGCGATATACAAAATTAATTTAAATACATCCATGTTATAGTTAATCGACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGATTTAAATACATCCCATGTTAATGTTAATCCCAGCAATAGCATATATTGAAAAATACTATAACGCATTTAAATACATCTTATGCTAAAGTTAATCCAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGTATCTAAATACATCCTATGTTAATATTAATCACAATCTTATTATAAAATAGCAATATAATTTGCAAAGATTAAACACATCTCATGTTAAGGTTAATCGCAATGGCTAGACATAAAGAACAAAAGATATTCACGTTTAAATACATAACATGTTAAAGTTTATCGTGTGGGTATAATAATTATGGTCAATTAGTATTAGGGTTTAAATACATCTCATGTTAATGTTAATCATATAATGATCCTAACTTTCAACCTAGTCCTTACGTATTCAAATACATCTCATGTTAAAGTTAATCAAATAGAGCTTGATAAGTATGGACATTTCTTCTTATTTAAATACATCCCATGTTAATATTAATCATTCGTTGGATACCATATCATTGATGCAGACGGAAAATTTAAATACATCTCATGCTAAAGTTAATCAATGATTAAATATTTGATAAAATAATAATGTAAGGAAATTCAAATACATCTCATGTTGAAGTTAATCTGATGACTTCGAAATAATATATGATTCTGAATTTACATTCAAATACATCTCATGTTGAAGTTAATCATTTGCAAAGATAATATATGAAATGGCTAACAAGTTATTCAAATACATCTCATGTTGAAGTTAATCCAGGCAGTAATATGGATGCATTATTAGCAAAAATGGAATTCAAATACATCTCATGTTGAAGTTAATC >NZ_CP043998|4|4|3576519-3576944|CRISPRCasFinder TGTTGAATACATCTAATGTTAAAGTTAATC TTTAATTCACAAGGAAACAGGGACAGTTATTAAATA ATTTAAATACATCCCATGTTAAAGTTAATA ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGA GTTTAAATACATCTTATGATAAAGTTAATT CCATTTCCAAAAAAGACAACTCAGAAAGTTCAT GTTTAAATACATTATATATTAAAGTTGACC ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAA ATTTCAATACACCCTATGTTAAGGTTAATC ATACGAAGCAATATATAAGTACAAAGTAGAAATAAC ATTTTAATACATCTCATGTTAAAGTTAATC GTATTGCTGCATTAGCACATAAAGTAACTCAACAATA ATTTAAATACATCTTATGTTAAAGTTAATCCCCAATAATCTGTCAATATGCGATATACAAAATTAATTTAAATACATCCATGTTATAGTTAATCGACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGATTTAAATACATCCCATGTTAATGTTAATC CCAGCAATAGCATATATTGAAAAATACTATAACGC ATTTAAATACATCTTATGCTAAAGTTAATC CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGT ATCTAAATACATCCTATGTTAATATTAATC ACAATCTTATTATAAAATAGCAATATAATTTGCAAA GATTAAACACATCTCATGTTAAGGTTAATC GCAATGGCTAGACATAAAGAACAAAAGATATTCAC GTTTAAATACATAACATGTTAAAGTTTATC GTGTGGGTATAATAATTATGGTCAATTAGTATTAGG GTTTAAATACATCTCATGTTAATGTTAATC ATATAATGATCCTAACTTTCAACCTAGTCCTTACGT ATTCAAATACATCTCATGTTAAAGTTAATC AAATAGAGCTTGATAAGTATGGACATTTCTTCTT ATTTAAATACATCCCATGTTAATATTAATC ATTCGTTGGATACCATATCATTGATGCAGACGGAAA ATTTAAATACATCTCATGCTAAAGTTAATC AATGATTAAATATTTGATAAAATAATAATGTAAGGAA ATTCAAATACATCTCATGTTGAAGTTAATC TGATGACTTCGAAATAATATATGATTCTGAATTTAC ATTCAAATACATCTCATGTTGAAGTTAATC ATTTGCAAAGATAATATATGAAATGGCTAACAAGTT ATTCAAATACATCTCATGTTGAAGTTAATC CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGA >NZ_CP043998|4|1|3576520-3577887|CRT GTTGAATACATCTAATGTTAAAGTTAATC TTTAATTCACAAGGAAACAGGGACAGTTATTAAATAA TTTAAATACATCCCATGTTAAAGTTAATA ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGAG TTTAAATACATCTTATGATAAAGTTAATT CCATTTCCAAAAAAGACAACTCAGAAAGTTCATG TTTAAATACATTATATATTAAAGTTGACC ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAAA TTTCAATACACCCTATGTTAAGGTTAATC ATACGAAGCAATATATAAGTACAAAGTAGAAATAACA TTTTAATACATCTCATGTTAAAGTTAATC GTATTGCTGCATTAGCACATAAAGTAACTCAACAATAA TTTAAATACATCTTATGTTAAAGTTAATC CCCAATAATCTGTCAATATGCGATATACAAAATTA ATTTAAATACATCCATGTTATAGTTAATC GACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGA TTTAAATACATCCCATGTTAATGTTAATC CCAGCAATAGCATATATTGAAAAATACTATAACGCA TTTAAATACATCTTATGCTAAAGTTAATC CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGTA TCTAAATACATCCTATGTTAATATTAATC ACAATCTTATTATAAAATAGCAATATAATTTGCAAAG ATTAAACACATCTCATGTTAAGGTTAATC GCAATGGCTAGACATAAAGAACAAAAGATATTCACG TTTAAATACATAACATGTTAAAGTTTATC GTGTGGGTATAATAATTATGGTCAATTAGTATTAGGG TTTAAATACATCTCATGTTAATGTTAATC ATATAATGATCCTAACTTTCAACCTAGTCCTTACGTA TTCAAATACATCTCATGTTAAAGTTAATC AAATAGAGCTTGATAAGTATGGACATTTCTTCTTA TTTAAATACATCCCATGTTAATATTAATC ATTCGTTGGATACCATATCATTGATGCAGACGGAAAA TTTAAATACATCTCATGCTAAAGTTAATC AATGATTAAATATTTGATAAAATAATAATGTAAGGAAA TTCAAATACATCTCATGTTGAAGTTAATC TGATGACTTCGAAATAATATATGATTCTGAATTTACA TTCAAATACATCTCATGTTGAAGTTAATC ATTTGCAAAGATAATATATGAAATGGCTAACAAGTTA TTCAAATACATCTCATGTTGAAGTTAATC CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGAA TTCAAATACATCTCATGTTGAAGTTAATC >NZ_CP043998|4|5|3577045-3577887|CRISPRCasFinder TTTAATTCACAAGGAAACAGGGACAGTTATTAAATA ATTTAAATACATCCCATGTTAAAGTTAATA ACTGAATTAGAAAGTTACTACTTCAGATTCAAAAAAGA GTTTAAATACATCTTATGATAAAGTTAATT CCATTTCCAAAAAAGACAACTCAGAAAGTTCAT GTTTAAATACATTATATATTAAAGTTGACC ATAGTTGCTGATCAAATCTTTGATGCCGACGGAAA ATTTCAATACACCCTATGTTAAGGTTAATC ATACGAAGCAATATATAAGTACAAAGTAGAAATAAC ATTTTAATACATCTCATGTTAAAGTTAATC GTATTGCTGCATTAGCACATAAAGTAACTCAACAATA ATTTAAATACATCTTATGTTAAAGTTAATCCCCAATAATCTGTCAATATGCGATATACAAAATTAATTTAAATACATCCATGTTATAGTTAATCGACCAGATTCAGGCCACCCAGTAAAAATTATATGTGGATTTAAATACATCCCATGTTAATGTTAATC CCAGCAATAGCATATATTGAAAAATACTATAACGC ATTTAAATACATCTTATGCTAAAGTTAATC CAAATCAAACTGCGTTTATAATTCCAAGCTATGAGAGCTACTTACGCAATTGTAGATGT ATCTAAATACATCCTATGTTAATATTAATC ACAATCTTATTATAAAATAGCAATATAATTTGCAAA GATTAAACACATCTCATGTTAAGGTTAATC GCAATGGCTAGACATAAAGAACAAAAGATATTCAC GTTTAAATACATAACATGTTAAAGTTTATC GTGTGGGTATAATAATTATGGTCAATTAGTATTAGG GTTTAAATACATCTCATGTTAATGTTAATC ATATAATGATCCTAACTTTCAACCTAGTCCTTACGT ATTCAAATACATCTCATGTTAAAGTTAATC AAATAGAGCTTGATAAGTATGGACATTTCTTCTT ATTTAAATACATCCCATGTTAATATTAATC ATTCGTTGGATACCATATCATTGATGCAGACGGAAA ATTTAAATACATCTCATGCTAAAGTTAATC AATGATTAAATATTTGATAAAATAATAATGTAAGGAA ATTCAAATACATCTCATGTTGAAGTTAATC TGATGACTTCGAAATAATATATGATTCTGAATTTAC ATTCAAATACATCTCATGTTGAAGTTAATC ATTTGCAAAGATAATATATGAAATGGCTAACAAGTT ATTCAAATACATCTCATGTTGAAGTTAATC CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGA ATTCAAATACATCTCATGTTGAAGTTAATC >NZ_CP043998|4|1|3577659-3577887|PILER-CR ATTCAAATACATCTCATGTTGAAGTTAATC TGATGACTTCGAAATAATATATGATTCTGAATTTAC ATTCAAATACATCTCATGTTGAAGTTAATC ATTTGCAAAGATAATATATGAAATGGCTAACAAGTT ATTCAAATACATCTCATGTTGAAGTTAATC CAGGCAGTAATATGGATGCATTATTAGCAAAAATGGA ATTCAAATACATCTCATGTTGAAGTTAATC
>NZ_CP043998.1|WP_039773608.1|3575738_3576431_-|CRISPR-associated-endoribonuclease-Cas6 MKVFEILLKVYLLEDIELNDSQNKILKLIDKTLGQDERTLELHNKNDFKNYCFNSFYPLEKDGIYKEGNIYTITIRTVDKYLATYLNNKLANSYTYSIKGLKADLRIIPIKKLKKIYSITPLVIKNDDGYWKNLISFEDFERRLKENLIKKHNNIFQEKINEDFKLYDSIELKNNKPIGTPYKDKTLLGDKISIDISEDDISQDLAYMALGVGMGEMNARGFGFMGYRWV >NZ_CP043998.1|WP_039773609.1|3571942_3574606_-|DEAD/DEAH-box-helicase MNISDLIIYNKTMPKREAAYVDYPSNLSEELCGYLSQNGIDKLYSHQAEMFEKAMDRNNIVITTSTASGKTLSFLLPVIQEILSNPLARAIFIYPTKALASDQYRAILPYLEYFGSNRISAGVYDGDTPVNERSRIRKNANIILTNPEMINAAFLPNHSKFGFDFIFSNLKYIVIDELHTYRGAFGSHLANVFRRLGRVCRYYNSSPQYLCSSATIANSVELAEEICGYKFLEVCRDGSPAPKKNYKLVQPPKIMGHDKKYYGQVQSTSVAADLIPDLVENDNSFIAFAKSRRNVEVVLKEARDKLETENFFGASLKDKISGYRGGYTPLERKEIENKMITGVLRGLVSTNALELGIDIGKIDTTVIVGYPGTRASFWQQSGRAGRNGKESTNYLILDNLPFDQYIAINPDWLFESGSENAVIDKNNLLIELAHIRAAAAEIPLTLDDISIFPDLGETIPVLIRASELTNQSGKFAWCGNSFPAGDFSLRNIDKARYKLINKDNNKEITEMDEMQAFREIHNGAIYMHDGVQYQVVKLDLESRTAFAIPFNGNYYTMPGGTTNIRIIQGSKDMEYERTKVTFGDVNVDEIVYMYKKLQFHNHQNLGFEQLEKPLSKDYDTESTWIKIPDNVVTVYRRLLQESQNGNFIRNNHFEGICYAIKNAAMMATMTEQEDIGVVMSNNAIEISQNYDSEVYMFIYDKYVGGLGYSEKVFDLTANIIENAIKMVGGCTCDNGCAACIGDYQLNKAMVLWGLKNLLEEIEAPKDIKLAQYAPATFIKKAFKFNELQKKWKEFCEYMQENGDAFAKFLSTISKVEIDNRTLILVLNNAFYREWVMEESNKKSIINIISFHTDAPMGIELSVRLEDIDEDRNNVKSKLQRRYEDLTE >NZ_CP043998.1|WP_039773611.1|3569857_3571933_-|ATP-dependent-helicase MHYEKELKRLNEYQREAVLDESNACVVNANVGSGKTTVLISKIVYLHYAKNISYKDMIVLTFTNKAANEIKERLMVSDESIKAEELEGFGTFHSVALHLLKEVLPIEKIRYEKDFLVIEPDEELDIALQIIQEEKLKIKYKNRLKKRLEQAMIIEKEEEKISPYDDDIFKLVELLKEEKIKQNKMSFSDILQNANLLLGEHKIEPKWIIIDEVQDSDKIQLDFIDKLEGENTKLFAVGDPNQVIYSWRGSSLNVVYTLKHKYNAKELSLPINYRSSNAILEAARCFQQNGSRLMGDRETENKIIVKNHYNPFNEACYLADKIKEIHKSGVPYKEIAIFYRLQNQSQVFEDVFLKNDIPFEVSMKKTISDSPVLNWMIKLFRFCVNPNDFSSAIYVLSNKEYGEKMTEKTARKIVKEQNIIKSELLEKMHEFLNKCSEIKLAEEIYNYFEFDKYIKPTSATYIDDKEAINALLNIIIEYVKEKQMTFLDGLREFINSSALYGVNILKKDISSDIDSVKLMTLHASKGLEFSYVFITGVNYGLIPLHTRDMEEEEEQRLFFVGITRAKDYLELSYYTNPDYQKAAPGESRYIHMIPEKLIQNDKVKSNNVNLQELKKQIQEAKAQGKKEEVSVTEKVELPVVEEINETLIKQVNHKKYGTGKVLKEDDMMIEVEFENYGVKEFIKAFSELESL >NZ_CP043998.1|WP_039773612.1|3568632_3569739_-|MBL-fold-metallo-hydrolase MIIYIFSFIILLCVGITAFIKLNPAFGGKPTKEQQEFYKNLDNYVNGKFVNETPTGLGMSASDILSMLKDSIAGAENRKPHGEIPVESIDWEKIKSEKDSLTWLGHSSFLLSIDNKKLLIDPILSTIASPVSFAGSKKYKYSENILDIIDKIPPIDAIFISHDHYDHLDYKSIVKLSSKVSHFFVPLGVSSHLMRWGISKEKITELNWWDEMNYQGLTIALTPSRHFSKRGIFGSDATLWGGYAIIGKNINLYYSGDGGYDSHFKKIGEKYGPFDITLIEGAQYDRRWFWAHMKPEEAVHAHLDVKGRNMMLMHWSAFTLAYHGWKEPIERALKEAKKSEISLIAPKIGKTVLLDSNINVPFSSWWDF >NZ_CP043998.1|WP_017212361.1|3568118_3568394_-|hypothetical-protein MGYKDYEMYLESEEVEFDSTKKCGCEDEEKDKKGCYKRNYPTGAALEEAYRAGRKDGYKEGYCEGYDKGSKDGCKQIKEKIAGCIDKIECC >NZ_CP043998.1|WP_017212360.1|3566539_3567583_+|galactose-ABC-transporter-substrate-binding-protein MWILKKVLAMLLLMNITVKFTEISTFYSLNLNNKNTTNIAVLLYKFDPFMSSLKQSLEAIQKDNSDKIKFTFFDGKNNIALQNETIDSISKNDFDLILANLADTSENFVEDIIFNVRSKNLPIVFLDIDPKVVYKVSKYYDKAAFILANSDLAGTVQGKILVNLWNSNKSSLDKNNDNTLQYVLLHGQAKDPVTIDRTKYAISTISNSGINTEQLALVNANWLKSLSKDSIESLFLRYDGRIEAIISNNDAMAIGAVEALQKYGYNKGEKSKNIAIVGIDGLPEAKSLIDKGFMAGTVIQDPKVLAEVFYNVGMNLVNNLSPIENTNYNVVDGEIIVPFPYEEYIKK >NZ_CP043998.1|WP_012059328.1|3565818_3566001_-|hypothetical-protein MVIKDKELDINLINSVEKYLKLNYSELYDKNDLGAVFDEAKKDDELKLKIFNSIRRFIMN >NZ_CP043998.1|WP_039773614.1|3565140_3565767_-|glutamine-amidotransferase MKNTVYLYVFDTMADWEIGYLIAEINSGRYYKKGLMPLKVVTVGITKAPITTMGGLTILPEIELEECSTHDTAALILPGGNTWTEAIHAPIIRMAEKYLEKGIVVGAICGATIGLAMGGVLDKRDHTSNDLGYLKMVCPNYDGEVYYKQECVVNDGSLITASGIAPLEFALHTLKILDVFSPQTLDSWYNLYKTQESKYFFELMNSIQ >NZ_CP043998.1|WP_039773615.1|3564562_3564985_+|membrane-protein MYYISMIITVLATVIYNISQKSINQSTNPFISMIVTYITAIIFSILALIILPIDRNIISSLKQLNWASYVLGISALGLEIGYLYIYRSGWNIAVAPLFVSIISTIILIVVGIFVYKTKLSPMNALGICLSIVGLILMNKK >NZ_CP043998.1|WP_039773617.1|3564160_3564469_+|cupin-domain-containing-protein MKILNINDTTEKIKRKALFTEGTMDSGILFYEPGETMTPHKHSDLDEIFYVISGKGIITINGKDFSIKENDVMLSPHEESHGFTNNGDEKLVILQIKNTIMK >NZ_CP043998.1|WP_039773607.1|3578080_3578611_-|hypothetical-protein MDIERKKELLLLVDSIAKDIRNDNCGNYTPKIINAIEIAKKYNDMKKFGVVLEKLKSTTFGGNSEKEGYANFVDNIVNKREYKINTLNFEELEFVFSWVGRIIKTKKSNENYDNKNNNFHDRNKNNNYHDRNSNKFNKSNINKYSKEKTKSYYSTKSDSNEGLSSMAEQLMKWKSK >NZ_CP043998.1|WP_051144941.1|3578627_3579497_-|hypothetical-protein MSKPYNFIPLLKTKHTERDDKKCILKGRIDLEIKVLNAMHISEDSYDMNEEEILYKKFYTIGGKYSVPGTSLKGMIRNLAEMVSNSCISPTKDEQRILPNGKEKSCSVAQRCIICDVFGAMGKKSKVKVSDFLYEENSGIVNILGLPVLRTPNVKVSSIYLNEGVLKGYKIYNHGIESILKKGNYNCECLMKNATFKGYILYEDLDEEELKLLCYSIGLAGDFNHKLGYGKPAYYGSIEMTTKDDKYVQYAKDYIADCPDDIKKNIDLLSNIYSFKNAKKTPDYEGIEY >NZ_CP043998.1|WP_051144940.1|3579480_3580281_-|CRISPR-associated-RAMP-protein MFGKLKNEAILTFDIVTQSPLYIREGTDNSLDPSAVDGKYMTTYKDGKLEPFIPGTSLKGAFRSRAERVLRNNGACDIINRHECIPNNKLKPRTGQERYKKSCPICRLFGSNVIKSRVSFSDAYVFNEYKVGQRTCVAIDRITGSAKGSALYSFEYIEDAVFKEKIALQNFEPYQIKLLLYLIEEMNEGFLTLGGLTSKGFGCVKAENLELKIKQYGKDDLSSKNYEFKDYYNAKNVKGFDEISKLVSYVDFTKLKRDGDIDEQTI >NZ_CP043998.1|WP_039773605.1|3580280_3581072_-|CRISPR-associated-RAMP-protein MYLLDRFENKYIIKGILKAESPIHIGTGTVDFSPTAVDTPVIRDENNNPFIPGSSLKGVLRSFMERLLCSGIFNEYKSCNILDKDSGKKMELCISDKEVKEIKEKYKNDSNKEEKIASDIYKKECDVCKLFGGDYFASKLNILDARLISDKAYVQIRDGIAIDRDTLTVNDGAKFGFECVAAGTEFNFEMTVDNLDDNHKDLLKIILNFLQEGEMKVGGKTSAGLGNVKLISKSAYCITKENMREYFINGINDDNKSLLEVSL >NZ_CP043998.1|WP_039773603.1|3581088_3581481_-|hypothetical-protein MEKVNYKKEIIGMVEELGKDKEFWNRINQSRDYRNKEGKLGSSNIRSVATVCQNADCYEEIRLYIEYKIGKGNGWDDTLSNKKKFGQAVIDNMDKIYEMAGRDDKETLKIVSLYFGYLFWKKTAIEKGNL >NZ_CP043998.1|WP_039773602.1|3581486_3582665_-|hypothetical-protein MKVLLDFKSPLLIGSKKHSSNFIESDDVLKGSVVRAAFAKVILDNCCERNEADVKEVNGEKKMNWVYFRDKAGCLQCCFNNICKEFSNVRFSYFYPKGTEIIPQTSMVCKTDKNHGFIDLLVDDTSKGCTKCEGGSRVEFTSGLRTTDENKKPYSVIKSFTTKNKINPYSKTSADGMLYSIETVSCTPIKEDSDNEDESKLLFEGSIEGISENDLILFKRVRVGGDITTGLGKCVVSKLDSLKNEIEFKQIEKFSIDYKARNKNKGFIDKESNYISIKFIGDCILNFDFDGDVYLDTDELKKLWRKPLELEEDIKIEKIYTEVINYRGYDNSSISEDKREEAMTLISKGTVMVFSSKKSLRDLYSYFQVKQKCGFGLENENGFGDFEIYLGR >NZ_CP043998.1|WP_039773600.1|3582664_3583174_-|hypothetical-protein MSIEIYKVTIKTETPFNISSGTQDSGFIKDVSIKDANGKPYISGSTIKGKIRENYRMIQGEEKTKELFGDGGYRPSKIIVDNFYLTENEYSSNIRYGNAIDRYRKVTLDKALYSKEVISGTFHGEIEVNYNGDDSMKENLYLAIKMITSIGGSKSTGLGKVNIDIEEVV >NZ_CP043998.1|WP_051144939.1|3583189_3584932_-|hypothetical-protein MNDDNRGYKSQLYPSNDVYLSNKDIDSKEKRWMYKVNNEEFVPSEYDAEKMYCLISKLKGIDKETNELKKMFSSKDNDEVKDFLRDIYLSLSKGNKNSEKLGWASELKVDVVKGSIYKIKKYFLENNNLKDIRGGSILIDYLNNEVVIETLSKSGFSEENIVYCGGGNIFIVVPSGEGKQICKYLEQAFGNIALTAMNAFESITISLYEFAFDFKHISGVLSEKLEERKKLRLYKVNPDNDLKSINIKGKSINFSEYEEAVELKGSGVVCKLCDIRDAKYLIEESDGLASVCPSCLRKHLSGKAKSIFYDEFKEQTQVELKYNNIKSIDDISDDIAVIYGDGNNMGKIVMEIQNVFEMMYFSRKTDTITKRSVYEAINETMGEDAKFEVIALGGDDIFIIVPAKDSFNITTKIIDKFDKGFNNEITMSIGIVISKSNTPIASLFSIAQQKLKSAKAIIKKSKDIKEGSVDIIELLGNMHINLNHKGVFPVTNSRLKLMLKEMEEFKIKNRASAQLHKISYAQKNMIEEEFELFYYYHESKKKNKDESIDQLIKRIYGKSKERAQPYKIRWDDLILIWKMV >NZ_CP043998.1|WP_039773596.1|3584962_3586660_-|TIGR02221-family-CRISPR-associated-protein MSKKLFTFLGTTDYKPTVYYFNDDSVSEDNYEKLKTPYVQLSLCKKLGYDTELIVFLTPEAREANWISKDKKEGLQEILKKEGINAKAVDIKSGKDVNELWDNFNTIFEEFDKETDVYVDITYSLRSIPIIFMSLLSYARAVKKINIKGIYYGAFEVSETINIDNEELKLAPIFDLTFFNRIQDWANGTEKFLTTGDSRLLSDEILSVKNSVKEIFKTGTIDERNEARLMESIAKSLKAYSEDLFSCRGKKIVTDCKRLKDELNKIKKITISDFTPFSKIIDQLIDKFMPYTGEVINDSIYAIEQGREFRLLQQSYTMLQETLITYLTIGIGLDYKEKKQRKIAEDIMKEFYYRDESNCKLSEEEELFKAKSDEKIMVKIGQLYKEISDYRNDINHNGFSSGMHYSTFENNLYVFIEKFKEIVNNSYETNAEENLHKSAVSILSHKLLKSQEEELNRDWKVKRIVTLPEELRNEWSNINPNVEIEDDFNLVYKLKTFILENTNQEDYVIVQGEWGMTFTIVNMCFELNRVPIYATTERKTKETVKDGQVHSEKVFEHIRFRKYRI >NZ_CP043998.1|WP_039773595.1|3588010_3588583_+|sigma-70-family-RNA-polymerase-sigma-factor MDFNYIETLVTRCKDNDERAKEKLAEEFGQLIYNISKRTFIDGYNSYDIIQECYQSLFKSISMYNLDKHRFVAYATNAIKNNMNDLIKRIKTRSSTEGNNALSLHDNFEKDIPSQEISPETSLCEMCDYEDLRLALKNLTKDEKELIDFVFFKNYTVLDYAHIKNMCYSTAIVRKKNILRKIHNNISFYY |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_5 | 3586855-3587474 | TypeIII |
II-B
Consensus repeat of NZ_CP043998_5
|
9 spacers
spacers of NZ_CP043998_5
>5.1|3586885|35|NZ_CP043998|CRISPRCasFinder,CRT TTCAAGATGGACGCATTCCCAGACTATACTAAGTT >5.2|3586950|35|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR AGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAA >5.3|3587015|36|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR GTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTT >5.4|3587081|35|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR AAAGATTTTGAGATAAGAAAAGACGATTCAGATTA >5.5|3587146|34|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR TCTTTATCTTTATTTATTCCGTAAGTGGTCCTAT >5.6|3587210|36|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR AATAGATTATACAACATCAGTCGCATATAATTACAA >5.7|3587276|38|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR TTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGA >5.8|3587344|36|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR GTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTT >5.9|3587410|35|NZ_CP043998|CRISPRCasFinder,CRT,PILER-CR CACATACCGTAAGAGTTACCACGTATTTTTTTATA |
csx1,cas10,csm3gr7,csx10gr5,csm2gr11,cas6 |
CRISPR arrays and Neighbor proteins around NZ_CP043998_5
The CRISPR arrays of NZ_CP043998_5 >merge|NZ_CP043998|5|3586855-3587474|CRISPRCasFinder,CRT,PILER-CR GTATTATTACATCTCATGTTAATATTAAACTTCAAGATGGACGCATTCCCAGACTATACTAAGTTATTTAAATACATCTCATGTTAATATTAAACAGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAAATTTAAATACATCTCATGTTAATCTTAAACGTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTTATTTAAATACATCTCATGTTAATCTTAAACAAAGATTTTGAGATAAGAAAAGACGATTCAGATTAATTTAAATACATCTCATGTTAATCTTAAACTCTTTATCTTTATTTATTCCGTAAGTGGTCCTATATTTAAATACATCTCATGTTAATCTTAAACAATAGATTATACAACATCAGTCGCATATAATTACAAATTTAAATACATCTCATGTTAATCTTAAACTTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGAATTTAAATACATCTCATGTTAATCTTAAACGTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTTATTTAAATACATCTCATGTTAATCTTAAACCACATACCGTAAGAGTTACCACGTATTTTTTTATAATTTAAATACATCTCATGTTAATCTTAAAC >NZ_CP043998|5|6|3586855-3587474|CRISPRCasFinder GTATTATTACATCTCATGTTAATATTAAAC TTCAAGATGGACGCATTCCCAGACTATACTAAGTT ATTTAAATACATCTCATGTTAATATTAAAC AGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAA ATTTAAATACATCTCATGTTAATCTTAAAC GTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTT ATTTAAATACATCTCATGTTAATCTTAAAC AAAGATTTTGAGATAAGAAAAGACGATTCAGATTA ATTTAAATACATCTCATGTTAATCTTAAAC TCTTTATCTTTATTTATTCCGTAAGTGGTCCTAT ATTTAAATACATCTCATGTTAATCTTAAAC AATAGATTATACAACATCAGTCGCATATAATTACAA ATTTAAATACATCTCATGTTAATCTTAAAC TTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGA ATTTAAATACATCTCATGTTAATCTTAAAC GTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTT ATTTAAATACATCTCATGTTAATCTTAAAC CACATACCGTAAGAGTTACCACGTATTTTTTTATA ATTTAAATACATCTCATGTTAATCTTAAAC >NZ_CP043998|5|2|3586855-3587474|CRT GTATTATTACATCTCATGTTAATATTAAAC TTCAAGATGGACGCATTCCCAGACTATACTAAGTT ATTTAAATACATCTCATGTTAATATTAAAC AGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAA ATTTAAATACATCTCATGTTAATCTTAAAC GTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTT ATTTAAATACATCTCATGTTAATCTTAAAC AAAGATTTTGAGATAAGAAAAGACGATTCAGATTA ATTTAAATACATCTCATGTTAATCTTAAAC TCTTTATCTTTATTTATTCCGTAAGTGGTCCTAT ATTTAAATACATCTCATGTTAATCTTAAAC AATAGATTATACAACATCAGTCGCATATAATTACAA ATTTAAATACATCTCATGTTAATCTTAAAC TTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGA ATTTAAATACATCTCATGTTAATCTTAAAC GTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTT ATTTAAATACATCTCATGTTAATCTTAAAC CACATACCGTAAGAGTTACCACGTATTTTTTTATA ATTTAAATACATCTCATGTTAATCTTAAAC >NZ_CP043998|5|2|3586920-3587474|PILER-CR ATTTAAATACATCTCATGTTAATATTAAAC AGCTTGAATGTGAGTGTTCAATTAGTAGATAAAAA ATTTAAATACATCTCATGTTAATCTTAAAC GTTAGGGGTTGCAGCAGCCAAAGTTGGTATGGATTT ATTTAAATACATCTCATGTTAATCTTAAAC AAAGATTTTGAGATAAGAAAAGACGATTCAGATTA ATTTAAATACATCTCATGTTAATCTTAAAC TCTTTATCTTTATTTATTCCGTAAGTGGTCCTAT ATTTAAATACATCTCATGTTAATCTTAAAC AATAGATTATACAACATCAGTCGCATATAATTACAA ATTTAAATACATCTCATGTTAATCTTAAAC TTCTTTAGGAGCTATAACAAAGTTCGAGAAGTTATTGA ATTTAAATACATCTCATGTTAATCTTAAAC GTTCCAACTATAGTTCTTTTTGAGTCAATTTCATTT ATTTAAATACATCTCATGTTAATCTTAAAC CACATACCGTAAGAGTTACCACGTATTTTTTTATA ATTTAAATACATCTCATGTTAATCTTAAAC
>NZ_CP043998.1|WP_039773596.1|3584962_3586660_-|TIGR02221-family-CRISPR-associated-protein MSKKLFTFLGTTDYKPTVYYFNDDSVSEDNYEKLKTPYVQLSLCKKLGYDTELIVFLTPEAREANWISKDKKEGLQEILKKEGINAKAVDIKSGKDVNELWDNFNTIFEEFDKETDVYVDITYSLRSIPIIFMSLLSYARAVKKINIKGIYYGAFEVSETINIDNEELKLAPIFDLTFFNRIQDWANGTEKFLTTGDSRLLSDEILSVKNSVKEIFKTGTIDERNEARLMESIAKSLKAYSEDLFSCRGKKIVTDCKRLKDELNKIKKITISDFTPFSKIIDQLIDKFMPYTGEVINDSIYAIEQGREFRLLQQSYTMLQETLITYLTIGIGLDYKEKKQRKIAEDIMKEFYYRDESNCKLSEEEELFKAKSDEKIMVKIGQLYKEISDYRNDINHNGFSSGMHYSTFENNLYVFIEKFKEIVNNSYETNAEENLHKSAVSILSHKLLKSQEEELNRDWKVKRIVTLPEELRNEWSNINPNVEIEDDFNLVYKLKTFILENTNQEDYVIVQGEWGMTFTIVNMCFELNRVPIYATTERKTKETVKDGQVHSEKVFEHIRFRKYRI >NZ_CP043998.1|WP_051144939.1|3583189_3584932_-|hypothetical-protein MNDDNRGYKSQLYPSNDVYLSNKDIDSKEKRWMYKVNNEEFVPSEYDAEKMYCLISKLKGIDKETNELKKMFSSKDNDEVKDFLRDIYLSLSKGNKNSEKLGWASELKVDVVKGSIYKIKKYFLENNNLKDIRGGSILIDYLNNEVVIETLSKSGFSEENIVYCGGGNIFIVVPSGEGKQICKYLEQAFGNIALTAMNAFESITISLYEFAFDFKHISGVLSEKLEERKKLRLYKVNPDNDLKSINIKGKSINFSEYEEAVELKGSGVVCKLCDIRDAKYLIEESDGLASVCPSCLRKHLSGKAKSIFYDEFKEQTQVELKYNNIKSIDDISDDIAVIYGDGNNMGKIVMEIQNVFEMMYFSRKTDTITKRSVYEAINETMGEDAKFEVIALGGDDIFIIVPAKDSFNITTKIIDKFDKGFNNEITMSIGIVISKSNTPIASLFSIAQQKLKSAKAIIKKSKDIKEGSVDIIELLGNMHINLNHKGVFPVTNSRLKLMLKEMEEFKIKNRASAQLHKISYAQKNMIEEEFELFYYYHESKKKNKDESIDQLIKRIYGKSKERAQPYKIRWDDLILIWKMV >NZ_CP043998.1|WP_039773600.1|3582664_3583174_-|hypothetical-protein MSIEIYKVTIKTETPFNISSGTQDSGFIKDVSIKDANGKPYISGSTIKGKIRENYRMIQGEEKTKELFGDGGYRPSKIIVDNFYLTENEYSSNIRYGNAIDRYRKVTLDKALYSKEVISGTFHGEIEVNYNGDDSMKENLYLAIKMITSIGGSKSTGLGKVNIDIEEVV >NZ_CP043998.1|WP_039773602.1|3581486_3582665_-|hypothetical-protein MKVLLDFKSPLLIGSKKHSSNFIESDDVLKGSVVRAAFAKVILDNCCERNEADVKEVNGEKKMNWVYFRDKAGCLQCCFNNICKEFSNVRFSYFYPKGTEIIPQTSMVCKTDKNHGFIDLLVDDTSKGCTKCEGGSRVEFTSGLRTTDENKKPYSVIKSFTTKNKINPYSKTSADGMLYSIETVSCTPIKEDSDNEDESKLLFEGSIEGISENDLILFKRVRVGGDITTGLGKCVVSKLDSLKNEIEFKQIEKFSIDYKARNKNKGFIDKESNYISIKFIGDCILNFDFDGDVYLDTDELKKLWRKPLELEEDIKIEKIYTEVINYRGYDNSSISEDKREEAMTLISKGTVMVFSSKKSLRDLYSYFQVKQKCGFGLENENGFGDFEIYLGR >NZ_CP043998.1|WP_039773603.1|3581088_3581481_-|hypothetical-protein MEKVNYKKEIIGMVEELGKDKEFWNRINQSRDYRNKEGKLGSSNIRSVATVCQNADCYEEIRLYIEYKIGKGNGWDDTLSNKKKFGQAVIDNMDKIYEMAGRDDKETLKIVSLYFGYLFWKKTAIEKGNL >NZ_CP043998.1|WP_039773605.1|3580280_3581072_-|CRISPR-associated-RAMP-protein MYLLDRFENKYIIKGILKAESPIHIGTGTVDFSPTAVDTPVIRDENNNPFIPGSSLKGVLRSFMERLLCSGIFNEYKSCNILDKDSGKKMELCISDKEVKEIKEKYKNDSNKEEKIASDIYKKECDVCKLFGGDYFASKLNILDARLISDKAYVQIRDGIAIDRDTLTVNDGAKFGFECVAAGTEFNFEMTVDNLDDNHKDLLKIILNFLQEGEMKVGGKTSAGLGNVKLISKSAYCITKENMREYFINGINDDNKSLLEVSL >NZ_CP043998.1|WP_051144940.1|3579480_3580281_-|CRISPR-associated-RAMP-protein MFGKLKNEAILTFDIVTQSPLYIREGTDNSLDPSAVDGKYMTTYKDGKLEPFIPGTSLKGAFRSRAERVLRNNGACDIINRHECIPNNKLKPRTGQERYKKSCPICRLFGSNVIKSRVSFSDAYVFNEYKVGQRTCVAIDRITGSAKGSALYSFEYIEDAVFKEKIALQNFEPYQIKLLLYLIEEMNEGFLTLGGLTSKGFGCVKAENLELKIKQYGKDDLSSKNYEFKDYYNAKNVKGFDEISKLVSYVDFTKLKRDGDIDEQTI >NZ_CP043998.1|WP_051144941.1|3578627_3579497_-|hypothetical-protein MSKPYNFIPLLKTKHTERDDKKCILKGRIDLEIKVLNAMHISEDSYDMNEEEILYKKFYTIGGKYSVPGTSLKGMIRNLAEMVSNSCISPTKDEQRILPNGKEKSCSVAQRCIICDVFGAMGKKSKVKVSDFLYEENSGIVNILGLPVLRTPNVKVSSIYLNEGVLKGYKIYNHGIESILKKGNYNCECLMKNATFKGYILYEDLDEEELKLLCYSIGLAGDFNHKLGYGKPAYYGSIEMTTKDDKYVQYAKDYIADCPDDIKKNIDLLSNIYSFKNAKKTPDYEGIEY >NZ_CP043998.1|WP_039773607.1|3578080_3578611_-|hypothetical-protein MDIERKKELLLLVDSIAKDIRNDNCGNYTPKIINAIEIAKKYNDMKKFGVVLEKLKSTTFGGNSEKEGYANFVDNIVNKREYKINTLNFEELEFVFSWVGRIIKTKKSNENYDNKNNNFHDRNKNNNYHDRNSNKFNKSNINKYSKEKTKSYYSTKSDSNEGLSSMAEQLMKWKSK >NZ_CP043998.1|WP_039773608.1|3575738_3576431_-|CRISPR-associated-endoribonuclease-Cas6 MKVFEILLKVYLLEDIELNDSQNKILKLIDKTLGQDERTLELHNKNDFKNYCFNSFYPLEKDGIYKEGNIYTITIRTVDKYLATYLNNKLANSYTYSIKGLKADLRIIPIKKLKKIYSITPLVIKNDDGYWKNLISFEDFERRLKENLIKKHNNIFQEKINEDFKLYDSIELKNNKPIGTPYKDKTLLGDKISIDISEDDISQDLAYMALGVGMGEMNARGFGFMGYRWV >NZ_CP043998.1|WP_039773595.1|3588010_3588583_+|sigma-70-family-RNA-polymerase-sigma-factor MDFNYIETLVTRCKDNDERAKEKLAEEFGQLIYNISKRTFIDGYNSYDIIQECYQSLFKSISMYNLDKHRFVAYATNAIKNNMNDLIKRIKTRSSTEGNNALSLHDNFEKDIPSQEISPETSLCEMCDYEDLRLALKNLTKDEKELIDFVFFKNYTVLDYAHIKNMCYSTAIVRKKNILRKIHNNISFYY >NZ_CP043998.1|WP_039773594.1|3589037_3590429_-|MATE-family-efflux-transporter MTELENFILEGSIKKLLFKFSIPAISVFLANVLYNIIDAIFIGNQPNGSLGIAALTIVFPIQQIILALSQMIGVGIASITSRSLGAGDKLRAEKAVGTALTSSVLLGILIMVIGLVFIRPMLYIFGSLENILPYAVTFFRITLYCSVFFVFSIVANSIIQSEGHANIAMISMIIGPVINIPLDYILVTRLQYGIKGAAIATDISQIICFVFLLVYICLNSKILGVKVKNLTIDIKLLKEAISLGLSTFMTQLAYGILAIVLNNSLKIYGGSDLYVSAIGIYNRVFGFITITMYGIRQALQPIIGFNYGAKKFDRVKQSLKLAILASVIISLAFLIIIIGFTNKIAGAFTSDNGLIALTVPILRVMIFMSPLVGVQVIASSFFQYIGKPKPALFLSIMKPFIFLIPLMLIIPIFLKITGIFVSVPLADFLAAMISLIFIYREIKKMNKLNLIEGENKNSHFKLC >NZ_CP043998.1|WP_039773593.1|3590487_3591363_-|AraC-family-transcriptional-regulator MNTKNYVLDAIEYLEKHLLEGVSLEQLAKQFNFSKFHYARLFKAVLGENIGDYQMKRRLTIAAMSLLETRDSILNIAIMCGYSSQESFTRMFKAYFGITPKDYRDNKIEYLNLYKYSITQEDIERVMSYGTATEYEIIHKNSFEITGLLYHGDNKKHDVARIFNQTAQKVQLDKIYNQIDGVYGVDFCKNEEVRSYEFDFIAGIDSRYFSQIDRKDAELVHKYIPENDYAVYSLTNIIEKIQIQIQRNWFSLLNDELYVPCDNYAYEFYPNGFVPNQKNIDAYLFIPITAR >NZ_CP043998.1|WP_012059349.1|3592185_3592386_+|YvrJ-family-protein MQVTDLINLMVNNGFAIAVAAYLLIRLERQIDNLSSSINRLNTIISAKLGVAIDTDSPNDDSHNVA >NZ_CP043998.1|WP_039773592.1|3592556_3593063_-|nitroreductase MDFLELAKKRYSARKYDGKKVEDDKLGKILEAARVAPSGSNKQPVKLLILKDEEGLEKVSKAARIYGAPLIIVACGDHNIAGVIPFNNKSVVDIDTSIATDHMMMEATSLGLDSVWICSFDPEVIRREFNLPHNIEPINVLAIGYAVGEPASPNRHDKTRKSLDDLLL >NZ_CP043998.1|WP_039773590.1|3593290_3594286_-|NADH:flavin-oxidoreductase MRTLFDKTVINRMEIKNRFIRSATQELMAHEDGHLNDRLYELYENLAKGGVGLIITSGAYITADSKSMPGQIGFYNDNFIEEYQKLTDIIHGHESKVLLQVNYATKNGQNLKTDDVSLEDIGAIISAFGDAAARAEKAGFDGVEIHAAHGFLLSQFLSSRTNMRTDQYGGTLENNARIIIEIYNAIRSRTSKDFVVFLKVNSFDEIDSEKAFEDCQYICSQLSDSGIDGIEISGEGEASDYKESIYRDYAAKISASNNNIPIILVCKNRTPDTMVQILNSTGVEYFALSRPLIRQPDLVNLWMKDLNEVPKCISCSKCMQPNGTSCIFNKD >NZ_CP043998.1|WP_039773646.1|3594500_3594929_-|Rrf2-family-transcriptional-regulator MQISSRFTVAIHILAALEISNDVCTSEVIAGSIQNNPVVVRRIIGMLKKAELVDVNSGGGGAYLLKPVEDITLFDVYKAVDVVEDEKLFQIHENTNQECIIGANIQDVLMLMLPKAQSAMEEVLKSYTMADIVAGILEKKLN >NZ_CP043998.1|WP_167514417.1|3595005_3595146_-|hypothetical-protein MCEHYYIDEDEGQEVRSLCFKTGKGYNASNGVIADLKNTILKYNLE >NZ_CP043998.1|WP_012059351.1|3595316_3595925_-|histidine-phosphatase-family-protein MKNVITIQHTQSIHHTNGMVGSWTDWDLSEVGIQQANNIGKNLSNQLSDKKYVLYSSDLLRAKHTAEIVGRHLGVAPIFVAELRERNLGKCVGKSVQWLRDNIEVQEKSIDDKMFSDAESRRDEWNRLLPFFNELMTNKYENVIIVSHGDLLSVFNTMWLGMDIEMLNKSEIFGLAGGVSFMQETADGKRLIKRISDMSYIK >NZ_CP043998.1|WP_039773589.1|3596060_3597893_-|PAS-domain-containing-sensor-histidine-kinase MGNYVRSHNNKLKEMVCFIKIAIIVFVSIIIHMNLPKYWSSLYIHENTKFNIYIVSFSSLIIGINFIMCLIITGIVLQKRILLKNSWLIDNIIFTFIISIPIYLSKAHQSECKYLFLLLIIYSIIQYGSKCGIVTSIFSSGVILGADLLYAPLENGVNIYFQKDLIMCGVFILVAWILGYYVNIEAENNKKKDETLNTLSNEKKEMESLLLNNKICYDMLFENSLNSIIVHTNGEVIYANASATKLLGLKGENFYNHYLSEVNKDIKKKYSSISHNKLVKITSEESILNSDGEFIPVINTSSFFTYKGKPSVLTFLRDITSEKKVESLQEDIEKNLKLLNESREFNNLIMDFFTNMSHELKTPVNVIYSAVQTVDVYFGNYNLENMKKCKLYFKTMKQNCLRLIRIINNFLDVTKLNSDSGFIRIKKRNGNIVNIIEEITQSVASYVNDKDITLIFDTNVEEKIMGFDHDMMERIMLNLISNALKYSHSKGNIYVEFIDKQTSVNVKVRDEGDGIPKDKLNFIFERFGKVDNTLSRKCEGTGIGLYLVKSFVEMHGGKISVSSVEGQGSEFIIELPVELIKNEEEEDKILFKTNIEKIQIEFSDIYSLQS |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_6 | 4626935-4627031 | Orphan |
NA
Consensus repeat of NZ_CP043998_6
|
1 spacers
spacers of NZ_CP043998_6
>6.1|4626960|47|NZ_CP043998|CRISPRCasFinder ATATTTTATCATAAGTATTTTAAAAAATCTATTACTAATCGATACTG |
CRISPR arrays and Neighbor proteins around NZ_CP043998_6
The CRISPR arrays of NZ_CP043998_6 >merge|NZ_CP043998|6|4626935-4627031|CRISPRCasFinder CCATACTTGTATGGTAGTTATATTTATATTTTATCATAAGTATTTTAAAAAATCTATTACTAATCGATACTGCCATACTTGTATGGTAGTTATGTTT >NZ_CP043998|6|7|4626935-4627031|CRISPRCasFinder CCATACTTGTATGGTAGTTATATTT ATATTTTATCATAAGTATTTTAAAAAATCTATTACTAATCGATACTG CCATACTTGTATGGTAGTTATGTTT
>NZ_CP043998.1|WP_012060242.1|4626232_4626904_-|GntR-family-transcriptional-regulator MALEVNKNTTSKTIYYKLRDEIINLYLEPGTSISEKELSEKYSVSRTPVREALVRLAQEGLVNIYPQKGTVVSLIDLSAVEEGRFLREHLERAVVKEACKEFSQENVLALEMNLKLQKMYIENNDYKKLFEADEEFHKIIFEGSNKKRVWNSINDGSTEFQRIRMLRLVTNSSWDNIYLQHKEIFNAIKNKSPEIAEDFMKEHLNMVTFDKNKIKEKYPNYFK >NZ_CP043998.1|WP_023973084.1|4624980_4626042_-|mannonate-dehydratase MKMGFRWYGEGNDTVTLEQIKQIPGVGGIVWALHDMAAGEEWPMEKILEVKKSADKYGFNMDVVESVNVHEDIKLGLPTRDKYIENYKKTIEKLAKVGVKVICYNFMPVFDWLRTDLFKKAEDGSTALFYEKAKIKDIDPMELVNKIASNPDLTMPGWEPERLKNLSQLFEAYKNVTEEDLWNNLKYFLEQIIPVAEINDIKMAVHPDDPPWPIFGLPRIVKNRDDLARLLKLVDNPYNCLTLCSGAIGSDPNNNVPAMIREFGNRIAFAHIRNVKIYENGDFIETSHRTCDGSLDICDIVKAYHEVGFTGYVRPDHGRHIWNEQCRPGYGLYDRALGIMYLWGIWDSLERNK >NZ_CP043998.1|WP_039771604.1|4623253_4624867_-|mannitol-dehydrogenase-family-protein MNNAKIVLSKESIKNSDLWEKAGIEIPKFDYDKMSASTKENPTWVHFGAGNIFRGFIAILQQELLNTGKAKSGIVAVEGYDYEIIDEIYSPYDNLSLLVIMKPDGSLDKKVVGSIGESLAGDYSREEDWNRLKEIFSNPSLQIASFTITEKGYSVKNLSQQDTTDGLEHPVSIIAKVASLAYVRYQNGQLPIAFVSMDNCSKNGEKLHNAMETMIKNWVENGLVDKGFLEYINDTKKVSFPWSMIDKITPRPSQSVKNTLEAVGFDSTKIVTTSKNTYIAPFVNAEGPQYLVIEDNFPNGRMPLEEAGVFLTNRETVERVETMKVTTCLNPLHTSLAVFGCLLGFDLIADEMKDPALKKLVEKIGYEEGMPVVVNPGILNPEDFIKEVVEVRLPNPYIPDTPQRIASDTSQKVGIRFGETIKAYSKREDLDAKELKYIPLVIAGWCRYLMGLDDNGNVMELSPDPLLDELRKYVADIKLGSKESVESSLKSILINEEIFGVNLYTIGLGEKIEGYFNELISGAGAVRATLEKYLDCK >NZ_CP043998.1|WP_012060239.1|4621428_4622841_-|glucuronate-isomerase MKNFMDENFLLSNQTAIDLYHNYAKNLPIIDYHCHIDPKEIYENKKFSNITEAWLYGDHYKWRAMRSNGIDEKCITGDGSDYDKFLAWSQTIPMAIGNPLYHWTHLELQRFFGIYEPLDEDTAPEIWKRANELLNGEGFNVRDLIIKSNVETICTTDDPIDTLEYHIKIKEDASFNVNVLPTLRPDKGIEINLDGFVSWVKDLEKVSEVSINNYDEFLKALDSRIRFFHSVGCRIADHGIDGVVVYADSSKEEAEAIFAKALEGKSISIDEEKKYKTYTLRHVFKLYHELGWTMQLHIAALRSNNTKMLEKIGVNTGFDSINDESIAYPLSRLLDSVDRENSLPKTILYTLNPKDNYVLGTMIGNFQGDGIPGKMQFGAAWWFNDNKDGMIEQMKALGNLGLLGRFVGMLTDSRSFLSYTRHEYFRRIACNLIGEWVENGEVPKNDKLLKRIVQGICYSNAKEYFGFDEK >NZ_CP043998.1|WP_039771605.1|4619884_4621390_-|MFS-transporter MSNNNRKITIARGVGYGLVDLMGGGAFTIIGAFLLFFYTTFAGLTPIEGASIIAIARIVDAVASLFIGSISDNFYKTKLGKLFGRRRFFLLIGAPLMADYVLLWVTGRSYAFYLVTYLLFEIIAAMVLIPWETLPAEMTKDFTDRTKLSASRMFISATGTFLATFVPGRLIAFFGDKSPQAYFINGLVFAIIYAICILISHKVTWERDLTPEMEQELLNGSTSKSFGEQLMTIVKVAGDYVSTFKIRAFRQHLAIYICSFTAKDLFNSVFIYFCVFNLGVSSTTAANVLSLSIIGIPVTILGGFLMIKVGPGNLYKMAYSIMIVCLLAFYGLYVGNLGSNIVLLFVIGTIYQVGRSLLEFTPWNVFPFIPDVDEMVTRQRREGLFAAVMTFTRKSSVAIATFVIGVVLQESGFVKGQATQSPQVVSTIATLLAVGCISLLVIALICAATFKLNKRTHGILVDEVERLKNNGSKEEVTSETKTIVENLTGYKYENVWKETVV >NZ_CP043998.1|WP_012060237.1|4619177_4619600_-|HIT-family-protein MSNKNNCLYCDKDEKLDNLMIEICKLEVSTLYLFKEQSHKGRCIVAYDKHVKELFELDDKELELYMKDVTRAAAMIKKTFSPDKINYGAYSDTLPHLHFHLVPKYKDGYSWGGVFEMNPQKKYLSDEEYVKRINLIKENL >NZ_CP043998.1|WP_012060236.1|4617731_4618289_-|methyltransferase-domain-containing-protein MWIKFLMEYFKSPRTVGAVAPSSKKLAEKMAHDIDFDHAKCIVEYGPGTGVFTDRLMKKIKDHTMLMLVEYNEEFCRELEEKYGEYNNVVIVNDSAENVDKYLKEYNIKEVDYVVSGLPFASLPKNMSNSILKKTKDILKKNGLFITFQYTLLKKGYIGSYFEDISLERVVLNIPPAYVLKCQNT >NZ_CP043998.1|WP_154862475.1|4615808_4617380_+|IS1182-family-transposase MNDDFQLILPLNLENLIPSDDSVRLLSHVLEGLDYTKLYKAYSSVGRKPAVEPKIMFKIISYAYSQNIYSSRKIEKACKRDINFKWLLQCYKAPDHATISRFRKDYISNEVIEDLFYQQVNYLANQNEILFENAFIDGTKIEANANRYTFVWKKTILKNEEKMFDKILVLLENINLGELKKFTVQKETLIDDIDKILQWLEYEKKKRNIEFVHGIGKRKTKIQKWTEQLSEYKEREEKYNLSKKIFSKRNSYSKTDPDATFMHMKDDHMRNSQLKPAYNVQIAVESEYVTGVGIFDDRNDIATLIPMLNNMKEKIGRKYLNIIADSGYESEENYLFLESNKQTPYIKPQTYEKWKKRSFKNDISKRENMKYDAESDFYICHNNRKLIPTSIIYRKSASGYKSEVTVYECENCDNCDYKVKCTKAKGNRKMQVSKTFVEKREISYKNITTEFGTKLRMNRSIQVEGAFGVLKSDYEFNRFLTRGKNSVQTEFILLCFGYNINKLHSKIQNEKTQNHLHELKPTA >NZ_CP043998.1|WP_039771828.1|4613843_4615307_-|sugar-ABC-transporter-substrate-binding-protein MEILNFRLRKLSCIVLIILVGSILSACSQVGKVIVDNEPKEDRQKDYIEEVPTQTVTNEKSVDLAPLYDQVRNLKGQEALDFFESLKSKGLSDSDILEFFINLPLSDANKEITDIYKNEKFETYMSTYPTGKPFGNYKWTNGDGTKIKGAFSELDLKLPFSNYVALKSGPVGDLNKKYRIGVAIHGFDQPWNVSLADAAQWEAERHPNVEVDVKDAQWDNDRMADIIDSFVLQKVDGILTWPMVESETTIAPVKRAIEAGIPVVSVDRMTGLEETTSRVTGNFPANGAQCGMYLIWKLAKEGSLNANVVLLRKPSGSTADANRTGHFLKVLSYFPDIHILKSYHDEDNTAEALANMQLALNEYPSIDVVFGTGDHEAIAAYDASKNANRLNSRKDAKKMMFLSIDDSKKAITSVKDGLFEVNTPYTPLISDIGMRTLLNIITKNGSMPHDIITPNIPMVTKDGDTIFGLKTQTPDQWYEYTFGAPIK >NZ_CP043998.1|WP_039771826.1|4612063_4613761_-|methyl-accepting-chemotaxis-protein MKKISSVPGTIPLTIKSKLIISFSLIIFLVSAVGITSYMTMRSYLVQENIMIEKNVMANDIIILINSIPQDISKYILNPTADNKKIIDDKFININKNQEFIKDNVSGEKALKSFDAVSRMLESYSEENIKLFESKNATEMVEKNKLMNRFSKLIQNSMQEYMSVELDQQNKARADLAKKSNFTGVLIIVFIVSIGFLSIIFAIFFSIKLGKSLNKIVLLADDIANGNLQVEEYKVNSNDEVSLLASSFNEMTKNLRTMIKGIINNSKDLYESSTMIKDRAKESVKAVNQIAVSTQDAVDGSQYQFSEAKRTEEAVNRLIKMNSTIKEKSNNVLSSANKSLKIAEGGNEKVRSMLNQMNTIKEQVMNIQSVTGILKENSSQIETILDTISKITASTELLALNAAIEAARAGEYGKGFAVVSDEIRKLATSSATSTVEISKILTQIQNYINVLIKSMSIAVSEVMSGSEKVLEVEGAFKNIVESNNDVDGEIKNISDEILVMVNEINAIEKISKNICEISNKSLEGSTDISAIVEEQLATQEEFFASATTLANISSELANVVSKFRV >NZ_CP043998.1|WP_039771603.1|4627250_4628930_+|chemotaxis-protein MLKNIKIINSVILMVILSTVVSLSIAIIGYNNMKTINSNSSSMYTIALTRIIKTEEIRQTFLNIRLNVNRISISEFNDDDVAAIDNDYSAINKMVEDYENLSLSTIETNNLSEFKKDSSAYYEQIKNLEKGNKLYGIDLEKFNQLGVEMQLFLDNLVTYSSNTANALHNDNMSLYIRSTKIFFITFFIGFILQILVSSSIILVIRKSIKEIMSDLDNVAAGDFSFEINTNLKNEFGRMKKSLKVTISNISSMLEEVQNSANVVNIQATNLLGASDEMSSSAQEINAAVQEVANAATEQSSDLMNVKTSLDSFADSLDQITSSINDVNSNIHNISSMAEDSNSKLEFLFNSIKDVNESFDTVRNKVVQLDNHVEQVNNITTIINSIADQTDLLALNAAIESARAGEVGRGFSVVAEEIRKLAEQSKVSASNISGLITNINNEAQIAVKTTDLGKDSLNNQSVLIEDSIKSFALIFKAINTILPRVDNINKSIENINIEKDLIISKTLDISGVSEENAASSEEIAASVQQINSSFNDVATSAQTLSNLTTSMMNEVSKFKL >NZ_CP043998.1|WP_039771602.1|4629011_4630187_+|extracellular-solute-binding-protein MKNFKFLNVTLVIVLMTTILTGCGSKNVSKSTQPITLNIIDVSGSMQLVGDSIDQFKAANPDLIGDVVVKKSTALEVPSLLKAQILSEDMKTNLIFTGIDGLSTCIDRDVIENIMPAYGSRFPDLESNYSSGAKATYDLVKGYAITYVYSPSGPFFTYNPDTVQNIPKTPDELLAFAKANPGKFTYARPAGSGPGRIFLQGLPYILGDKDPKDPKTWDKTWAYLKELNQYIDYYPAKTGTTFTELKDGKRSIIASQLGWDMNQRIIGGIPQTYQGFVLNNTTLVADAQYMAIPKGLSDEQKNVVLKLMAWLMMPKMQAITYDSGYFYPGPSVKNVSLDMAPKESQDKIKPAIRQSYEDSINTLPNSTQLDTTKFMDALNMWDQLFGTKVKR >NZ_CP043998.1|WP_039771600.1|4630266_4632129_-|APC-family-permease MLTKFLDVLLGEPLSNEQGCNEKYNIPFGLAIMASDAISSVAYAAQEILFVLIVLGVAAYQWLTWTSFMIIGLLIILTISYIQIIRAYPQGGGAYKVANENIGKKSGLAAGAGLIISYILTVAVSASAGADAIISAFSNLTEYKVMFVLIIIIVLTILNLRGISESSKIFAIPTYIFIFSMAFMILYGLFKYFILNIHPEPMYSIPANTTENVSIFLILRAFSSGCSALTGVEAVSNSVPNFQEPSQKSAKTVMILLAALIFFIFGGTSVLAIFYTAVPIANGPTVVSQIAFAIFGNGIMYYIIQFSTAVILLMACNTAYTGFPMLMYIVGKDGFAPRQFTIRGKRLSFSFGIVALSCIACILVIVFKADTHRLIPLYAIGVFISFTLGQFGMVNHWRKEKGKGWVKRAIINGIGSVVTLLTTIIILIEKFSEGAFIVAILIPIIIVIQLRIKKHYDKVACGLSISQLNLKKVDLRKKYTHIVIVPIASLNKATIGALQYAQSVSDNVIALNISPDKEAMEKLKSRWSELDTDILLVAKYSPYRAVVTPLLKNIELIANSTAKDEKITVIVPQFVTNERFGEVLHNHTSFFIRETLLKNDNIIVSTYPYHLLDEDVKQSK >NZ_CP043998.1|WP_012060246.1|4632700_4632997_+|hypothetical-protein MAQNHICELCNRNVSSITKHHLIPLEKGGEKFKTLSLCSTCHRQIHALFTNRELATHYRSLESLKKDIKIVKFLKFIQNIPGDSYLDIKKSRHVRKSC >NZ_CP043998.1|WP_039771598.1|4633134_4633578_-|GNAT-family-N-acetyltransferase MNNITYEFINYKSKEFKEVSELRFKILFKPYNKIHKYDYDELDYSSIHLVALDEGTVVAYSRMTNYNMNGKMTNIVVSEKYVGKGIGIEMLKRHKIKAKEFGVICLYLNARLDTINFYKKAGFQCKGNIFISEKSGLALQPMYFKIN >NZ_CP043998.1|WP_023973088.1|4633865_4634021_-|hypothetical-protein MEKLRKGEHEKAMEKAKEMLDKGCGMGDIVEETKLSEENVMKAKRKWEDKS >NZ_CP043998.1|WP_023973089.1|4634173_4635235_-|iron-containing-alcohol-dehydrogenase-family-protein MKTSTHRIAIPSILEVGKGNINNVGNLIKKAMFKSVLICFGEGLEELFGDSICNSLKEANIDISRIETISDVNFEKISVKAFEISNDVEALIGVGGGKAIDAVKYMSFLRKLPFISIPTSTSNDGFSSAGASLLVNGKRMSLPAKTPYGIIVDIDVIKSAPEKFIYSGIGDLVSNITALYDWKFEEENGRIIIDDFATMISKKAVNSFIRTEFKNIKDDLFLKELVDSLILNGISMEIAGDSSPASGSEHLISHALDKFLEMPQLHGIQVGIATYIMAKVQDHRFERISKILKETNFFEHAKTLKMKKKDYKKAIDIAPSIKPNRYTYIHVDENRILAKKIIDEDEILNYILI >NZ_CP043998.1|WP_012060250.1|4635330_4635642_-|hypothetical-protein MDKVNSLIKNTPIHLTTNTIVLIIVAIIALYILIKAIAGIIRIAALIGVCWFILMSIQSTNLINIPIIREAYTTVEKIIPSKELWTEALDKADKINKVVNDLK >NZ_CP043998.1|WP_017209073.1|4635725_4635917_-|PspC-domain-containing-protein MEKRLYLSATDKKLAGVCGGIAEYFGLDSTLVRIGWAILIVCAGSGLLLYIICALIIPKQPLL >NZ_CP043998.1|WP_039771596.1|4636323_4638039_-|dihydroxy-acid-dehydratase MISQEVRKIAPEMDPLRRGMGWTTEDLSKPQIIVESTFGDSHPGSAHLLKFANRAVEGITQSGGKGARYFATDICDGMSQGHDGINYSLASRDTLTSLIEIHANATPFDGGVFISSCDKAVPSHLMSIGRLNIPAIMVTGGVMEAGPDLLTLEQIGAYSAMCQRGEISEEKLTFYKENACPSCGACSFMGTAATMQVMAEALGLMLPGSSLMPATCEDLEEVALKAGRQAVELAKMNLRPKDIVTIKSFENAILVHAAISGSTNSLLHLPAIAHEFGLYIDEETFDRIHKDAHYLLNIRPAGKWPAQYFYYAGGVPAIMEELKHLLHLDVMTVTGKTLGENLEELKTNGYYEKCNEYLEKVGLKKEDVIRPFNDAIGTNGSVSILKGNIAPEGAVVKHSAVPKEMHEAILKAKPFDSEEEAIDAVLRKIIRPGDAVIIRYEGPKGSGMPEMFYTTEAIASDEELSASIALITDGRFSGASKGPAIGHVSPEAAVGGPIALIEEDDLIEISIPNRVLQIVGIKGKKCSKEEVEKVFEERRKNWKPRKSKYESGILKIFSEHAVSPMKGGYMK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_7 | 5405178-5405383 | Orphan |
NA
Consensus repeat of NZ_CP043998_7
|
3 spacers
spacers of NZ_CP043998_7
>7.1|5405204|34|NZ_CP043998|CRISPRCasFinder CTATATTAAAGCAGATGGTATCATGGCTACTGGC >7.2|5405264|34|NZ_CP043998|CRISPRCasFinder TTTCTTAACTGGGTCAGGTGCCATGAAAACTGGC >7.3|5405324|34|NZ_CP043998|CRISPRCasFinder TTACTTACAATCATCAGGTGCTATAAAGACTGGT |
CRISPR arrays and Neighbor proteins around NZ_CP043998_7
The CRISPR arrays of NZ_CP043998_7 >merge|NZ_CP043998|7|5405178-5405383|CRISPRCasFinder TGGGTTAATGATTCCGGAACTTGGTACTATATTAAAGCAGATGGTATCATGGCTACTGGCTGGCTCAAAGATGGATCAACTTGGTATTTCTTAACTGGGTCAGGTGCCATGAAAACTGGCTGGTTGAATGATAATGGAACTTGGTATTACTTACAATCATCAGGTGCTATAAAGACTGGTTGGTTAAATGATAATGGAACTTGGTA >NZ_CP043998|7|8|5405178-5405383|CRISPRCasFinder TGGGTTAATGATTCCGGAACTTGGTA CTATATTAAAGCAGATGGTATCATGGCTACTGGC TGGCTCAAAGATGGATCAACTTGGTA TTTCTTAACTGGGTCAGGTGCCATGAAAACTGGC TGGTTGAATGATAATGGAACTTGGTA TTACTTACAATCATCAGGTGCTATAAAGACTGGT TGGTTAAATGATAATGGAACTTGGTA
>NZ_CP043998.1|WP_039770713.1|5401268_5403152_+|N-acetylmuramoyl-L-alanine-amidase-family-protein MFKRANKITSLLIAAASVMSLVPAYAADVKKIDSDDGTVYNAVAYKDGKFFVDGEINDDEEAYYVSDGKFNKLEDIDSGDDADLFGEKYLDINDGDYTVDLDKGSITDDDTKGDTADDASADLRKKIKDDTDDRYDEDFANNIIDENKDDTEDLTKLNILPGAKYKSPWYYTQYKAADKAVNDNVNGLKGTDASKQFFNVYTDTKGGYIDADYNLGKVKVTTTADGASTKTETIENTNDKYDAAGKDDALTASVSQDKILTQDDDYIYRLATIKVNVTTDAAATARISEINGVELNPENANDKPQIFKVENDGRTVSFKAIQKISKAQDSDDVDGAKYAKTVTTYALSDEDGKNLDAKDLFLNTDGTINEDTKFTVANGKLIAYNTEMNEYKKVVVRAYSLKTKGGYYYADEEDESKEDCEVSSQDDKTSAVQTDVDGNLWRLDGGYIYKFDNTDDWDKVYKVDGSFDELSVYDKDNIAAWSEDDDVYSLIGGKSSDDDNNTNPPTTTSGWVQAADGTWTYNKEDGTKATGWLNLNGVWYYLNTDGVMATGWLNLNGVWYYLNPSGAMATSWLNLNGTWYYLNSSGAMATGWLNDNGTWYYLNTSGAMLSNTTVDGYVLGSNGAWIR >NZ_CP043998.1|WP_023974296.1|5399143_5400739_-|peptide-chain-release-factor-3 MADYIKEIEKRRTFAIISHPDAGKTTLTEKFLLYGGAIRLAGSVKARKASKHAVSDWMEIEKQRGISVTSSVMQFNYNNHCINILDTPGHQDFSEDTYRTLMAADSAVMVVDAAKGIEDQTRKLFHVASLREMPIFTFINKMDREAKDPFQLLDDIENELGIKTYPMNWPIGSGKEFKGVYERDNNRIIAFNGGNHGQNEVEAIEGSPDDPKFREILGDALHDKLMEDIELLDIAGDELDLDVVRRGELTPVFFGSALTNFGVEPFLEHFLEMTTSPLARNSSGGTIDPFDDNFSAFVFKIQANMNKAHRDRIAFMRICSGKFNKGEDVYHMQGGKKIKLAQPQQFMAQDREIVEEAYAGDIIGVFDPGIFSIGDTLCAPSKKFKFEGIPTFAPEHFARVRPVDTMKRKQFIKGVSQIAQEGAIQVFKEIHIGMEEIIVGVVGVLQFEVLEYRLNSEYNVDVKMDRLDYRYVRWIENKDVNMDSLNLTSDTKKVKDFKDRNLLIFQNDWGISWALEHNKGLILSGVGKSED >NZ_CP043998.1|WP_023974295.1|5398033_5398993_+|DNRLRE-domain-containing-protein MNSITIPAIKSLSITNKYSDKSLNGDKIIVGTDGNYNYYSYLFWDISSIPTNATVYNAKLTLFKTDNFYYDTSKKFSISPLYEYFSTYTTYNNSPNYDHYTVINFYPLTDNISVTIDITTIVSSWVKNSLKNKGIILYGRNEDIFTSFGSVKSSDNYLMPFIIVNYDPYSPNKCLKKECTNKYSKDCCKKKYNDEYFKDDCCEKYIKICKEELESILFKVCKEACGGNCNPFPSNTSITRTVRVTGTVAPTSVYYIVVDLQVTRASSGQVNHYYVSDEYDNSLNNTPLPIDKTYNIAVSPPIQSGDAEDVILYGSYKGF >NZ_CP043998.1|WP_023974294.1|5397338_5397623_+|hypothetical-protein MASFDTPQNSTIQTIYATGTIPAHNDAGFIEIQAVASRNGGHETFYKTFQVAASATRATAQVWAGAGNYQIIITPKLFGTQSVSSTTVINSFKH >NZ_CP043998.1|WP_051144798.1|5393875_5396947_-|glycosyltransferase MQSKDELINDTENLKENISCVVKDKMKLVFFVRLGLDSFLGDIIEGLSQEYEIKKIIATEYKQIEDGMQWADICWFEWCDELIAYGSKLELAREKKVICRLHSYEAFTDYINNVTWNSIDKLIVVGAHIKDFIVENFNIDEKIISVIPNGIDEKKWTYKERENGFNIAYVGYINYKKGPMLLLHTFKAIYDEDNRYKLYIAGVFQDNRDVLYYNQMVRELGLENNVIYEGWQNDLDKWLEDKNYILCTSVLESQNMSVMQAMCKGIKPIIHNFVGAKKIYGKEYLWNTIKDAVNMICSDEYKSIEYRKFIEDNYLLEQQITKIRLVITKINLEKEKFKLLDEPLVTVGIINYNYSEFLDKSIESVLKQNYKNIEIIITDDSSSDDSVEKIKSYENKYENINAIYHASNSGNAYRGIEEIIKYARGKYFMFLSSDDFLSDSNVIKMYVSELLLDSSIDYVFGNISVYNDNNTENIRWTYRNYTDDEIISETFNRKGSGVVPFSVGLYKKEFFDRNKITLFEDKNNKVAGDTLNTLAYLKYGWKIKYINYDAVSYRHHNNNMTYDLENRIKSIISVMEYIVENFSETKYLINVDWSNLNEKNKESTKNYLIGVNYYNTYIMYLSGNGMPWKCNLDFDIEQIKVYLQPLINIIEKYMKKSLTYGDLYCNEINKILNEIKPYKLDIKVNKNDKEYMQQVQIIDKGEELRGSLLEKYKNKYKRHDKKILIYSVINGFWKYSFLSWKQVLNYMGIKADVIYEVNQKLNYEDYDIYINLADKIYIDNSFANKSIERIKNKIGIASKQDNDDLDLINIQKCKDFNYKFLISPFHEETYISYFKNLTSSNINIESVPFGFNPLIYYPENTKKIYDYFFVGTNSYLKYKETEKYLIPILNKYKNGILRGSGWGNINVELNPDNSKFFYNRSKINLNYHLDIQKKMKNEVNERTFIIGACGGFQIVDNPKLIYELYTKDDIAIANDEYEYAEMFKYYLNKPLERYEKAYNSLVKTYENKYSLFDRLEKILQLIL >NZ_CP043998.1|WP_023976120.1|5392848_5393808_-|NAD-dependent-epimerase/dehydratase-family-protein MISNKKVLLTGGAGFIGTKLCERLSSNNELLIYDNLKRNSIKNTNLLNKDNIKLVKGDILNFNFLKHTIDEFKPNIVIHLAAIAGIDTVIKNPVSTMKVNMIGTYNILEALKDQKIERFIDFSTSEIFGSYAYKVDEAHTSNLAPVGEARWTYSVSKLAGEHLAYSFYKEYGLPIVTIRPFNIYGDGQVGEGAIHQFVVRAIKNEQIQIHGDGDQIRSWCFIDDFINGVMLCLNNQKAIGHSFNIGNPRGTITISMLARLIKTIANSDSEIVYVPKNYVDVELRIPNIEKAKKILRFNPRYDLDEGLEKTIEWYREKIK >NZ_CP043998.1|WP_023976119.1|5391997_5392831_-|NAD(P)-dependent-oxidoreductase MNRNIIITGGTGFVGSNLINAFKKKEYVSYNLGRNKNKFCKNIYWDLRDDMQNIKLPLDVDTIIHCAAIVGDCNANVREYIDVNVGATLELLEYGRKVGIKQFIYISTGGVYGFNDNPSKESDKCDPHGMYSLSKYFSEKICMEYMDRMKIAIIRVFFPYGKDQRGRLIPNLINSILKGEKVILNNEGKPLINPINIMDLCNIISGIVDKRLEGIFNACGNEIVSIKELCQKISDKFVIKNVQYEFNDKKCKNLLGNNKRIMDDLHYSIKAKLLDGM >NZ_CP043998.1|WP_023976118.1|5391124_5391904_-|hypothetical-protein MDFFSYSNYKIILNKMKAIKEIYNFKSINNSIKNGYILRHDVDIDIEKAYALSTIENDMNVTSTYFILVTSDLYNILSYKNKMLVRRMFLNGFEIGLHFDPSIYDYMSLSQLEKQMKKECSIIEDIIGEKVSSISLHNPSIHNKYPIFKEYKNTYSKEFFNPELYLSDSCKDFRGKNVFEFIKKGENNLLQVLFHPIHFSENEETYVESFNKIIELKINNFDRYYTCINKTYKNEIKENTLLSCFKDYIKENNKHEEKI >NZ_CP043998.1|WP_051144797.1|5390223_5391141_-|UDP-3-O-(3-hydroxymyristoyl)glucosamine-N-acyltransferase MKKKFEFNCKLLKNIIEYGKQNINETVIYSVSTLKDPKDNTLIFGNALNEESIKKLKKVKNSLIILNTKDSYFSSDSSYLLYVDRPREEYAKVLDFILKLQPKDNRKHILIDGYYKGESSIIGKNTVIEPLVFIDNDVKIGDNCIIKTGAKIRRNVIIGNNCIIKENAVIGDDGFGVERDEDGTTYKIPHLGGVKICNNVEVGALSCICQGTIEPTVIEEYVKIDDCVFIAHNCFIDRGTLIIANAEISGSVHIGANSWIAPNSCIRDGTTVGDNTLVGIGAVVVNNIDSNVVVAGNPAKLYNNS >NZ_CP043998.1|WP_023976115.1|5388705_5390022_-|nucleotide-sugar-dehydrogenase MLDKDNLIYKINNKTATVGIVGLGYVGLPLAVEFAKSGYRVLGFDIQQKKVNMINNCENYISDVVNEELKFVIENRRLKASNEIKFLKDTDVILICVPTPLDKYQQPDISYVKESTESVGKYLHEGMLVILESTTYPGTTEELVLPTLEKMSGLKCEKDFYLAFSPERVDPGNSIYHTANTAKVVGGVGRDSTEIAAALYRKVLNSEIFEVSTPRVAEMEKILENTYRNINIGLINEMAVICNKMNINIWEVIEAAKTKPYGFQAFYPGPGLGGHCIPLDPYYLTWKAREYDYHTRLIETSGEINNFMPQYIVQRSATILNKFNKALNKANILILGIAYKSDIGDYRESPALKIIENFQKQGSEVKFYDPYISSYMYKGEEHYGIKLTQEVLRNADLVIITTAHKKYNYSFIQENSIFIFDTRNATKNVQNKDNIELL >NZ_CP043998.1|WP_039770709.1|5405783_5407733_+|N-acetylmuramoyl-L-alanine-amidase-family-protein MIRGMGKVTSLLVAAATVASLVPFSGVNAAEIKRISADDGTIYNAIAYKDGRAYIDGEINDDEEAYYLANGKFNKLEDVDSGDDAVLFGEKYLDISDGDYTVDLDKGTVTDDDIKGDTEDDAAAALRKKIKDDTDDRYNETEANTIKDSNHGDLFDLIPGAKYNKVWYYTQYKAAQKSIDKNVNGLNGLDAAHQIFNVFTDEKGNYIDADYNLGKVKVTTTASSASGTTLTKTDTIENTNDAYDAADGIINGTNISGSDKLSASVVQDRVLAQDKDYIYRLATVKVTITTGAAATISEINGVKIDPNNSNDIFKVENNGQVVSFKAIQKISKTQASGDVDDAKYAKTVTTYALSDKDGKKLDAEELFINTSGNIVTTTNYTVAGGKLIAYNSEINNNDKVTVRAYTLKSSSGFYYADEEDQSKEDCENSKNQGAAVQTDVDGNLWRLDGGYIYKFDNTDDWDKVYRVDGSFDEFSVYDKDNIVAWSQDDDVYSVIGGKQSNSDPDDTPVVKTGWVQATDGTWTYNKEDGTKATGWLNLNGTWYYLKADGVMATGWLNLNGTWYYLNSSGAMATGWLNLNGTWYYLNQSGAMATGWANVNGTWYFLNGSGAMQTGWLNDNGTWYYLYSNGAMAANTVINGYRLSASGAWV >NZ_CP043998.1|WP_039770707.1|5408004_5408877_-|glycerophosphodiester-phosphodiesterase MKILNIAHRGYSGKFDENTMLAFKKAIEYNADGIEADVQLSKDGVPIILHDETLDRTTNGHGFVKDYTLDELKIFRTKSVPEIQLLKNDSLQEMAHLKLNMTTERNYEEGKQVGSYKVGKYTMEEAEYFQNRGGEEIPTLRELLELVADSDLKVLNLELKNSVIEYKGLEKKVLSMIDEYNLRDKVIISSFNHTSLVKVRKLENNKKITLGALTETILVNVPKYLKAISVDCYHPHFSSILNEEYIKEIKDAGIKVNPYTVNSLVDMKKVIMVGVDSIITNEVELLNTLL >NZ_CP043998.1|WP_039770705.1|5409168_5410236_-|bacteriocin MKYEYLRKSIAVSLAISSLITVVPVKSLAAWIENYDGSWSYADMYGYANGGWKQINGIWYYFDSYGLMRTGWILDNGEWYYTDLSGVMQTGVIQIEGKIYIFSENGAMQKGTSIINGRIYNLDDSGACIGNDYPIPTKSFDYYGNNTLPYVPNQIIDEDSKMSKDIPTDPSKEVKKQYKVKFKDPEAEDDDDELLRTKTVDEDTMLTLYKPVKNGYTFIEWNTNSDGDGTSYEYDDRIKITKDITLYSQWKKNENTSDETTIKVDNIVVLGPVSGTTEMSSITTKGGSLQMSKKVYPTNSDNQKVKWLVVNEDGSATISDTGKLIAVSNGKVIVKAVATDGSGVIGTKEIKISGQ >NZ_CP043998.1|WP_051144796.1|5410327_5413645_-|hypothetical-protein MKWKFINKIISAITISMTLFTLIPLRASAEWVNDYQGNFYYMQDNQKVTGWKRIDGQIYYFDGNGKMQTGWIKAGSSWYFLQNDGALKTGWINYNKKWYYADSSGVIQTGIVNISGKVYIFDDNGAIKTNNTVINGEFYTIGSDGEVVGTKMPTPEKEYDDSGNCIQVLKNTDNKVITSPTDSKFNEVIEDKTESDDNPNEGRSFKVLLKDSDGSELKTKTVKYGKSFDLYKPTKDGRVFAGWNAKSNGSGKSYDADDSIKVEEDIILYAQWKEDTSVYVEDINIKGNSNVTVNKSVTMTAEVSPSNVTNADVTWSVSDETGKATIDSNGVLTGVSAGTVMVKATAKDGSDVSGTKEVTVTNTDVVVPVSKVTVSGQAGESTITTDGGTLQMKASVSPEDATNQAVTWEVQNNTGSASIDSSTGLLKAISNGTVTVKATSNNNVVGSMTVTISGQSTKILVTDMEITTTKTDFAITEDGGTLQLNLNITPTTATNKSVKWSIKSGEDKATINSSTGLLKAVTNTNGTPVTVQAEALDGSGVVATKDVTISGQKIKVSKITIDGPDSVTGTGKVTMDKTVLPKDATNGAVIWSVENNTGSATIDANTGELTPKSNGKVTVKATAADGSGISDTIEVTISGIDNNIPATKINIATKDGAALSITEDDGTLGLIASLLPSYSTTTSEAVNWEVISGSDGGSAKIEGGTVGSSINIRGVTNGTVTVKASVINADGTTAIGSATVRIAGQITNVTDIIISPDEAPEVVVGGTLQMSASVDPNNATYKIVNWSVSNGTGTATITSSGLLTGVSSGDVKVIATADNGKGISKYITVKVIPQVKVTKITVNAPDGSGNEITDGGTLQMTASFEPTGATSKSVTWSVTPGTGKATIDSNGLVTSVSNGTVTVNATATDGSKVVGSLPITISGKVGTITVAGTGNISTIVIPNGILQMLATVGPTDAVNKAITWSVTPVTGKATIDSNGILTAVSNGTVTVNAAATDGSGIVGQSVVTINAASGITINQSSNTVAVGNTAKLTSVISPTSVTGKKVIWSISNIDGTNTDLATINSTGDLTADLTALKQGSVNIKATLDDGSGISVTKTIIINPNS >NZ_CP043998.1|WP_039770703.1|5413960_5416066_-|cell-wall-binding-protein MIRRINKILALVLIGTSIIATIPNSVFSTPVKAETNDISKIILNPQTNNIALSGIDIGSMVPDGDTLIGMAENTTINPQLENGVKLMFSSKGAKSIDNEECGKLSYNLSGSLVDEISAQVYEVLKDPITNAVVSKAESATGGTIPEETLKNVIEPIVEKNLQAALPSAIKSRFQNIPIYQYTGKNNSGDVIAQAFVVKGLVGSIVNTVVGNGAYCVNTYSANVRNASYSSIDIVPSLTFNPAVGTTAYSKVINLDNGSKVIGDGMSINVIDSVNNKVYVINNPIYNMLKAKRGDSDKINKDLNIIDFNGVTNLSGSLSFPLDIDGTKFSILSLSLTKNGDITANKSYKYAVVVGDYEKNLLDKMIDGVNLGNVGDKIKGMIKSGTYNMIPDINTQIGGLIDKGKNEFDKTIDGISDGINDINDSLDDLTDALKDKNNDVDDAWDKVFDRYDNDKGWGKHDGYIYYYDKDGVSLKGVQKINGKIYYFNRIDGAMETGWQIVDGKKCYFDKKKGCELFNQWVQDGDDWYYVGEDGAVKKMEWVNYNGKYYYLKADGKMVKDWFKVDEYWYYFNNDGSMSTSIWKSSNEKWYYLKDNGQAASDWLNLGSNWYYFKNTSGEMQIGWFRANGNWYYSNDDGSMKTGWIYSKNNWYYLDEGTGVMKKNEWVVIDGKNYYFNINGEMVTGSRYIDGTKYVFGSDGTLY >NZ_CP043998.1|WP_039770702.1|5416443_5418498_-|diguanylate-cyclase MSIKYKTLLIGFFSISLVIGATILIFHLSYFGYINKDQEQHIKRDFDVIDYILKSEEEDMEAVLIDWGQWDDTYNFINTKKQEYIKSNLQSNTLNNLNLKSMIFLNSNKDIIYSKENDIQSELSRNIMNKLMISSKNFDKTGSGKIGLISLQGKVYLVGILPITPSDKHEESNGFLIMTREIDKKLVKYVEKVSSVSFNLSEAFQDKYKRDKDLSYIYLDDSIISYNKNNFEAYKTIKDINGEDSIEITIVDTNHSDEQINYFLRSFIFKFLCLIVIVIVFYTLSFDRYIFKRITKLTKFIEKVGKTKDMTLTIDINGKDEINKLANEVNRMLERINSANDEILFLSYTDKLTHLRNRAYMEKLFESLDNSKDISYHIIIGDLNGLKLTNDALGHSEGDKLLHIVGKILKENCASDDIISRWGGDEFVILVKNKNREYITNLIDRIREKCESEAEFHFKISIAWGSAGSDEEGSNTEAIMGLAEKRMYRNKLMENKSARSAAINSLLMTLHEKHSETEEHTIRIKNLSVKLGKSIGLPKEKLDELELLSSLHDIGKIGIPEHILMKPSKLTDEEWKIMKTHCDIGYRIALSTPELAHIASKILAHHERYDGTGYPNKLKGEEIPLLSRIINIVDSYDVMSHKRVYKDAFSKDYIIEELKRCSGTQFDPHLVKKFIDLLERDGDL >NZ_CP043998.1|WP_039770699.1|5418673_5419981_-|methyl-accepting-chemotaxis-protein MNKEKKNVSLKVKLQVSYVIMSILVFISGIVNFKQLSDIKNGIANGDTLARDITTTVVVCIISIIAAIFAGFYMHKNIISRLNTLQKFAMKLASYDFSEGVEITKYDEIGATARELNIAQENVKNLISTILNEACNMSGLSQELSANVEEVSAKLDEVDNSSKNINVIMTETSATAEEIAASIEEVNSSMESLANKAADGSTNAEKIKRRAEKVKEDSKIAITNTTQIREQKEKDIIKAIEDARVVEEVKVMAGAIADIAEQTNLLALNAAIEAARAGESGKGFAVVAEEIRKLAEESSQTVFTIQDTISKIQDAVKNLSDNSNDILNFMSSEVDKQLQDYAKIGEKYSNDGDFVSSMSEELVSMAQEVEATVEQINEALQSTAADVQKSSVNSEKIQSEIETSSSAISQVANAATQQAQIAMHLTELVQKFKLK >NZ_CP043998.1|WP_039770697.1|5420237_5422469_-|cell-wall-binding-protein MSAKKINLNKITSYLLIFTVFFTLMQTVNLQKASATDETQIKGLQFHIGDVNGKTKNIDGNEKDGYVCEFLPIGQNFTLVADSGYSIVSVQSSSSFMNVKPVANSSGGNDYVVNTITDYSDFTLTVVMKDSSGKQVTYPIRMKFEADSSLSFQSLRVTLDGKITYNLFFTQTDANGNYHISDINSDVKMAKVQLFDNNNTPMNFSTNGGSSAAEATVNLTGGDNVISIGVTTQNISRQYKLIITKKGEAKLQSLVPSAGTLSPAFNSNTYDYTVQVPTTQTTIAFTPIAVDNSSTIKVNGVTVKSGSKSQSIKLDEGENDVEVILTTKDGDTSTYNIKVTRTALFRSSQLTGLTLTSGTLTPAFNKGIYEYSGTVDNSVTSIGVTPTAEDVNATITVNGKKVPSGATSPYISLDEGGNTINVKVTDSKGNSNTYVLNITRRYPKDNVNLASLSVTDGTMSPKFDPETYLYSVKVARNIEKVRVMYTSQNDKAKIKINGKEYTNGQSDYIKLDIGANLVVVEVTAEDGKTTTTYKLSVIRGDIEGTNQWVLVGGNWTFYNAAGMQIKNQWVKYDNQWYFLDINGYMQTGWIQDSGNWYYLNKDGIMQTGWFYDKGYWYYLEANGAMRVNTWATYDGKWYYFNNFGEMQTAWAQYKGKWYLMDDHGVMQKGWVTYDRNKYYLNDDGSMRTGWLYNGKSWYYLDDSGIMITGWKNINGKNYYFDAGGVMKTGMLFLDGQWINLNNA >NZ_CP043998.1|WP_039770696.1|5422792_5424214_-|cell-wall-binding-protein MSKMVRRIILTFFIIYSVSFLQTSSLNLLMTKVYAEQDNPSLKDIYLSDGGNLDFSEDKYSYVTDVGNDIDQVLIKAKPYDLLDTVKVDGEIVTRDDSYRKVVPLVKGKNKIEIEVLDNRSDATSTYNVYIYKGGKDAVYLKDININDSNIGFDKNTNFYNIELDEGTDIMELQATPDDGNYSMTANGKQLSNDSIKVKFNGIGKYTINLGVKDDDTQRIGNYTLNMYLGIPVTPNVKDTINAVIKPNQWVIVNGRWRYNDTAGKCLKNTWYYDNKYKSYFYFNSRGNMQTGWMEDDDKWYYLEANGEMQTGWLYYKNEWYFLDNNGVMKTGWIKDNDKWYFLKDDGTMATGWITSNGTWYFMERNGSMRTGWIYYGKQWYYLDQSGAMNTGWVNENNQWYFLNADGSMKAGEWVYWKNNWYYLNYAGNMRCGWLYKDDKYYYFNEDGAMRTSPVEIDGYIYNFNNDGSVNFG >NZ_CP043998.1|WP_017212092.1|5424647_5426402_-|N-acetylmuramoyl-L-alanine-amidase-family-protein MIKRMTKATSLLVAAAAIISIVPAHAADYTKIDSQEGTIYNAVAYKDGKFYVDGEVNDKDEAAYYLADGKYNNLSDIDSGADTDIYGSKYLDVQDGDYFVDLDNGSVTDESIKENAEDDAASALRKNLKKDNDKRYVSTEAETIQDLAGAEIAGNKFSAPWYKFQYTKDNATNGTNTKLNVYTDAQGNYIDADYNLGSIKVTTTAASGTTNKTATISNTDDTYDAAGETVKDQLSASVDSDNAKVIGQDANNIYRIAKVTVTVKNGSTIAKINGIDVSVDTKTFDTTVSGSVSFSVIQKISKAQASGNVDGAKYAKSVTTYIVSDEDGKNEAFTYDNYTVANGKLVGYTANGTNVKTATGTLSSKNGYYYVDLGDEASEDVQVNGSKSAVDTDADGNLWRLDAGYIYEWNNDEDWTKVYKVDGSFDQMSVYNKDNIVAWSKEDDVYSVIGGKGTTTPTDPTPVVNKGWVKTDAGWTFYNTDGTQVKGQWVNDGGVWYYIKADGTMATGWIQDGSTWYYLQSSGAMKTGWLNDNGTWYYLQSSGAMSTGWLNDNGTWYFLNSSGAMLANTTVDGYKLGASGAWIK |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NZ_CP043998_8 | 5490319-5490465 | Orphan |
NA
Consensus repeat of NZ_CP043998_8
|
2 spacers
spacers of NZ_CP043998_8
>8.1|5490346|33|NZ_CP043998|CRISPRCasFinder GAAAGTTCCGTTATCATTTAACCAACCAGTTTG >8.2|5490406|33|NZ_CP043998|CRISPRCasFinder CCAAGTTGCTCCATCTTGAATCCAACCTGTAGC |
CRISPR arrays and Neighbor proteins around NZ_CP043998_8
The CRISPR arrays of NZ_CP043998_8 >merge|NZ_CP043998|8|5490319-5490465|CRISPRCasFinder CATAGCACCTGATCCATTTAAGTAGTAGAAAGTTCCGTTATCATTTAACCAACCAGTTTGCATAGCACCTGATCCGTTTAAGTAGTACCAAGTTGCTCCATCTTGAATCCAACCTGTAGCCATTGTACCATCAGCTTTTAAGTAGTA >NZ_CP043998|8|9|5490319-5490465|CRISPRCasFinder CATAGCACCTGATCCATTTAAGTAGTA GAAAGTTCCGTTATCATTTAACCAACCAGTTTG CATAGCACCTGATCCGTTTAAGTAGTA CCAAGTTGCTCCATCTTGAATCCAACCTGTAGC CATTGTACCATCAGCTTTTAAGTAGTA
>NZ_CP043998.1|WP_039770680.1|5487317_5489150_+|O-antigen-ligase-family-protein MTNSRNNSNEKSFNFFLPIAFILSIVPIIVRVAAVKLDENAIKIWGVTVKADLFSQRKALLLMIFSVILIITCVIFFKKIFSRKDKLVNYILIACGVFTLFTFLSAIFSKYRQVSFWGIFDRAEGFITIACYIILFLYSLYTFKTTNNYKYIITPLLILVFINSFLGLFQYIGQDLIKTSLGASIAGASSNSGIDLLNEKGTIYGTLASYNYMGSFVSIALPILFCYTIFEDDVMYKILSFIGTLLSFWLLFGSTARSGIVGVLGALIFGIIIFYKPLIKRWKGLLIGVVTLIILLVGANFASKGSLFKRIPSLASDAFSIFKDTSDLDYTNYTPVKDIKYIDSTTEVVLPNDTLRITYESGNPVFKNSNGEVVPYALNGKVLSTDSEAFKNITFAFGKLDKKSVISDSLLLNINNQPTFLFKLNDNKVFHLIDMSTKNYIDLQTPETFGFKGKEKLGSSRGYIWSRSLPLIKNTMILGTGPDTFVFDFPQGDLIGKYYAYDTPNIVVDKAHNLYLQIAINYGVIALLGFIAMLLIYIIDSIKLYALKNTFEDKNQMLGAISCLGIIGYLFAGIFNDSVVGVAPIFWILFGVGIAINFMNRENLRKKSNK >NZ_CP043998.1|WP_039770682.1|5485580_5487011_+|undecaprenyl-phosphate-glucose-phosphotransferase MIKENQNLLNKINAASDVAILFISMTLAYLIRFYIFSTDTQYIKLITYIQFSVIIVPIYLIVFNFFNLYHSFRTTVFIKECSQVIKANTIITTLLLSLLFAFKLVHDISRWVIIIFYFVNIILIIAKRFLLRRTLAKIRSKGLNLKHVIIVGAGDVADEYLKVIKSNRNFGYSYSGYIANTSNSEGKKLGNYSDLYEVLDRYKPDEVVCALDISDAKYIENIVSDCEKSGTKISIIPFCYKYIPSQPYIDQIGSIPLINIRRIPLDNFGNAFIKRALDIVGSLSLIICTSPIMLVTALIIKLTSNGPIIFKQKRVGLNKSLFTMYKFRSMKVNSNEETGWSTNNDPRKTRFGSFIRKFSIDELPQFFNVLKGDMSLVGPRPELPYFVDNFKDEIPLYMVKHQVKPGITGLAQVNGFRGDTSIKKRIEFDIQYIENWTILMDITILFRTAFKGFKNNEKIIIKNDALTENNDLDLKL >NZ_CP043998.1|WP_039770684.1|5484059_5485139_-|NTP-transferase-domain-containing-protein MKITAVVMAGGKGERFWPKSRKSLPKQFLSLTDDGKTMIQLTIERLKSLVDIDDVYIVTNKDYKNLVLEQIEGIPEENILLEPVAKNTAPCIGLAAMHIKKKYEDAVMIVLPSDHLIKYNEIYIDTLKAAIEVAKEDENLITIGITPSYPETGYGYINFGRDEEDIKRSNIYRVKRFVEKPNLETAKEYLSSGRYLWNSGMFVWKSSTILNNFRSLLSETYEGLEKIYETIGSEEEAYILEREFSKFESESIDYGIMERAGNIYTIPGSFGWDDVGSWLALERINRTNEDGNVIKGNVITINSKKSIIQGQDKLIAAIGVEDLIVVDTEDALLIASKDSTQEVKKVIENLKICNRNEYL >NZ_CP043998.1|WP_017212051.1|5483176_5483950_-|ABC-transporter-permease MNSLKELYNYREMLFSLVRKDLRTRYKGSVLGFLWTFLNPLLQLCVYTIVFSVILRSDVPKYYIHLFVALVPWLFFATSIQGSSASIIGSKDLIKKIYFPRIIIPISVVNAAFMNMLFTMIVVFFALIFSGIGFSWYILLLPIIMILEYLLALGLSFIFSALDVYFRDLEHILGIVIMVWMYLTPVLYGIDMIPDNFKPIFKINPMTPIVVAFRDILYYKQMPDFSNMWIILAWSIALIVIGYVVFEKLQKKFAEEL >NZ_CP043998.1|WP_017212052.1|5481939_5483175_-|ABC-transporter-ATP-binding-protein MEVIKIDNVYKSFKIYYDKGSTLKEKILFKNRNKHEIHKVLNGVSLNVEKGEVVGLVGENGSGKSTLLKLMTKIIYPDKGSIEIKGKISSLLELGAGFHPDMTGRENIYTNASIFGLTKKEIDDRIERIIDFSELGDFIDNPVRTYSSGMYMRLAFSVAINVDAEVLLVDEILAVGDASFQAKCFNKMQEIKNDGTTIVIVSHDLNSIEKLCDKAVWIDEGYKKLEGTPHDVIAEYLDKIMNKNVESKLQHETELEEDSEDKENEQKFENRTGNRDVEVRLVKIIECDSNEEKYIFKPEDSVKIIIEYVRKNDELLESVVGFGIMRKDGVNCYGTNTYIDNASKVKLNKSGIIEIFLEKIELLEGEYTLDIAFHDEYGKPYDYIRKIKEFSVYSSIKDSGIFRLKHEFRVK >NZ_CP043998.1|WP_039770686.1|5480512_5481919_-|methyltransferase-domain-containing-protein MDYSDDIYRKIKLRKEAEENINYKNNKNSNIDNGKSILNELEENVILINSLWNIDYDFQIRSHRKIIGRLLVFGKKVTRKLLKWYVRDTGIEQNKFNAYIVKAMNSTWDYINELNNINGKMSQEINTVYDNNKNLKREIELIQVKNKNLEIRNKDLEIRNKDLEIRNKDLEIRNKELDALIKLTEDNINNKIGILEERFNNSLNHYKEDITYLRYRMKYLINNKENSEKNNSNLIDSINSEIKERIIDDEIDYFDFENKFRGSESNVVEKQQIYLQYFNSTNKVILDIGCGRGEFLTMLSQNNIPCKGVDAYPEFVDYCKDKGLDVVLDDAISYLNTLEDNSLGGVFIGQVVEHLETSYVIRLFNLCRQKLCNGGKIIAETQNPETLGIFGDSFYVDPSHKKPIHPLQLTYIAESAGFKKVNRLYLNEFEEKIPYPIGIENDEDVNAAVDRLNKLLYGPRDYSIIGEK >NZ_CP043998.1|WP_017212054.1|5479447_5480500_-|glycosyltransferase-family-4-protein MKKKKVLVCSAKTPFMYGGAEIHAENLRYNLEARGFDTELINLPFKWYPNERLITECLTWNMIDLTEANGEKIDLVIPLKFPSYFVRHENKVTWLMHQYRPIYDLYGTKYSDFDLNNGFHRKIRDQVIKIDEKALLESKKIFANSKNVSNRLYKYNKIQSEPLYHPPKNIGKYFTEKSRNYILSVGRLDPLKRVDIIIKALKFCDKNISAIIAGTGGMEKDLRKLAEKEGVSDRVKFTGFVTDEELIKLYAEALAVMFPPVDEDYGYITIESFLSKKPVLTASDSGGSLEFVVDNRNGFICDTAEEFGEKINFLYKNKRIAEDMGIEGYEAVKGISWDNVIDRLTESIRY >NZ_CP043998.1|WP_039770688.1|5478019_5479303_-|glycosyltransferase MKIAFVTPLSPEKTGIADFCEEILPLMKDYFQIDLFSSHNNPSNKIISENFKVYKYEKLEDENIRNQYDMIVYQIGNNVECHGKIYELALKYKGIVELHDISIEGLIWGMTLKNNNRDKYLDIVEYCHGKEARRRAEGAFNGECIPLWDEPLRFPLNKKLIDSAEAVIVHSDLGFQIVKGTRNNLNIAKIYHHTNDIYNNYDELKEIYKKELGMGNELIISSFGFATRTKRIPQILEALSKVKEQGCKFKYIVAGKVEEEINIKDLVDKFGLRDNIEITGYLSLEELKKYMLATDICLSLRYPSHGESSGIFHRILGMGKLAVITDEGTFSEYPNKVCLKISMENETENIKNAIIDIINGKINMKEYERNAMEYAKSNFDIKENVLMYKSFIENPYDNNLYDPLDIISDYLYKLGIVEKDLINSLKF >NZ_CP043998.1|WP_017212056.1|5475864_5477928_-|hypothetical-protein MFNKEDSNKRIVFALGCLLGALVFIWFYGIRVLDVTYDSWLMEGGDLSQHYIGWQFFRNSSWSFPFIGLIDGLIYPYKVSVIYMDTIPGLSIIFKILSPILPQTFQYFGIWGILCFMLQGGIGALIIRKFTAQYIICIASSMLFLLSPIMIYRLFGHASLAGHWLILLSIYIILNKSKFRDIKKSIGAWSIIVFLCVNVHMYFLAITMLLLLCYLAIDYFENKSIARVISVLGSSIFIALITLFILGAFYGSADYETVGLGFYSANINALFNPQGYSRYLFNLPTATEGQYEGLAYIGLGVIIALIVALYFDIENVLKIKNEKISIFIKNNYIKFVIFITMIIFFIIALSPQVSLNGKMLLNIPYPKIIIKFLNVFRSTGRFMWPICYFIVIYAIRKILNISVKKQAIIFILICVIIQMSDLSNTRNDRYDRFSHNIEYNSEIKSPLWDKLIKNNYKHIAFMKYTVQNDKSLWSLCKYAADNNLTMNDGYVSRKDSKAVNAIKDEYLQQLESGICRDDTIYVFGNDQNILESLKDYPLSYYNLDGIIVGIKEKFTDMNDYREEHEEKLKQGINILPKEDKYMNYGRDTDKGRILNPQGRSFGPYSEIAQGTYNVVIEGENLNKIVKYDLCYKQGEKTINLQEIERNNEKIVFTFNLETDIQDLECRVVNGNDENVILTKIVINKIVQ >NZ_CP043998.1|WP_017212057.1|5474869_5475838_-|glycosyltransferase-family-2-protein MGKYDGERIVDIIIPCFNESEVLDIYFIETKKIVSEIYGYEFNFIFVDDGSKDSTVDILKKYAKENECVKYISFSRNFGKESAMYAGLKNSVGDYVLIMDADMQNPPTLIEKMLKAVSEEGYDCCSANRTRNGDPALRTYFSRKFYSLINKISEVDMPDGAGDFRMMSRKMVNAIVAMGEVQRFSKGIFSWVGFKTKWIYFENVERAAGQTKWSFWKLFKYALDGITAFSTFPLRIASFVGCIVSASSFIYLIYIIMKTIISGKDIPGYASTITLILFIGGIIILSCGILGEYISKIYMEVKNRPIYIVRETNIDQPKNDYR >NZ_CP043998.1|WP_039770676.1|5492912_5494130_-|cell-wall-binding-protein MNRNLKKIIAIILAVNTISTIAPVANLSLLTTKAYAANKITNLTVEDSNGDNMSLYSESDCTDKHRVDSDDVQPGKTYYTRKTSADEINIDADGVDSDNIRVFEETSSDTEGKDIGEDVDLSSGTNVITVRVYNGDPGTVKYSDNSYVNEYKIRVKYSESNDDDDEDSDNVYLSSITLMGGNIDFSKKVYTYDVQVPEDLSKITIRARPDCDSGKYDDYKVKINGVKVDKDDKFKDDVSLNKGKNVIDIKVEDDDDNERVYTLNITRGKDNSNNNSKSSEQAEVTKTSQWVQVDGKWQYKDSTGNSVKNTWVQNYFVQADGNMATGWLNNNGKWYYLGDDGARKTGWQLVNGNWYYLDSQGTMQVGWIKDISNGKYYYLNNDGSMAYSTTVGEYKLGSDGAWYNR >NZ_CP043998.1|WP_039770674.1|5494274_5495519_-|cell-wall-binding-protein MNKNIKRVIAIVLAIGTISATTPVSKINLLTTRAYASTTNDESTLDSLSLDDSDGNNVKLYDDNDYKNRVKENDVHEDETYYAKTSSKTVSVDISGPDDNFVRVFRDSSDSTKGKEVGDDIQLTDKSVVTDLIIKVYGKDLDGETVRNNEHDDDEYNLLNTYEVKVRHVDEADSDKTDFDDIYLERLSIAGSTINLSNSITKYTYNVDSNVNQVAIKATPENDNYDVTIDGEDADYDDNYKRTVNLEKGQNIIKVEIEHNNKDRVYTLIINRGNVSSSNTNNGSTNTNTNTGSKDVKANQWVQTNGIWQYNDAEGKVVKNSWIQNYYLNADGNMVTGWLNLNGTWYYFGTDGAKKVGWQQSSGKWYYLDSEGRMQTGWVKDRNGKYYYLNSDGSMAYNTKIGVYRLGADGAWIK >NZ_CP043998.1|WP_039770672.1|5495569_5497111_-|cell-wall-binding-protein MKKNMIKIVSIALALGIVSAAAPATNINVLTTKAFAATDNDDDYLDRLELNDEDGNNIKLYSDSDYSSKVNASDVEEGETYYAKTSSDTVSIKIDGPDEDYVRVFNGTSSSSKGKEVGEDVDLSDDSSTTTLTIKVYGKEPDDNMRYKDNDDYNVLSTYRIKVENANYSQSKNKDNIYLERLSVNNNKVELSKSESTYTYNVASDVKRVTIKATPEDDDYDVTIDNKNVQSADNYKKEVDLDEGTNEFEIELEDGDKDRVYTLIINRGNPSSNGTSSQDTAETEHQDSIYLDKLSIDGRLFSLSQSQVNYSSNVPSDVNKVTIKAEPEKDFYTVKVNGDEVFEDDDYKTTVNLKDGENKIKVDVKNENSDEERVYTLTVIRGSVTSTQNNNGSSAANQWVQVNGIWKYNDASGNFVKNTWVGNYYLLDNGNMATGWLNYNGSWYYLGSDGARKTGWQLVDGAWYYLDSQGKIQTGWIKDSNGKYYYLNSNGAMAYNTTVGGYKLGYDGAWIQK >NZ_CP043998.1|WP_039770670.1|5497341_5498616_-|cell-wall-binding-protein MNKNLKKIVAIALAIGAISAVAPATNINFLTTKAYASSDDDSNDETELESLQLLTESGSKIKLYESSSYDSDDKVDADDVEAGEKYFAKTSSDTINIDIDGPSSKYVRVFKGTSDSTKGKKISSDISLDKDSTTTLTVRVYDEEPDDDVRYEDDDYSSEYTIKVKCTADSSDSDDEDSSDSSDDYDDIYLDRLSVDGQSISLSKSKVEYTYNVSSDTDEVTIKATPEDEDYDVTIDGDSVDDDDKYKSDVDLKKGENKIKIELEDGDDERVYTLIINRGGTSSTTGSTTNTASGSPSSATDVVATVTNKWVQVGGNWQYKDATGNTVKNTWVQNYFVQADGNMATGWLNYSGKWYYLGSDGARKTGWQQAGGKWYYLDSEGAMQTGWVRDLGSGKYYYLNSDGSMAYNTMIGKYKLGSDGAWIN >NZ_CP043998.1|WP_012060918.1|5498780_5500082_-|cell-wall-binding-protein MHKKIKYIIAATLVVAAVSGFAPSNNFLLGSVEAYASTYNDASNGELKSLDLTWGSGSKIKLLDSYSGDEVDLSSDTDYYVQLKGVSDFNVAAEVKGSGYVVKMFTSSSRSEKGEDVGQDVNIGSGYKDIYLRTYKSEEAYKEAYNDGDVSDCEKTYIIHARKESSTSEAEEDREYAYLDGIYLSDGSVDFSKNKTSYDVNVGEDVDKLTVRANPDDDDDYIEINGNSVYEDDNFEKTVNLDKGNNTITIYVEHEDEDTTYTLNVYRGKSANKTDSSNGQNFAIQTQEGSLNAWQRVDGKWRYVDGTGSVLKNKWWFDKDTGKNYYLGQDGFRTTGWFSDNNNWYYFNENGEMQTGWVNTNKNWYYLNKSGAMQMGWLEDSTGNWYYLDGSGAMETGWIEDSNGKWYYLDSTGKMIKDSAIGAYKLGTDGELE >NZ_CP043998.1|WP_039773667.1|5501205_5502933_-|cell-wall-binding-protein MNKNIKRIIAITVAVNTISTISPTTLNTYFVGAKPVYASSYSPDDEQLKTLKIKSLDGETLDLRDGYNGDTVKLSDETEYYTKLTDNSDGIKITADAEGDDYVVKIFTSDAENATAYDPGDEILLGKGDTTLYIRTYKSKSEFNKVKNNVSNCKEEYTLNVRKTKESSYEDDSQDSIYLDKIDLSKGNIDFLKGKTSYDIKVDENVDSMWIKAIPESNSDRVRVDGSLVDSSDNYKKTVSLDKGKNEIKIKVTDSKDNQRTYTLNVTRGDDSDNEDDIYLDHITLSEGDIDFSKDDNSYNVDLDESVSKITIGAEPEDSDYSVTIDGDEVRSSDDYEKKVSLDKGKNVIKVNVEDELNDKKRTYTLTINRGKEADDSKDNNTGDTSDKKSQWVQTDDGWKYYDENGKVLKSSWLYDKDQKVYCYLDKDGLRVTGWHKDNEKWYLLDSKGAMLTGWQKDNEKWYLLGSDGAMLTGWHKETVDDQKKNTDASTNSGDNDTKKVDNWYYLNQDGSMRTGWLSDGGKWYFFNADGTMQKGWLIDYNSKYYLTEDGSMATGTRTINGKEYKFNNSGALIL >NZ_CP043998.1|WP_039773669.1|5503166_5503424_+|hypothetical-protein MSKERTPYNPTPGDYDVEKLSGTRLESSNRQEGRDNIAPTRSLNPLSTDGPNKNITSSTSSKPHPVTGPVAMNYEDAFEYKNHNI >NZ_CP043998.1|WP_039773671.1|5503444_5503666_+|hypothetical-protein MSKEKMSSNENEKYYSEEELTDSHPSDPNDSELKKIKSMYLPDSKADHAPSEKSIENANGLEHPEPVKPKSLI >NZ_CP043998.1|WP_039773673.1|5504054_5504306_+|hypothetical-protein MSQSKIPFSINPGDDYPMEEYSKENSSKSRASDSKNVRKTADSGERNAKSLNNANISRTNLDTELIDLNADGDSDESKYSDLI >NZ_CP043998.1|WP_155715590.1|5504351_5504495_+|hypothetical-protein MSKGKYPYVPTPEDVPAPDLSYIFSPESKNSGNKNDNENTDSQKRNS |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|---|---|---|---|---|---|---|---|
NZ_CP043998_3 | 3.2|3575209|36|NZ_CP043998|CRISPRCasFinder | 3575209-3575244 | 36 | NC_020843 | Vibrio phage 11895-B1 genomic sequence | 105305-105340 | 7 | 0.806 |
NZ_CP043998_8 | 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder | 5490346-5490378 | 33 | MT446411 | UNVERIFIED: Escherichia virus TH40, complete genome | 28967-28999 | 7 | 0.788 |
NZ_CP043998_8 | 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder | 5490346-5490378 | 33 | MT446412 | UNVERIFIED: Escherichia virus TH41, complete genome | 156610-156642 | 7 | 0.788 |
NZ_CP043998_8 | 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder | 5490346-5490378 | 33 | MT446392 | UNVERIFIED: Escherichia virus TH15, complete genome | 21954-21986 | 7 | 0.788 |
NZ_CP043998_3 | 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder | 3575339-3575373 | 35 | MF417921 | Uncultured Caudovirales phage clone 10F_5, partial genome | 37187-37221 | 9 | 0.743 |
NZ_CP043998_3 | 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder | 3575339-3575373 | 35 | MF417895 | Uncultured Caudovirales phage clone 10AX_1, partial genome | 5840-5874 | 9 | 0.743 |
NZ_CP043998_3 | 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder | 3575339-3575373 | 35 | MF417965 | Uncultured Caudovirales phage clone 3S_17, partial genome | 489-523 | 9 | 0.743 |
NZ_CP043998_3 | 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder | 3575339-3575373 | 35 | CP016969 | Staphylococcus epidermidis strain DAR1907 plasmid unnamed1, complete sequence | 18984-19018 | 9 | 0.743 |
NZ_CP043998_3 | 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder | 3575339-3575373 | 35 | MF417901 | Uncultured Caudovirales phage clone 9S_1, partial genome | 1262-1296 | 9 | 0.743 |
NZ_CP043998_3 | 3.5|3575404|34|NZ_CP043998|CRISPRCasFinder | 3575404-3575437 | 34 | NZ_AP017969 | Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-1, complete sequence | 77894-77927 | 10 | 0.706 |
NZ_CP043998_7 | 7.1|5405204|34|NZ_CP043998|CRISPRCasFinder | 5405204-5405237 | 34 | JX486088 | Lactobacillus phage ATCC 8014-B2, complete genome | 10237-10270 | 10 | 0.706 |
NZ_CP043998_7 | 7.3|5405324|34|NZ_CP043998|CRISPRCasFinder | 5405324-5405357 | 34 | GU075905 | Prochlorococcus phage P-HM2, complete genome | 11901-11934 | 10 | 0.706 |
1. spacer 3.2|3575209|36|NZ_CP043998|CRISPRCasFinder matches to NC_020843 (Vibrio phage 11895-B1 genomic sequence) position: , mismatch: 7, identity: 0.806
gtggttaaactttcaaaactttgctaaatggtttga CRISPR spacer ttggcacaactttcaaaactttactgaatggtttta Protospacer ***. ***************.**.******** *
2. spacer 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder matches to MT446411 (UNVERIFIED: Escherichia virus TH40, complete genome) position: , mismatch: 7, identity: 0.788
gaaagttccgttatcatttaaccaaccagtttg CRISPR spacer aaaagttccgttttcagttaaccaaccagaagc Protospacer .*********** *** ************
3. spacer 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder matches to MT446412 (UNVERIFIED: Escherichia virus TH41, complete genome) position: , mismatch: 7, identity: 0.788
gaaagttccgttatcatttaaccaaccagtttg CRISPR spacer aaaagttccgttttcagttaaccaaccagaagc Protospacer .*********** *** ************
4. spacer 8.1|5490346|33|NZ_CP043998|CRISPRCasFinder matches to MT446392 (UNVERIFIED: Escherichia virus TH15, complete genome) position: , mismatch: 7, identity: 0.788
gaaagttccgttatcatttaaccaaccagtttg CRISPR spacer aaaagttccgttttcagttaaccaaccagaggc Protospacer .*********** *** ************
5. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417921 (Uncultured Caudovirales phage clone 10F_5, partial genome) position: , mismatch: 9, identity: 0.743
gtaggtgacaacagtacaggcaagtcagaaatcgg CRISPR spacer caacaagacaacattacaggcaagtcggaaattga Protospacer * . ******* ************.*****.*.
6. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417895 (Uncultured Caudovirales phage clone 10AX_1, partial genome) position: , mismatch: 9, identity: 0.743
gtaggtgacaacagtacaggcaagtcagaaatcgg CRISPR spacer caacaagacaacattacaggcaagtcggaaattga Protospacer * . ******* ************.*****.*.
7. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417965 (Uncultured Caudovirales phage clone 3S_17, partial genome) position: , mismatch: 9, identity: 0.743
gtaggtgacaacagtacaggcaagtcagaaatcgg CRISPR spacer caacaagacaacattacaggcaagtcggaaattga Protospacer * . ******* ************.*****.*.
8. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to CP016969 (Staphylococcus epidermidis strain DAR1907 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.743
gtaggtgacaacagtacaggcaagtcagaaatcgg CRISPR spacer caacaagacaacattacaggcaagtcggaaattga Protospacer * . ******* ************.*****.*.
9. spacer 3.4|3575339|35|NZ_CP043998|CRISPRCasFinder matches to MF417901 (Uncultured Caudovirales phage clone 9S_1, partial genome) position: , mismatch: 9, identity: 0.743
gtaggtgacaacagtacaggcaagtcagaaatcgg CRISPR spacer caacaagacaacattacaggcaagtcggaaattga Protospacer * . ******* ************.*****.*.
10. spacer 3.5|3575404|34|NZ_CP043998|CRISPRCasFinder matches to NZ_AP017969 (Fusobacterium varium strain Fv113-g1 plasmid pFV113-g1-1, complete sequence) position: , mismatch: 10, identity: 0.706
atgaaaacgtagtaatagctgatgcacaatatgc CRISPR spacer gtaatggagtagtaatagatgattcacaatataa Protospacer .*.* .. ********** **** ********.
11. spacer 7.1|5405204|34|NZ_CP043998|CRISPRCasFinder matches to JX486088 (Lactobacillus phage ATCC 8014-B2, complete genome) position: , mismatch: 10, identity: 0.706
ctatattaaagcagatggtatcatggctactggc CRISPR spacer cggtattacagcagatggtattatggcaaactat Protospacer * .***** ************.***** * . ..
12. spacer 7.3|5405324|34|NZ_CP043998|CRISPRCasFinder matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 10, identity: 0.706
ttacttacaatcatcaggtgctataaagactggt CRISPR spacer agaaacaaaatcatcaggtgctgttaagactgca Protospacer * .* **************.* *******
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
432223 : 485474
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NZ_CP043998|432223:485474|DBSCAN-SWA TATGGATAAAAAAATAATTTTAGCAATAGAATCAAGTTGTGATGAAACTGCTGCTGCAGTAGTTGTGAATGGTAGAGAAGTTTTATCAAATATAATTGCATCACAAATTGATACTCATAAAAAATTTGGAGGAGTGGTTCCAGAAGTCGCATCGAGAATGCATATTGAAGCAGTAGATAGCGTTGTAAAAGCCGCATTATTAGAGGCAGGGATATCAATAGATGATGTTGACGCAATAGGAGTTACGTATGGACCAGGACTTGTTGGGGCACTTTTGGTTGGGCTTCAATACGCAAAAGGATTGGCATTAGGTTCTAAAAAGCCTTTAATTGGGGTTAATCATATACAGGGACATATTAGTGCTAATTTTATTGAGCATAAAGATTTAAAACCACCTTTTGTATCACTAGTGGTTTCAGGAGGACATACTTTTATTGTGCATGTAAAAGGATATAGGGATTTTGAGGTTATTGGCCAAACAAGAGATGATGCGGCAGGAGAAGCTTATGACAAGGTGGCAAGAGCATTAGAACTTGGATATCCAGGTGGGCCCAAAATAGATAAGCTAGCGAAGCAAGGAAATAAGGATGCAATAGAATTTCCAAGAGCTAAGTTTCAGGATGATACATTAGATTTTTCTTTTAGTGGAGTTAAATCGGCTGTGTTGAATTATTTAAATAAAGCAAAAATGAAGGAAGAAGAGACAAATAAAGCTGATATTGCAGCGTCATTTCAAAATGCGATAATAGATGTATTAAAGACCAATTTATTCTTAACTTGTGAGAGAAAAGGAATAAAAAAGATTGCAGTGGCAGGTGGTGTTGCATCAAATTCTTGTTTAAGAGAAACTTTGCTAGAGGAAGGTAAAAAAAAGGGGATTGAAATTCTATTTCCATCACCTATATTGTGTACAGATAATGCAGCAATGATAGGAAGTGCAGCATATTTCAACTATCAAGAGGGAGCAGTATCAGATTTAAATATAAATGCAAAACCTAACTTAAAACTAGGGGAGAGGTAGAGGCTAGGTATGAAGCTGTTATCACATTCTAATGGAGTACATAAGGTTGAGAAAGATAAAACCAGCAAAAGGAGCATTTTAAAAAAATGTGTTATCTTTTTTGTGGGATTATCTATCTTTGGTTTTTTAGTGCAAATTTTAAATGACTTTGTAGATAATACAAGATTAAAATCCAGATTTAAGTATGTCAGAATAGATGGACGTAAAATGGAGTATAAACTTAAGACTGGTGGAGATTATACTGTAGTATTTGATGGATCAATTGGAACTACAATGTATGAGTGGGATGATGTTTGTAAGTCATTAGAGGAGAAGAAGATATCTACCTTTACATATAATAGAGAAGGATATGGATTTAATGATGGCGGGGATAATAGAACACCAGAAGAGCAGGCTAAGGATTTGAAAGCATTGCTTAGAAAAGCTGGAGCACCAGAGCCATACGTTTTAGTTGGAGAGGAGTACGGTAGTCTGGTTCTTAGTAATTTTGCCAATTTATATTCAGATTCAGTAGCAGGAGTTGTGTTAATTAACCCAATATCAGAGGAAAATATTCAAACTAAGGAATTTAAGAATAGTATTAAGTCCAAATATTATAGAAGTATATTTGAGAAAATGGGTACGAATTTTAGTTTGACTGCATTGCTAAATAAAGCAGGGTTAACCATGGAAAATAATACGTTTAAGAAGTATTTAAATCAGAATGAATTAGATGAATTTCAGAGTTTTGAAAATAAGAAAAATTATAAACAGGCAGTTTCAAACGAACTAGAAAATTTATATAAAGGCATTTCGAATAGTCAAACTAATGAACTACTAGGAAATAAGCCATTATATTTAATAACTAATAATGAAGATGATCCTGTTAAAAAGATTGGTAATACAACAGTAACAACTATATATAAAGAGGAAATAGAGGGATCTCCAATGTCTGTATTAGATCCTGACTCAGTAGTTACCGGCGTTAATAGTGTTTTAAAAGATGCTAAGAAGGCAGCTAAAAAATCTTGATGCTAATAAATATGTATATTTTATTAAATATTAAGTATTATTGAATAATTAAGAAATAAAGCTTCTATTGGGCTAAAATTCATAAAAAATTATATCAAATTATATATTCTTGTCATTTGTTTGACACATAATAAATCTATACTAACACTATAAAGATAATACTAGTAGATATTTAAAGTATTCTAATATACTTTATAAGAACGAATTTGTATAGTTTAATTACTAGTCATATAAGTTGAGAATTGATATATAGGAGGAAAAATACATGAATAATAATGATAATAACGAAAAATTTATTGATGTAGAGTCATTACCAGTAGATAAAGGTCAGCAAGTTGCATGGGAAAATTGTTTTCAAAATAGTAATAATTATGTAGATCCGAAGAGAAAGAAAAGAAGAGGTCTGCGCATGCTAGGAAGGATTGCAGGAATTTTAGTTCTTACAATGGTAGGAGGGGCAATTGGAAGTGCTGCTACTTATTCATTCATGAAAACTAATAATGTTGCTGCAACTAAACAAATAACAAGTTATATTCCGCAATCATTCACATCAAGCACTCCTGATGCAATGTCAGCGGCAGATGCATTTAATAAAGTTGCGCCAGCAGTTGTCATTGTTTCGACGAAAGGTTCATCTAACAGTGGATTTATGAACGGCGAAGTTGAGGGGATGGGATCAGGGTTCATTATAAATGAAGAAGGATATATACTAACTAACTATCACGTAATTGCAAATGCTAAAGAAATTACAGTAACTTTAAGTAATAATACTGAAGTAAGTGCAACAGTAGTAAATTATGATCAAGATAGAGATGTTGCAATGCTTAAATTAAAAGATGGAACTAAAGTTCCTGCTGTTGCAGAACTTGGAGACTCTGATGAAGTATATCCAGGAGCTGAGGTTATAGCAATTGGAACACCTCTCTCAAAGAATTTTGCTCAGACACTTACAAAGGGAGTTATAAGTGGAAGCAATAGAACAATAGATGATAGTGGAAAAAGTGTAGATTTCATTCAAACAGATGCAGCTATTAATCCTGGAAATAGTGGAGGTCCATTAGTGAATGCTAAAGGGCAAGTTATAGGAATAAATTCTATGAAGATAGGTTCTGATGCATCGGGATCATCAACACCAGTTGAAGGTATAGGGTTTGCAATACCTATAAATGAAGTTAAGAATAAGATAGATGCTTTATCAAAACCTATATTAAATCTAGGAATTCAAATAAGAGAAATTGACAGCGCTACAGCTAAGAAATACGATTTGGTAGAAGGAATATATGTATCTTCTGTTGAAGAGTATTCACCGGCTGAAAAAGGTGGTCTTAAGATTGGAGATATAATTGTTAAATGCGATGGAAAAGAAGCTAAGACATTCGATGAACTTAAGACAATAAAGGAAAGTAAGAATGCTGGGGATACTATGAAGATAGAAGTAATTAGAGATAAGAAAACTGTTGATTTGTCAGTTGTATTAGAAGAAAAATCTAATTAAAATCCTTCTAAATAGAAATTAAATATATTTGAGTGTTAAAACTAGAATTGATAAATTTAATGTTATCAATTCTAGTTTTTATTGCATCAAAATAATATTCTTTAAAACTTTAAGGAAAAGTAGTAAAATTAGAGATTATAAGGGTAAGGTATCTTAATTTAATAGTTTTTTGATATCTAAATGGAGAAGGGGATAATTTATGGAGGAAATAATATTAAATATAATAATGCACAGCGGGGAAGCACGAACTTTTTCTATGGAAGCAATTACTTTAGCTAAACAAGGAAATTTTGATAAAGCAAAAGGGTTAATAATAAAAGCTGATGAGGAATTAGGATATGCACATAATTCTCAAACAAGTTTAATTCAGGGAGAAGCTGTAAATGAGAAAATAGAATTCTCCTTGCTTTTAGTTCACGCTCAAGATCACTTAATGACTACAATGGTTTTGAAGGATTTAGCGGTTGAATTAATAGAAGTGCATGAAAAAATAAGTTCTATTAAATAGAGGTATATAAATATGAAAAATAAAATTAAATATGCTATTGTATTTTCGGTTCTTTTGTTAATTGGAATAGTAAGCATTAATCTATTTCAACCGAATAAAGAGCAACAAGTTAGAGGAAATATAGAGCTCTTAGTAAATGAGAATTCTTATGAGTACTTAGTTGAGTGCGCCAATAATTTTATGAAGGAGAATGATAGGACTTCAATAAGTGTAAAGAAGTTAGAAAATTACAATCAGATAGTTAATAATAATTCAGAAGGAAGTACGAAATCAAAGATTTCTAGTATAGCGCAGATAGATAGGTTTAGTTTTGATAAACTAAAATTGGATAACTATGAGTATTATAACAAGGATGATAAGCTCTTGAGCGAATATGCTAAGAATTTTTCTAAGTATAGGGTGGCTCAGGTTAAATATGGTGATAGTTCCATAGGAATACCTTTAACATCTAGGCCATTAGCTTTCTATGTCAGAGAAGATTTATTAAAAAGTTACGGATATGAAAGAGATAGTCTGAATACATGGGATGATATTATAAGGATTGGAAAAGATATTCATGAAAAAAGTAACGGAAAAATATTTATAATTAATGCAACTGATCAAGATTACGAAGATTTGATGGATCTATTAACCATGGAAACATTAAGTGATGGCGATAAAAGCACAGATGTAGTTAAATCAGAAATTCAAGCTATGATGAAAAAACTAGAGGATAATAATATTTTAAATTTACAAAATGGAGGAGAATTCTTAGCAAGAATATCGTCTATTAATGCAATGAAAGAAATAGCAGCATTAGATGTTCCTTGTACGTGGAGTGTTAATAACGTGCCTAGCCTTAAACCAGGGGCTAATAAGTTTTTTTCATCAGAAGGAGATAATTTATTAATATTAAACCAAAACAGCGAGAATGATAAGCTAATTGAAAAATTTATAACTTACGTAATAACGAACAACAAGGAAGCTGTTAAATATGTTAAGGAAGGAAAGTTTTTCTCAAGCTATTTATATACTTATAATACTAAAGATATTGAGGAGCCAGTAAAAAATTTTACTGGAAAAAGTCCTCTTGTAGTATTAAGTAATATAGAAGAAAAAACTCCAATCATAAGTAATTACGATGAATATATAAAGATAAAGCAAGAGATTCGAGCAAATACCAATTAATAATGAGAATTTATATAAATAGTTTTAGATTATCAGCATTATAAGAAAAACAGTAATGTGTTTCTTATAATGCTGAATTTATTTTAAATAGTATTTGAAATATCACTCTGAATTCACATTTAATTTATTACTAAAGATTTAAATAATTATAAAAGTCTAAGATATTAAACTTCTATAGGCATTTAAGGTATTCTTGGCAGTCTTATTCCAAGTAAAGTTGAGGCTTCTTAGATATCCCTTTTCACTAAGCTCAGCTTTTAAAGTTTCATTATTCAAAAGATCAACTAAGGCATTGTCTAATTCTTCTATATTATAAGGATTTATCAAAATAGCACTATCACCAGTTACTTCTGGAATAGAAGTTATAGAAGATGTTATAACTGGTGCCTTACAGCTCATTGCTTCAAGCGGAGGAAGGCCAAATCCTTCATAGAAGGAAGGGTATACAAATGCATCACACCCGCTATAAAGAACAGGAAGAATATCATCTTCTATATATCCACAAAAAACAACTTTGTCTTGTAAGTTATTTTCTTGAACAAATGAAAGTAACTTTTCACCTTCATCTTTTAAAGGGCCCCCAAGCAATAACTTATAAGGCTTATTCAAGTCTTTATAAACTTTACAAAATGATTTAATTAATCCTAAGGCATTTTTCCTTAAACTAAACCCACCTATATATAATATATAAGGATCATCAACTTTAAATGTGTTTTTTACGTATAGCTTACATTGATTCTTATCCAAAGGTTTAAAATTATTATTAGCGGCAAGTGGAGTTACAAATATTTTTTCTTCAGGATAAAAACTAAAGAATTTCAATATATCTCTTTTAGAGTATTCAGAAACTGTTAGAATGCCGCGTGAATTAGAAATTATATTTGGCATATTATTTAAAAATCGTTCTAGGTATCCTTTGCCAACAGTTTCAGGCATTATATATGGGATTAGATCATGGATTGTAACTATAGTTGGTATTTTTGTATCAAAATCGAGTCCTATTCCGTTTTGAGGAATATGATATAGGTCAGCATGGACCTTGTTAAGTGCATTAGGTATATAATATCTTTCATAAAAACCGCCATGTCTACCTGAAGAATAAATTATATTAACATTTTCCTTATTGAATTCTTTGTTAAATTTTCCAGAGCAAAATAGAGTGAATTCATCATTCGAATCTAAAGAAAGAATCTCTGATATGAGATTACTAGTATAAGTACCAATTCCAGTTCCTTGATGTAACGTGGAACTACGAGCATCAATGGCAATTTTCATATGAACACCTCAACAAATTACATATATAATACAGAATATTATTAGTTTTTAATTTTTGTGAATATAAATCACAATAAATTATTTGAGCACATATAATAAAAATAAATAATAGCTGGTAGGAAAAGTTTATGGAGAATAATAAGGAGATACTTAAAATTAAAGGCTATATTGAAGAAAATTATAATTTAGATGTAGAAGATATTGAAAAAGTTAAAAATAGTTATAAAGTTATTACAAAGGATGAGAGATATTGTTTGAAAGTAGTTAAATATGAATTCTCTCATTTTTATTTTATCTTATCTGCAATGAAGCATTTACAAAGAAATGGATTTGGGGATATTCCTGAATTTATTATGAATAGAGAAAAAAAAGAATATGGGAACATAAACGGAAAGTATGCGTACTTAACAAAATGGATTCCATCGAGAGTAAGTAATTATGATAATCCAATAGAATTATCAATGGTATCAAATGAGCTTGCAAAATTACATGAATGCAGCAAAGGATTTACATTGAAGAAAGATATGAAACCAAGGATTGGATGGTTTTCATGGATAGATGTTTTTGAGACAAGGAGAAGAGAAATACTGGATTTTAAAAATAGAATAAGTCAAAAAGCATATAAATCAAATTTTGATTTATTGTATTTGGACAATATGGAAAAAGAATTAAATAGAGCAGAAAAGAGTATAGTAGGTCTTCAAAAAAATAATTATGTAAAGGTTATGGAAAAGGAAGTTCTTTCAAGGGGATTTTGCCACCATGACTATGCTCATCATAATATATTAATAGATAATAAGAAAAATATTAATATTATAGATTTTGATTACTGCATATTAGATTCACATCTCCACGACGTATCTTCTTTATTAATAAGATCAATGAAAGATGGAAAATGGGAAAGCGACAAATGTAATCTAATTTTAAATGCCTATAGTGAGAGAATAGAAATAAGAAAAGAAGAGCTACCTATAATTAGAGAATTTATAAGATTTCCTCAGGCTTTCTGGCAAATAGGGTTGCAGGTTTATTGGGAACAGCAACCATGGGGAGAAGAATTTTTCATCAATAAGTTAGAGAAGTACTTAAATGATTGTGAATTTAGAGAAAAGTTTATTGATAGTTATTTTAGTGGGGGAAATTAATATGGATGAATTATTGATTAATCAGTATTTAAATAAAAAAGGAATAGCTATTATGGGACAAGGTTTTAGTTATGATAAAAATATGCAAAGAAATGATATAGTTTCTCAAGTTGATTTAATTATAGAATTTCATAAATTGCTATTAGGCGGTAATCTAACAGGGCTAAGCAAAATTAAAAGCACAATAGGCAGAGAAGTGGAATCTTATAAAGTGCAGATAAGAAAACTACAAAAGAATTATTCATATGTATCTAGTAAAACATGTACAAATGAGATAGAGAATATCATATTATCAAACGGAAAAATAATGTTGGAAAAAGCTAATAAGGCTATAAATTATATTTATGAACATGACTACTTTGGAGTTATAAGACGTAGTATGAATAGAGAAGAAATCTGCCTTGGTAAAGTTGATAAAAGTAATTTAAGAAAAAATAATGAAAAAATAGAAGTGTGTACAATAAAAAGTATGACATATAACTTGGTAGAAGAAGACTTATATAATTATATTAAGAAACTACAAAGAAAGGATATTAATATAGATGAGGAAGAACTAATAAAGTTATTTGTACATGGATCACACCTATCATTTAACAGCTTTGATTATTTAAGAGGGCTTTGCAGTTATCCAAAGGATTTTTTAAAGTTTTGGGAGAGGTATAGAGATAGTAGAAAGGATAATACAAGGGAAATTTATAATATACAAAATGAGGAATGTAAGGGTAGTAGGAAAGCAAGGAATGACGAACAATTATTAAATGGATTGAAGAAAAGTTTAAAGTATGAAAGTAAAAATTTTATCATATAGGTAACCAAAGGTAGTTATTGTTTATACCTAAAGCTTAGTTGTTAGGAGGAAGAATATGAATAGAACTAAGTATTCAGAAAAAAATTATTTATGCGATTATGATTTGAGCCTAAAGTTCTTCGAAGAACTAGGAATAAAAGTAAACGACATTGTTCCACTTAGAAAAGTATTTTTGGTATATACAGATGAAGGAAATAAAATATTGAAAAGAGTAAATTATGATGTAGATAGAGTCAATTTAATAAGTGATTCTTTAGACTATGTAAAAAAGAGTTATGAACATGTAATAACATATAAAAGGTTCAAAGATGATTTATGTTATAAAGAGTGGAATGGACAAATTTATATTGTTATGGATATATTGAATGGAAGAGAAGCATCATTTTCTAATCCAGTAGAAATTGATCTTTGTGCAGAAAATATAGCTTTAATGCATAAAGCTTCAAAAGGATTAAGAGAATATTTGAAGGATAAATACAAAAAAGATTTTCTAGATATATCTTTGAAAGATAAAATTAAAGAAGCATATGATGATTTAATTTGGATGAAGAGCTTAGTAGATACGTACAAATATAAAAATGAATTTGATAAATTATTTGTAAACAATGTAGATAAGTATTTAAATGAAATTAAAGAGGTTCAAAATGACCTTGAAAAAAGCTCATATGATAACCTAAGACAGGATGGAGATACTATTCGTTTGTGTCATAATGATTTAGCTTATCATAATTTCTTAACCAAAAATAATGAAATAAATATAATAGATTTTGATTTTATGACTATAGATTTAAGAGTAATGGATATATGGAATTTTATTTTAAAGTGTATAAAGAATGCCGCATTCGATGTGGATAAGATGTCAACTTGTATTAATGGATATGAGAATGTGTCCATTTTAAAAAAAGAAGAAAAAGAACTCTTGTATATACTTATAAAGTTCCCTAAAGATTTTTATACAATATCAAGAGATTATTATCATAAGAGAAAGAATTGGGAATATGAAGTATATTTAAGCAGATTTGAAGGAAAGTTTAGCAATGAGGATTTTAGATATGAATTTTTAAAGGTTTTAGAAAATAAATTTTTCATAGGTTCTGAAGTAAAGAAGTAATTTAAATATAAGATTAATTTATTTGAATGTAAAGAATAATATAAATCTAACTTATAATTCACCTATTTATAATAATGATTAAGCCAATATTTTATTTTGAAAATGGAATATTGGTTTCTTATTAGTTAAGAAATATTGAGAATTTATAAAGGCAAGAAAATCTCTTATGATTTTCTTGCCTTTATACAGATATTTAATGTTTAATTGAAACTGTTGTAATATAAATTACTTATAAGGTAGCTAATTACAAAAACTATGAAGGAATTTTACTAGTTATATAAAAAATATAAATTTTATTTTATATAGTTAGTGTATTATTCTATGAATTTATTATAGCTTCATAGGCGGACATTGTATCTAGGGCTGTTTTATTCCAAGAAAAGTTTTTACTTCGTGTTAGGCTTTTTTTGACCATTGTTAACCTTAATAGGCTATTACTTAAAACTCTTTCTATGTCATAAGATAGTGAATCAATATCATTAGGATCTATAAAAAGCGCTGATTCATGACATACTTCAGGTAATGACGTAACATTAGAAGCTATTACAGGAGTACCACATGCCATAGCCTCTATAGGAGGAAGTCCAAATCCTTCATAAAAAGAAGGGTATACAAGGACCTCAGCAGCATTGTAGAATAATGGCATATCCTCAATGGGAATAAAATCAGTAAAAATAACGTTGTTAGATATATTTAGATCATCAGCTCTATTTTTGTATTTAGTATAAGAAGGACCCTTACGACCAATTATAACTAGTTTGAAACTTTCTTTTAATTTATTTGGGAGTTTAGAATAAGCTTCTATTAGTCCTATAATATTCTTTCTTGGACTAAATCCTCCAACGTAAAGTACGAAGTCTTCCTTTATCCCATATTTCTCGGTAATAAAGTCTTTAGATTTACATTTACTCATAGGTCTGTAAATATCTTCAGCAGCTAATGGGGTAACATAAATCTTTTCAGCAGGAAAGTTAAATTCCTTAGCAATATCATCCTTAGAGTAATTAGATACAGTAATTATTCCATCACAATTATCTAAAATTTTAGGCAGTTCATTATTAAATATTTTTAAATATCTATCACTAACAGTTTCAGGCATTCTTAAAGGAATTATATCATGTAGAGTAATAACTTTTTTGCATTCAACATTTTCTGATAGACCAACCCCGTTTTGTGGGACATGGTAAAGCTCTATGTCTGCATTATTTAATATATTGGGAACATTTATATCATCCCAAAAACTATTAGAAGGTATTGATTCAATAAGTTCTGTTTTAAAATTATTCTTTAAATCGCTTATAAAGTCACATTGTGGTGTGAAAATTAAATAGTTATTGTTACTATCAACATTGTTGAGGCTAGATATTAACTGATAAGTATAGGTACCTATACCCGTGCCTCGATACCACTTTGCAGCTCTACCATCTATTCCTATTTTCATTATTAAACCCTTTCATAGCATTTGTCTTAATGTATTATATTAAAAGAATATAAAAAATGTTAATAAAAGAAATGATATCCTCATATAAATATACAGGAGGTGAGAAGTATGATGAGGGAATTTGAAATTGAAAGACAATTCAATATAAAGATAGAAAAAATAAAGGCAAATAAAGGCGTATACTATCTTAAAACAGATAAAGGCGAGAGATGTTTGAAAAAAATAAATTATGGACCCCAAAAGTTGTTGTTCGTGTATGGTGCTAAAGAGCACTTAAGAAAAAATGGTTTTAATAATTTAGATAAATACTATTTAAACATAAATGGAGAGCCTTATGCATTGGTTAATGAAGACTTATATACTTTGTCTGAATGGTTAGAAGGAAGGGAATGTGACTTCCATAACATAGATGAAGTAAAAATAGCAGCAAAGACTTTAGCTAATCTCCATGAAGCATCTAAGGGCTATGATCCACCTGAGAATTCTAAGCTCAAAAGTGATCTTGGCAGATGGCCTCATTTAATAGAAAAAAGAATTAAATCTTTAGATAAAATGAGAGATATGGTAAGGAAAAAAAGTATAAAAAGTGATTTTGACATGCTTTATTTAAAATCTATGGAGTTTTATAAAGAGATTGGAAAGAAATCCTTAGTGACTTTAAATGAGTCAGATTACTATGAGTTATGTGCAATTGCTGAGAATGAAAAAAGTTTTTGCCATCATGATTTTACTTATCATAATATAATTTTAAGCGATAGTATGGATGTACATGTTATAGATTTTGATTACTGTAAAAGAGAAGTTAGAACTTTTGATATAAGCAATTTTATGATAAAGGTGCTAAAGAGAGTTGAGTGGAATTTAGAATTTGCGACAGCTATTATAGAATCCTATGATTCAGTATCAAAATTAAAACCAGAGGAATATAAGGTATTATATGCATATCTTCAATTCCCACAAAGATATTGGAGGCTTGCAAATAGATATTATTATAATGAAGTTAATTGGGGGCAAAATACATTTGCAGGTAAGTTAGAATCAATAATACATGAGCAAGAGAAATACCTAGAATTTTTAGAAAAATTCAAGAATGAATATAAGATATAATAAACATAATAATATGAACTACCGAAATAATTAAAAAATTATTTCGATAGTTCATTTATTTTGTTCTTGCCTAGATAGAATAAAATCATTCTTATATTAATTTAGAAACCTTTAATAATCTTTACCATATTATAATGTGAAAGAATGTATTAGGAGAAAGTAATGGAAATAGGAGATATAGTTGTTAGAAAATCTTATAATAAAGATATTACTTTTAAAATAATTGATATTAAAGATAGTGGCGGAAAGTATAATATAATTCTAAAAGGAATTAATATAAGAATAATAGCAGATGCAAGTTTGGATGATCTTGAAATGGCAGAAGAGGACACTGGATCTCAAGATAAAATATTAAATACAAGAGTTAATGAGGCCATAAAGAAAGCTATGATACTACGAGGTGATCTTAGGGATAAAGTTGAAAAATCTCCTAAGATAAAGACGAAGAATGAATTGATGTTTGGAAGACCAGGAAAGATTCTCCATGTAGATGGGGATAGTGAGTACATGGAGACTTGTTTAAAGGTATATAAGCAATTATCTTTAGATGCAGTGGGGAGAGCTATAGCGGAAAAAGATCAACCAGAGGTAATAGTAGACTTAGTTAAAGAAATAAAACCGGACATAGTAGTTTTAACTGGACACGATAGTGTTTTACGAGAACCAAGGGATTATTTGAATTTAGATAATTATAGAAATTCAAGATATTATTTAGAATCAGTCAAAAACTTAAGAAATTATAATTCAAGTTATGATGAATTAGTAATATTTGCAGGGGCTTGTCAAAGTTGCTATGAAAGAATATTAGACGTAGGTGCTAATTTTGCCTCGAGTCCAAATCGAGTATTAATACACTGCCTGGACCCTGTTTTTGTATGTGAGAAGATTGCTTATACAAGAATTGATAAGGTAGTCTCAATAACTGATGTTATTGAAAATACGATAACAGGAATAAAGGGAGTTGGAGGATTGCAGACCAGGGGAAAGTATAGAGAAGGATATCCTAAATCTCCTTATATTTAATAAATAATTTAGATAGGAATTGCATAAAATAAATTATTAAAAACTTCAATGCATCTAAACAATTAGTAAGAGTATTGAAGTTTTTAACTATAATTAATAAATATAATATTTCTATTTGACAAAAATAATAATAGAATATATAATGGTTTAAACAAATTTAATTTTATAAAATATAATTTATGAAAACATAAGTTTATTCACTTAAGTTCATATTAAAGATGATAAGGAGAGAAGCAAAATGATATATGATTATTTAGTAAAAGATATAAATGGAAATTCAGTTTCTATGGAGACATACAAGGGAAAGGTATTACTAATTGTTAATACAGCTACAGGATGTGGGTTTACTCCACAATACGAAGGGCTTCAAAAGCTTTATGATAAATATAAAGACAGTGGATTTGAAATATTAGATTTTCCATCAAATCAATTCTTTGAGCAAGCGCCGGGGACTAATGAAGAGATATCAAATTTTTGTAAATTAACATACGGAACAACTTTTAAAACATTTGCAAAGATTGATGTAAATGGAGAGAATAGTGATCCATTATATGTTTTTTTAAAGAAAGAGGCTCCTATTGCAAGCGAAGATGATGCATCAAAGGGATTGTATAATCTTTTATCAGAAAAAGGCTTTAATACAAGTGGAGATGATATTAAGTGGAATTTTACAAAATTCCTTGTATCAAAAGAGGGAAAAGTAATAGCTAGATTTGCACCAACATATGAACCAGAGAAAATTGCTGATCAAATTGAAAAATTAATTAATGAAAAATAGAGAATAAATATAAATACTCCTTTAATGTACGTGTGATTAAAGGAGTATTTTATAGTAAAAAATATTTTTATATGATTAAAAAATGTCATTTAGTATTGTTGAGAATAAATTCTGAACGGGGAGGGAATTCCAGCTTTATATAAAATGTCTACTAAGATTTTCTTAAAAAATATAGTAATGAATAAACTATTGACCAATATTACTGTAAGTAGTATTGGTCAATATATAACATTGGAAATACTCGAAATTATGTTAATAGGATAAGAGTATAGAATAATTGAAGGGGGAATAGTTTATAGATATAACATTGAGCTAAGAAAGATTTTTAATATAATATCTGATTTTAAATTATATACTTATCTAAGTATGAACATGGAATCAATTTAGAAATAAAATTAAGGTTATTTATAGATTATGAAATGTTATAGAATTAAATTTAATGATAAGGGGAATAATAATTAAGAAAAAGCAGATAATATAATAAAATAGCTTGAAAACATATATAATTGGAAAAATGTTTACATTGACAATATGGTGCTATAAATGATAAAATATTTATTTTACTTGACTAATTTATGATTTTGTTATATAATTAGTATGAAAGAGGGTGTTTACATGGAAAAAGTTAAAACTATTGCTTCCATTAAAAACGATATAGAGAGACACGTCGGTCAGAAAGTGACTCTAAAAGCTAATGGTGGAAGGAAAAAGATTTTAGTTAATGATGGTATAATTGAAAGTGTATACCCAAGTATTTTTGTTATAAGATTAAAAAATGACACCCAAAGGACCGTGACTTATAGTTATTCAGATGTATTAACAAAGACTGTACAATTGGTATTTCCAACTAGAATATAAGCTTCGATTAATTCGGAGTTTTTTCTTTTTGTCTTATTTTAAAAGTGAGTTTCTACTATTCATATTTATTTAAAATAATTAATGAATTAGAAATTGTAAGAAGTGTTTTTATACGTAGAAATCCATAAATAGAATATAATTTTATGATTAAAATGATAATAGGATTTAGATTAACTAAATAATTTTATAAAAAAAGAAAGATGGTGGGTTTCCATCTTTCAACTATGGTATAAAAGGGTATTGAGAATTTATGAGAGGTTATATGGTCAATAACCAATTACTATATTACGACAAAAAATAGTATATGTCAATAAAAAACGCAAAAAAATTTAAAAAAATATTGTTAAGTAAAAGGTTTACTTAATTTGTTAGAATAAAATAAAAATATATTTATCATAAATTTCTACTCATATGTATATAAATGAATAGTAGGAATTTTATGGAGGTATAAAATATGGCAGATATAGATATTGTAAAAGAAAATGTACAGTTTGAACAATTGCTTAGGGAAAATAATACGAATTCGGTATTAAAAGATGAATACTTAATCCCTGATACCCATCCTGATGTACAAGAGATATTAACTGTTGAAGCTAGACCAATGGTAACTAATAAAGAAATAATTGGAGATAAAGTAGTTATAGAAGGAAAGGTTGAGTACACAGTAATATATTTAGCTAAAGAAGAGGGACTCGCAGTAAATTCGGTGAATTATAATCAGAACTTTACAAATAATATTGACTTAAATCAAGGGGAAAATAGAGTAATTTGCGAGGCAGAGTGTAATATTGAACATATTGAAGCAAACATAATGAATGAGAGGAAAATATCTATTCAGGGTATAGTTACTGTAGATTGGGAACTTTACAAGAGCAATGAATTTGAATTTGTAAAAGATATTGAGGGCAATGATCAAGTAGAAGTATTGAAAAAAACAGAGACAATTAATAAAATCAATGCAACAGAGGATGTTGAATTAGTAGGCAAATCTATGATTAGAGTTGGTATGGATAAACCACAAATCAGCAAAATATTAAAGTGTTCCTTACTACTTCATAAAAAGGAAATAAAAATAACAGAAGATAAAGTTTATCTTGGCTGTTACTGCAAATTAAATATACTATACAAAGGAGAAGATTCTAAGGAAATAATTCCATTAGAAGATGATATTTATTTATCAAAAGAGGAAGAAATTAATGGTATAACATCAGATATGATTCCAACTGTTTCCTATGAAATATCAAATAATGATTTAATGTTGGAAGAAGATGATTTAGGCGAAATAAGAATTATAAACGATGAGCTTGTAGTTAGAGCAAATGTTAAGATATTTTCAAAAGAAAACATAGATACTATTAAAGATGCATATTCTACCAATTGTTTGCTTAGTCTCAAAAAAGATGAACATGAAGTTGGAATTCTTCATGGAATGAATAATTCTGAAGCAATTGTTAAGTATAATATTCAATTGAAAGATAATGATTTGAGACCTGAACATATAATATCTGCTAATGGGGCTATAATATTAACAGATAAACAAGTTGTAAAAGACAGAGTTATTGTAGAGGGAATTATAAAAGCAAGTATATTGTATAAGACAACTGATGAGGAGAAATACCTATCAAGTGTTAAAGCAGAGATACCATTCTCAGCTGCAATTGATATAGCAGGCGCAGATGAAAATATGAAATCTATAATTAAAAATAATTTAGAAAATATTGAAGCAGCTATAGAAGGAAATAATATAGCTATTAAAGCTACTGTGATACTATCTGGCAGAGTATTGTATGAAATGAATAAAGAATTTGTTTCAGATGTGGTTGAAGAAGAGGGCGATATTCCAGAAAAGAAAGCTAGTATTACTATATATGTAATTAGTAAAGGGGATACTTTCTGGAACTTAGCAAAAAAATATAATACAACAGTTGACGATTTAATTAAAATAAATAAGATTGAAGATCCAGAACATATTGAAGAAGGACAAAAATTGATAATACCAGGAAGGGCAATATTCTAAAATTAATTAAATTCATAAAAAAAGAGATACTTTAAGAATTTCATTAGATGAATTCTGGAGTATCTCTTTTTTTATGAAGCAATATTATTAAGATCTAAAAATAGAAAAAGTTTTTGGATATGAAGAAAAAATATTTACATAATAAAATGAAAAATACACAAACTAAGTTTTGTTTTATAGTTGCTAATTACTTCGAACTTAAGGAAGTAAAAACTAGAGAAATTATTCTTATAGGAAACGTGGTTTGGCATTTGCAGCAGCCAAATTTCTTGAATAATTATTTAATCTGGTGGATAGAATATGTAATGCATGATATGAGGTGAGAAAATTTGAAAAAAGTTTTAAGTGGTAATTTAATAATCATTGGAGGAGCCGAAGATAAAGAAGGCAAAAAAGAAATTTTAAAAAGAGTATGTGATTCAATTGACAAAAGTAAAGATACTTTATTAATTGCAACTATTGCAACTGATTATCCTAAAGAGGCCGCAAATAAATATAAAGAGGTATTTGGAGAACTTGAAGTAAAAAATATAAAGGTATTAGATATAAGTGAGAGAACAGAAGCATCTGATGATATGAATGTAGAGCTAATCAGAGATTCTTCATTAATATTTTTTACCGGTGGAGATCAATTAAAAATAACAAGTTTAATTGGCGGAACTCCGGTTTATGATGCATTAGAAGAAGCTTGGAAGAATGGTGCATTTATAGTAGGTACTTCAGCAGGAGCATCCGTAATGAGTGACACAATGATAGTTCAAGGGGAAGATGATGATGATCCTAGAAAATGCACATTAAAAATGTCTCCAGGCCTTGGGTTGATTAAGGATGTTATAATTGACCAACATTTTGCTCAAAGAGGAAGAATAGGGAGATTATTAACAGGAATTGCACAAAACCCTGAGGTTTTAGGAATAGGAATAGATGAGAATACAGGAATAGTAGTAAACCAATCTGGAATGATAGAGGTAATAGGTGAAGGAGCAGTTTACTTTATTGATGGTAGTGCAATTACATATACTAATGTTTCAGAATTATATGCAGATGATATTTTGAGTATGCATAATGTTAAGTTGCATGTATTAACTGATGGAAATAAATTTGATCTTATAAAAAAGTCACCTTTTGAGGAGGAAAAGTTTAATCATGAAGATAATACAAAAGAGAATATATGAAGGCCAAAATATTTATTCTCATAAAAAGTGTATAAGAATAGATATGGATTTGGAAGGATATTCTGAAATAGCAAGTAAGGACATACCGAATTTTAATTTTAATCTTGTAAACATAATTCCTGAATTAAAAAATCATAGATGCGGAATTGATGAAGAAGGTGGTTTTGTTAAAAGACTAAAAGAAGGAACTTACCTAGCGCATATTTGTGAACACACTATGATAGCGATGCAAAATAATTTAGGAATAGATGTTGCTTATGGAAAGGCAAGAGAAATTAAAGGCGATATGTATTATATTATCGTACAATATGAATATAAAAATACAATACTTGAGGTGGCTAATTTAGCCATAGATTTAATGAATTCTTTGATAGCGCAAAATCCAATAAATTTCGATGGAAGAATGAAAATTATACAAAATATATTGCAAAATGAGCAAATGGGTGCGACTACAAAAGCAATATGTGATGCTGCAAGGGAATATAAACTTCCTGTTATGCAACTAGGGGACAGTACCATATATCAAATAGGATATGGAAAAGCGGGTAGAATTATAGAAGCTTCTATAGGAAACAAGACTAGTTGTGTAGGAGTTGATATATCTTGTGATAAACTCTTAACAAAACAGTTGCTTCAAACTCAAAATATTCCTGTAGCAGACGGAAGTAAAGTGCTTAATTTAATTGGATTATTACAAGAAGCAGAACGAATTGGATATCCAGTGGTTTTAAAGCCACAATGCGGAAACAAGGGTCAAGGAGTAATACTGAATATAAAAGATCAAAAACAATTGGTTGATGCATATATTAACTTAAGAAAAAATCAAAAGGATATAATTTTGGAAAAATACTTTGAAGGAAGCGACTACAGAGTTTGTGTTGTAAATTACAAGGTGGTAGCTGTATCATTGAGAATTGCTCCATATGTTATTGGAAATGGAAAAGATAGTTTAAGGATGTTAATAGAGGTTCTTAATAAGGATCCATTAAGAGGAGAGGATCATGAAAAAGCATTAACCAAAATAAAAATTGATGCTGAGTTAATATCATGCCTTTCTAAAAGAGGATTGGAACTGAACTATATCCCTGAAGAGGGTGAAAAAATATTATTAAGAGAGAATGCAAATCTTTCTACTGGTGGAATAGCAATAGATTGCACTGATGAAATCTGTGAGGAAAATATAGAAAGTTGCATAAATGCAGCTAAAACTTTAGGGTTAGATATTTGTGGAGTTGATATTTGTGCAAAAGATATTAGTGTTCCGCTTAAGGATAATAATGGAGTAGTTTTAGAGATAAATGCCGCACCAGGTATAAGAATGCACCATTTCCCTTCAAAAGGTAAAAGGCGTAATGTGGGAAAAGCAATACTTGAAACGCTTTATGATGAAGAACCTAAAAATATACCTGTAATATCTATTACAGGCACTAATGGAAAGACAACTACTACAAGGTTAATAAGTCATGTGCTAAGAAAGATGGGAAGCAATGTAGGCATGACATCGACTGATGGTGTATATTTGAATGAAAAGTGTATACATAAGGGAGATGATTCTGGATTTAATAGCGCAAGATCAATACTGATGAATAAAGATGTAGATGTAGCTGTTTTAGAAACTGCTAGAGGAGGATTGGTTAAAAGAGGGCTAGCATATGAGTTGGCAGATGTAGCAATAATCACAAATATAACCAATGATCATCTGGGCTTGGATGGAATTAATTCTATTGAAGAGTTGAGCTTTACAAAAGCTTTAGTAGGAGAAGCAGTAAAAGATGATGGTTTTGTTGTTGTAAATGCTGATGATAAATATAGCAAAACTGTAATAAATAGATTCACAGCAGAAAAAATTTATTTTGCAAAAGATAAAGAAAATCCGTTGATACAAGAAAATATAGCTAATGGCAAAATAGCTGTATTTGTTGAAGATGATAAAATTTGCGTAATTAATAATAAGAAGAAGTATGAAATTGTAGCTACTAGAGAGTTACCAATATCATATAATGGAACATTAGAATATAATATAGAAAATGCAATGGCAGCTTGTGCAGGGCTTGTAGGCTTAGAAGTTGATTATTGTATGATTTCAAAAGGTTTTATGGACTTTGGGTTAAAGAATGAAGATAATAGCGGAAGATTTAACATGTACAATTACCTTAACAGAAGAGTTATATTAGATTATGCTCATAATATTGAAGGTTATAGAGCGATTATATCTTCATTGAGAAAGATTAAGGGAGATAATGATTTAATTGGGGTAATTGGAATACCAGGAGATAGAAAAGACGATATAGGATACGCAATAGGAGAAATATGTGCTAATAATTTTGATAAAATAGTAATAAAAGAAGATAAGGATAAAAGGGGTAGAAAATCTGGAGAGATTGCAGATATATTAGAAAAGTCAATATTGAAAACTAATAAAAATGCAAATTTGAAGATTTGTCTAGATGAAGTTCAAGCGTTAAAATATGCAATAGATATGAGTAATAAGGGCGATATGATTGTAGTATTCTATGAAAAATTAGATTCTCTTTTAGAGTTTATAAATGAGGAACCAAACAAACAACTAGATACGTTCGATGAAGAATATAAACAGTACAGTAATACATTATAACTCTTGATAAAAGATTTAAAGTTATCTAAAATTGATCTCATAGTAGAATGTTTAATAGACATTATTAATCCTTTTTTAATTTATTAATTAGACAAGATTTTTTACCTATGATAAAATATTGTCAAAATGTTAAGAAAGGAATAAAATAATGAAGATTAAGGCTTATGCCAAAATAAATATTGCCTTAGATATTGTTGGGAAAAGAGAAGACGGATATCATATATTAAGAATGATAATGCAAACTATAGATTTATATGACATAATAGAAATAGAGAAAACTGAATCTGAGATAAGGTTAAATTGTAATAAACATTATGTTCCTACAGATGAAAGAAATTTAGCTTATAAAGCAGCAAAAATATTTAAGGAAACTTATTCTATTAGTCAGGGAGTAGATATAAAGTTAACTAAGAATATACCTGTTTCAGCTGGATTGGCAGGCGGAAGTACCGATGCAGCAGGAGTTTTAAAGCTTATGAATAAGATGTTTAATGTAAATGCAAGTGATGAAGAATTGAAATCTATAGGGCTAAAACTAGGAGCTGATGTACCATATTGCATAAAAGGTGGAACAGCACTGTGCGAAGGTATAGGAGAAAAAATTACCCAATTAAAATCATTTAAAGATAAAATAATAGTTTTAGTAAAGCCACCTTTTGGTGTATCAACAAAAGAAGTTTATAAATGCTTTGATTTATCAAAAGTTGTATTTCATCCTAAAATAGATAGTTTAATAGAAAATATGAATAATGATGATGTTTATTTTGTAGCAAATAATATGAAAAATTTATTAGAAAATGTTACTTTAAGGAAGCATAGAGTTATTGCTAACATTAAGGAAGAAATGAAATCTATTGGCTCTATAGGTACAATGATGAGTGGTAGTGGACCAACTGTTTTTGCTCTTTTTGATGATATGCTAAAAGCACAGTTATGTTATGATGAAATGAAAAAAAAATATAAAGATGTATTTATAACAAGAACAATTTAATTCAAATTGAATGTATAAAAAACCTCCAAGTGGTAATAATTTTAGCTACAAGGGGGTTTGTTTATGATAAAATATTTGAAATTAAAAAAAATAGTATTGGTAGTTTTAATAACATTAAGTATAAATATATTTTCTGGATGTACAAGCATTGTTAGAGGTAATAGTACAAGTTTGGTAAATAGTTTAATTGCAACAGAAAGTAATAAAAATGATAATAATATGAGGGTTCTCAATTACGACGAGGTTAAAGATTCATTAATAAGATTTCATGTAATTGCTAATAGTGATAATGATGATGATCAACAATTGAAGTTAAAAGTTAAGAATAGAGTTATAGATTATCTATATCCTTATTTAAATTCTTCACAATCATTAGATGAATCAAGAAAAATTATAAAAGATAAGATGGAAGATGTTAAAACACTTGCACAACAAGTGATTAAGGATAATAATTATGATTATGATGTAAAAGTTGAATTGTCTAGGGAAAATTTTCCTGATAAGTCTTATGGTAATATCACTTTACCTCAAGGAAATTATGAGGCCTTTAGAATAATTATAGGAAGTGGACAAGGTAGAAACTGGTGGTGTGTAATGTTTCCTCCATTATGTTTTGTAGACGAATCAAAGGCACAAGTGGAATATGATAAAACAGAGAATAAAATAAAGTCAAATGGAAAAAGTTTTGAATTAGAATCTAAAGACGATTCAACTGAAAATGTAGGGGATAAGCAGGCAGATGGAAATAATATAAAGATAAAGTTTAAAATAGTGGAAATATTTCGAGATATATTTAAATAATATTAATAGGATATTTGGAAGTTTTATTCACGAAATTTATATAGTTGTCAAATGAATTTAATAAAGCTAAAGCTTATTTCTGAAAGTCAAAAATAATATTCAAATATAATATATTATAAGTGGAGGAGAATATGAAGAAAAAAGCTATTATAACGGTAGATAGTTATGTATTGGATAATGAAGAGGATCTTGTAGGGGTAGTAACTCCAGGAGATTTCCATGAAATAGAAGATGGATTTAAGGTAGAGTATGAGGAAACAAAGCTTTCAGGGATGGAAGGGACAAAGACTACTATAATAATAAGAAATGATTCTTTTGATTTAATAAGAGAAGGCACTACAGAAACTAAAATGGAATTTAGAAATAATCATAGAACAATATCTCTATATAAAACGCCGTACGGTGTTATGGATCTTCAAATAGATACTAAAAAACTTAATATTGATATTAGTAAAGAGGGCGGAACAATAACCGCAATGTACATACTAGAAATAGGTGGACAGCCTGCATTGAAGACAAACTTAACTATCGGTGTGAAATTAAATTAAGTAGGTTCTATATTTATTTAAATACTCCCTTTGTATAAAGATATTTAGGAATAAGTTGATTAAATTAGAAAAAAATGGGATATAATTTCAAAGGGAGGAATATATATGCAAAATGGATTGAAATATATAGAGATATTGAATAACATATGCAAATATTACGGAATTGATGAAGAAAATTTTATAGAATTGCTAAAAAATAGAGATAATAAATATATATTATTATTATTATTAAAATATAATCACTGTTTAGATACTGAGAGAGTTAAGGAAGTTTTTAATCTAAAAACTTCTAAGAGTATAAGTAACAATTTGAAACTAGCAGAAGAAAAGTTATTAATAAATAGACTTTTTAGAGAGAAGTACTTTGAATTAGAAGATAATATAGGAAAGAATAGCATGACCAATTTATTATAAAAAAAAGACTAGATATTGGAGTAGATATGTGATATTATAATACCTATGTTATTAAGCAACACAAGTGCCCCATATTATATTATGGGGTGATTTTCATTATAGCATGACTTTTTGAAAAAGTCAATATTAATTTAGAAGAACATTTTAACATAGGGAGGATAAAAATGAGTACTAAATACGTTTTTGTTACAGGCGGAGTTGTATCAGCACTAGGAAAAGGAATAACAGCAGCGTCTCTTGGGAGATTATTGAAGAATAGAGGGGTGAAAATTTCTATTCAAAAATTTGATCCATATCTTAATGTGGATCCGGGAACAATGAGCCCTTATCAGCATGGAGAGGTTTTTGTTACAGATGATGGAGCTGAGACAGATTTAGATTTAGGCCATTATGAAAGATTTATAGATGAAAGTTTAACCCAAAATTCAAATGTTACAACTGGTAAGATATATAGTTCTGTTATAGAAAAAGAAAGAAGGGGAGAATACCTTGGAGGTACAGTTCAGGTAATTCCTCATATAACTAATGCTATAAAAGATAAAGTATACCAAGTAGCAAAAGATAGAGATGTTGATGTGGTAATAACTGAAATTGGTGGGACTGTTGGAGATATAGAATCACAACCATTTTTAGAATCTATTAGACAAATAAAAAGTGAAGTTGGAGCTGAAAATGTTTGTTACATACATGTTACTTTGGTACCATACTTGGGAAAAGCAGGAGAATTAAAGACAAAGCCTACTCAACATTCAGTAAAAGAATTAAGAATGATAGGTATCCAACCAGATATAATAGTATGCAGAACTGAGAAAGAATTATCAGATGATGTTAAGGCTAAAATTGGATTGTTCTGTAATATAGACGGAAGATCAGTAATTCAAAATCTTGATGCGGAAAATTTATATGAAGTTCCATTAATGCTACATTCAGAAGGTTTAGATAATCTTGTATGTGAAAAATTACATTTAGGATGTAAAGATATTGATAATTCCGAATGGATTCAAATGGTACAAAAGATTAAGAACCTTAAAAACAACGTGAAGATAGCATTAGTGGGTAAATACGTTGAGTTACACGATGCATACATATCAGTAGTTGAAGCATTAAGTCATGGTGGATATGCTAATAATACTAATGTTGAAATTAAGTGGATTAATGCCGAAAATATTGAAAACAGTAATGCTCAAGAATTACTTAAAGATGTTGATGGAATATTAGTGCCAGGTGGATTTGGTGACAGAGGAATAGAAGGTAAAATAGCAGCTATAAAATGGGCGAGAGAAAATAAGAAACCTTTCCTAGGAATTTGCTTGGGAATGCAATGTGCCGTAATTGAATATGCAAGAAGTGTATTAGGGTATGAAGATGCAAATAGTTCGGAAATAAACCCAGGTACAAATTATCCAGTAATAGATCTTATGCCAGATCAAAAGGATATAGAAAATCTTGGTGGTACAATGAGATTAGGATTATATCCTTGTAGATTAGCTGAGAATACTAACTCTTATGAAGTATATAAAAATGAAATTATCAAGGAAAGACATAGACATAGATATGAATTTAATAATGAATTCAGAAAACAAATAACTGAAGCTGGAATGAAAATTGCAGGAACAAGTCCTGATGAAAGATTAGTTGAGATTGTTGAAGTTGAAGATCATCCATGGTATGTTGCAGTACAATTCCACCCAGAGTTAAAATCAAGACCTAACAAGCCACATAAGTTGTTTGTAGGATTTATTAAAGCAGCATTAGAAGAAAATAAATCAAAGTAATTTGTTTTATTATTGAGTTTAATATATAATAAGTATTATAATTTATTATATATTAAACTTATTTTAATAACTTTAATAGTTTAAATTATTGATCGTGAATTATATAAAATAAAATTTAATATATTGCATTAAATTTTAAATAAATATCCAAACTAATAGAAAATGTATTTTTACAAGTATTATTCTAAAATATTCTCAAATATATCATTTCTAACTATCTTACTGTTAAATTTTCCGATATAAAATATAACTAAAATTATAAAAGAATTGATTTTATAGATTCATATCTATAAATTGGAGGTGCGAACTTGACAAAAAAAGAATATGAAAGCATGACTTTAACAAAGTTAAAAGATATTGCTAAAGATTTAGGTGTGAAAAATATATCTAAATATAAAAAGAATGAGCTAATAGAAGAAATATTGAAAGTTCCTAGTAACTTTATAGAAAAGAATGGTGTTATATTAAGAGAAAATATAGCACCTAAGAATGTAGAAGAGACTAGAAGTGTTATGCCTAGAAGTAATAATACTGAGTCGAATAAAGAAAGCAATGATTCAGAAGTAAAATCTAGAACAAATGAAATTGGGAATGTGGAAAAGAAAGAAAATTTAAAAGAAATGATAAATGAATCCAACGTTGCAAATGGAATTTTAGAAATACTTGAAAATAATAGTTTTGGTTTCCTAAGATGTAAAAACTATTTAACTAGTAGCGAAGATGTTTATGTATCTCCATCTCAGATTAGAAGATTTAATTTAAGAACAGGAGATGAAGTTGAAGGTAAAGTAAGAGAAGCAAAGGAAACTGAGAAGTTTAAAGCTTTATTATTTGTTCAAAAAGTTAATGGAGAGCATCCGGAAAAAGCTATAGGAAGAAAATCCTTTGAAACATTAACACCAATATATCCAAAAGAAAGATTAAAATTAGAAACCTCTGATAGTAATGATTTATCGTCTAGACTGATGGATATAATATGCCCAATAGGAAAGGGGCAAAGAGGAATTATAGTCGCTCCACCAAAGGCTGGGAAAACTACGCTATTAAAAAAGATTGCTCAAAATATATCTAAAAATTATCCTGATGTAAAGCTTATTGTTTTGCTTATAGATGAAAGACCAGAAGAAGTTACAGATATGAAGAGGTCTATTAATGGAGATGTAGTTTATTCAACTTTTGATGAGGAACCGCAAAACCATGCAAAGGTAGCTCAAATGGTCTTAGAAAGAGCTAAGAGAATGGTTGAGCAAGGTAAAGATGTTGTTATTCTTATGGATAGTATAACTAGATTATCAAGAGCATACAATTTGACAATAACTCCTACAGGTAGAACATTATCAGGTGGTCTTGATCCAGGTGCGCTTATAATGCCTAAAAAGTTTTTTGGAGCAGCAAGAAAAATTGAAGAGGGCGGAAGTTTAACAATACTAGCTACTGCACTAATTGAAACAGGGTCGAGAATGGATGATATGATATTTGAAGAATTTAAAGGAACAGGTAATATGGAGGTTCATTTAGATAGACGTCTACAAGAGAGAAGAATTTTCCCAGCTATAGATATATATAAGTCTGGAACAAGAAAAGAAGATTTGATTTTATCTAAAGAAGAATTAGAAGTAGCATTCTCCATAAGGAAAAAGATGTATAGAGATGGAAACTCAGATGATATTACAGAGAATTTAATTAATATGTTATCTAAAACTGGCAACAATAAAGAATTTATAGATGTATTCCAGAAAAAAGTTCAATAGATAACAAAAAAAGATGACCATTTTATTCTAGTGGCCATCTTTTATTTTTTTGAAATTAAATCATCTGCTATATCGACTATTTTAGTTAAAGAATAAGTTGATGATAACTCTTTGAGCTTTAGTTTAATTTTGGATAGCTCATTGGGGTTATTTATTAAATAATTTATTTTATCATTTAGCTTGCTTAAATCTTTTACATATATTGAATAACCTTCGCTAGTCAGAAAATCTATATTTTCATTTTCTTGACCTGGTATGGCAAATGGAATTATTAATGGAATGTTCTTTACTATAGATTCTGTAACAGTTAATCCACCAGGTTTTGATATTAGGATATCAGAATAATCCATTAAATAAGAGATATCTTTTGTGAAGCCTAATATATGAAGCTTTTTGTTTTCAAATTTATTTTCATTGCAATAACTAATTAATCTATTCTTTAAGTTATCATTTTTGCCACAAACTACTGTGATTCTTAACTTGTGTGGATTTTTTAACAATTCTTTAAGAACTGTAAAAATAGTAGTTAACCCAAGACTTCCTCCCATAAGCAATAAATTAAAATATTCATCATCTTTTAAATCGTTTGCTGATGTAACTTCAGTATAAAATTTACTACTTATAGGTATGCCTATTGGATAAATTTTATTAGGATTAATACCTCTATCTACTAGAGATTTTTTTGTATAGTTACTTCCGGTTATATAAGCATCAACGTAAGAATCCACATATAAATAATGAGCCTTAAAATCTGTAACCACTAAAATAAAAGGTATATCCAATCCATTCTTTTTTAGATCTGAAATTACGCTAATATTAATTGAATGGGTAGCTATGATGACATCTGGTTGTATTTTGTTTATAAGTTTCGAAACCTTCTTTCTTGCCATAAAGAAGATGAGTTTTAATAGTTTATTAGTTAAATTTGTGTCAGTTAGTTTGTAAAAGAAACCATAAGTTTTGGGAAACTTCGATGCCGAAAACTCATATCCAATTACAATTATATCGTTAAGAAGCTTGCTATTCTTGGCTAAAAAATCAAGCTTTGTAATCTCATAACCAGAATTATTAAATGATTCCTCTACCGAAGCAGCAGCTTGATTATGTCCCTGTCCTGTAGATGTTGTTAAGATTAAAACTTTTTTCATGAAAGTCACTCATTTCAACATTATTATATTACATAGTTTACCATGTATAGTATATAATTTAAATATTAAATTATATACGCTAATATATTAAAATTTAGTTATTTAAATTTTAAGTATGTATAAGTTTGCAAACAATTGCAGTAAAATATATATTTCTAATATATTAGAAATATGAATAAAAAAGGAAAGACATCGTCTTTCCTCATAAAGTTATTACTTGTTGTCAAGGTTGAATCTCTTGTTGAATTTATCAACTCTTCCACCAACGTCAACAATTTTTTGTTTACCAGTGAAGAATGGGTGGCATTTAGAGCATATTTCAACTTTTAGTTCTTCTTTAACAGAACCAGTAGTGAAAGTGTTTCCACATGCACACTTAACCACTGTATTGTGGTGGTATTCTGGATGTATGCCTTCTCTCATTATTTTTCACCTCTTTCAATTATATAAACTATGTTAATTATTCAATAACAACCACCATATTATATCATAGTAGAATTTTAGCGTCAATAATAAATCCGTGTATGTAAATAATATAAAAATGTCTTTTTATGATCACTATTAAATGATATAATCGATTATGATACCTTAAATAAGGAGAGTATTTTACAGATGAGTAAATTATATTTTAGATATGGGGCCATGAATTCTGGAAAATCAACTCATTTAATGCAAGTTGCTTATAATTATGAAGAACGTGGTATGAAGGTGGTAATTATTAAACCTAGAATTGATAACAAAGGTGGAGACACACTTGTATCTAGGTTAGGAGTAAATAGGCGGGTAGATTTATTAGTTTCAGATCAGGATGATATCTTTCAAATAATCAGTAATTATATAAAAGAAAATAATAAAATAGACTGTATACTAGTAGACGAAGTTCAATTTTTAAGAGAATCACAAATAGATCAGTTGTTTGAAATTGCTGTAAAGATTAATATACCTATAATATGTTATGGTCTAAGAACTGATTTTAAAAGAAATGGATTTGAAGGTAGTACAAGATTGTTATTGTTGGCTCATAGTATTGAAGAAATGAAAACAATCTGTGCATGCGGTAGGAAAGCCATATTTAATGGAAGAAAAATAAATAATAAATTTGTATTTGAGGGAGAACAAATCGCAATTGATGATGAAGATAATGTTGAATATGAGTCATTGTGTGGAGAGTGCTACTATAAATACAAAGAAAATTAATTAGGAGAGTAAGTGATTTTTATAAATGGAAAGACGTGATGTTGGAGGGCAAGCTGTCATAGAAGGTGTTATGATGAGAGGAAGTAAAAATCTTGCGACTGCTGTTAGAACTCCCAAAGGTAATATAGAAATAGATTTTAAAGATAATAGACCAGTAACAAAAAAATATCCGATTTTAAATATACCTTTTCTTAGAGGTTTTTTCGTACTAGTAGAATCAATGAAGGTTGGAATGGAATCATTAAACTACTCAGCATCATTTTTGGAAGAAGATAATGAAGAACCTTCTAAATTTGAAAAATGGTTAGATGACAAACTGGGAGAAAGGGCTAATAGTGTATTAATGGCAATAACTATGTTTATTTCTTTTCTTTTCGCTATAGGACTTTTCGTTGCATTGCCAACAGGCATAGCATCAGTTTTCAAAGGTGCAGGTATTTCGAATGTAATGCTGAATCTGATCGAAGCTCTTATAAGAATAGTGATTCTCTTGCTTTATATGTTTTCTATAAGCAAACTTAACGATATATATAGAGTGTTTCAATACCACGGAGCTGAACATAAGACTATATTCTGTTATGAAGCTATGGAAGAATTAACTGTAGAGAACGTTAGAAAACAATCAAGATTACATCCAAGATGCGGTACTAACTTTTTGTTTTTGGTAATGTTTGTTAGTATTATAGTGTTTTCTTTTACTGGGTGGGGTGGAATCATAGAAAGGTTAGCTCTTAGAATTATTCTTATACCAGTAGTTACAGGGATTAGTTATGAGATAATAAAATGGCTTGGTAAAAATGACAGTATGCTAGCTCAAATAATAGCGTATCCTGGTCTTAAGTTACAACTGTTAACAACTAAAGAACCAGATGATTCCCAAATTGAAGTGGCTATTGCATCGTTGAAAGCAGCAGAAGGAATAAAAGATCCAAATAAAAATATTGAAGAGCTGATAAAAACAGGTACATTTACATTAAAAGAAAATGGCATAGATACTGCTAGGTTAGATGCAGAGCTATTGTTAGGAAATATTATTGAGAAAGATAGGGTTTACTTAATTACACATAAAGAAGATGAAGTAAGTAAGGAAGATGCTGAAAAATATTTTGATTTGATTGAAAAACGTAGAAATAAAATGCCAGTAAAATATATTCTAAATAAATGTGAATTTATGGGTATCGAATTTTATGTTGAAGAAGGTGTTTTAATACCAAGAGGGGATACAGAGATACTTGTAGATGAAGTTCTTAAAATTATAGAAGAAAATCAAGAAATGCAAATATGCGATTTGTGTTCTGGATCTGGTGCAGTTGGTATATCATTAGCACATTTTAGGCAAAATATAAAAGTTGATTTAATAGACTATTATCCTATTCCGGAAAAAGTATCACTAATTAATATAGAGAAAAATAAGTTAGAAGATAGAGTTTTCTTTATAAAAAGTGATTTGCTAGAAGAGTCGATAAAAAATAATAAAATATATGACATTATAGTATCAAATCCTCCGTATATTGAGGAATGTGAAATTGGGAAATTAATGGAGGATGTAAAGAATTATGAACCGCACACTGCATTAAATGGTGGAAATGACGGATTAGATTTTTATAGAAAAATAATTGACCAAAGCCAATATACATTGAGAGAAAGTGGGATATTAGCATTTGAAATAGGATATAATCAAGGAGAAGCGGTGAAACTATTAATGGAAAATAACGGTTTTACTAATGTGAAAATTGTTAAAGATTTTGCTAGCCTTGATAGGGTGGTAGTTGGAATTAAAATTTAATTGAAACAGATCTTTTAGGTATAAGAACGAATTAAGAAGTCATAGGATGTATAATTTATAAATGAGGTTAGTTGGTTAAGTAATTAAAATATGATATAATGTAGAAATGTGAAAAAAGAAGTACGGAGTGATCAAATGTTATTAGATAAATTAGAATTTATAGAAAACAAATATGATGAATTATCAGTGAAAATAAGTGATCCATCAATTATGCAGAATCAGAATGAATGGAGAAAACTATGTAAGGAACATGCTGACTTAGAAGTTATAGTTAATAGCTATAGGGAATATAAGAAAGTAGTTGAAGATTTAAAAGCTAACAAAGAAATGTTAAGCGGTGAAAGCGATAAAGAGATGAGAGAAATGTTAAATGAAGAAATAACTGATCTCACAAATAGAGAAGAACAACTAGAAACAGAAATACAAATTTTATTATTACCAAAAGATCCTAATGATGATAAGAACGTATTTGTTGAAATCAGAGGGGGTGCAGGTGGCGAAGAAGCTGCACTATTTGCATACAATTTATTTAGAATGTATACAAGATATGCTGAAACTCAACGATGGGGCGTAGAAATCATGAGTTTGAATGAAACAGATCTTGGTGGTTTTAAAGAAGTTGTTTTTATGATAAAAGGTAATGGAGCTTATTCTAAATTAAAATATGAAAGTGGAGTTCATAGAGTTCAAAGAGTACCAGATACTGAATCAAGTGGAAGGATTCATACGTCAACAGCTACAGTAGCAGTGCTACCAGAAGTTGATGATGTTGAAATAGAAGTTGCAGATAAAGATGTTAGAATAGACGTATTTAGAGCTTCAGGAAATGGAGGACAGTGCGTTAATACTACAGACTCGGCTGTAAGAATTACTCACTTGCCTACAGGGCTTGTAGTTTCATGTCAAGATGAAAAGTCACAATTAAAAAATAAAGAAAAAGCTATGAAAGTTTTAAAATCAAGATTATATGAACAGGCAGAAAGAGAAAGAGCACAAGGAATAGCAGAAGACAGAAAGAGCCAAGTTGGAACTGGGGATAGAAGTGAAAGAATTAGAACATATAATTATCCTCAAGGAAGAATTACAGACCACAGAATAGGACTAACTTTATATAAGTTAGATACATTTTTGGGTGGAGATATTGATGAAATGATAAATGCACTTATTACAGCTGACCAAGCTGAAAAGATGAAATTAATGGGAAACACACAAATGTAATAACTATAAAGCAAAGCCTTGCATTTTATATATGTAGGGCTTTAAAAGTACATTGGAGATTGATTATGGATATATATAAGGCTGTAAAAAAAGAGCGATTACATTTAAAAATTTTCTTAATTACCATGGTTATTATTGCGTTTTTTCTTCCAACAGTTCTAATAATAACCGGATTAACTACTATTTTTTATATTAGTTATGTGATTTTTATAGAATTTTTAATAGTTATAGCTATTATAATTAAGATGAATGCCTATATTGTTGAATATAGGTGCTTAAATAATAGGTTGATTTTCAAGGTCGGTATTTCCATTAAAGAATATTTAATTATATGTGATAAAGTTGTACTTGTACATACAAATAAATCTGACTATGATTTAGAAATAGTTTTAATAACAAATGTTGTTTTTAAAAATAAGGGATTGAGACCTGTTGATGATGGGTTTTTAAGAAGATATCCACAAATTATTGAAGATTATAATTCTATAAAACAATTAAATTCTCAGAAAGAGTATTATTTTCAAGTAATAAAAAGAGGTGGACTAAAGAAGTATTTATTATTAGATTCAATATATAGGAATTGCGTTAAAGCTATTTACACTGATGAAAGTATACAAAATATAAAAATATCAAGAGGCCAGCTTATAGTTTAATTAGGAATTTTTTTATAAACAATAAGTTTAGAATTAGGGGAAGAAGGTAATATGTTTGAAAACTAAAATTAGTATGATCAAAAATGTTAGTGAGGATGAAGAGAAAATAAGAGAAGCTGCTGAATGTATAAAAAATGGCGGTACTGTAGTTTTTCCTACGGAGACAGTTTATGGATTGGGTGCAGATGCACTTAATGAAGAAGCGGTAGAAAAAATATTTAAGGCCAAAGGAAGACCGCAAGATAATCCACTCATAATTCATGTTTCGTCGAAGAAACTTGATCTATATGCAAAAGAAATACCAAAAGTAGCTGATGAACTTATAAATAGATTTTGGCCAGGACCACTCACAATAATTTTGAGTAAGAAAGATATAATACCTAATGTAACAAGTGCTAATTTAAACTCTATCGGAATAAGAATGCCTGATAATGAAGTAGCTAGAAAACTAATTGAATTATCTCAGACAACTATAGCAGCACCTTCTGCTAATATAAGTGGGAGACCGAGTCCAACAGATTTCCAGAGATGCATAGAGGATCTTGATGGGAAGGTTGATTATATTCTTGGAGGAGAACAGAGTGACATAGGTGTTGAATCTACTATAGTGGATTGCACAGTAGTACCACCTATAGTTTTACGACCAGGTGGTATTACATTAGAGATGCTTAGAGAAGTTGACCCAAGAATTGAAATAGATAAAGCTATAATGGAAAAACCAAGCGAAAACTTAAAGCCAAAGGCTCCTGGAATGAAGTATAAGCATTATGCACCAAATGCTAAAGTTACAATAATTTCTGGGGAAAGAAAAAAAACTATTGAAAAAATCCGCGAAATGGTACACTATAATATAGAAAAAGGTAAAAAAGTATGTATCCTCACTGTTGAAGAAAATGTTGATGAATATACAGAAGGAACTAGTATAGTATTGGGTAGTCTAAGTGATTTATCAACAGTTGCTAGAAGTTTATTTGAAGCATTGAGAAAGTGTGATGACCTAGGAGCGGATTTAGTTTTTGCAGAAGGATATGAAGAAAAAGGTGTAGGAGTAGCTATTATGAATAGATTAAATAAAGCTGCTGGATTTGATATCATAAATGTATAATAATTCTGCATGTTGAAAAATCACAAAATAAATTAGGAGATGATTTAATTATGAAAATTGCAATTGGATGCGATCATGGTGGATTTGAACTTAAAAATGAAATCATAAAGTTTTTAGAAAGTGAAAAGCATGAGATTAAGGATTTTGGTACATATTCAACAGGTTCTTGCGATTATCCGGATATTGCATTACCAGTAGCAGAAGCGGTTGCTGCAAAGGAATATGAGTTTGGTATATTAATATGTGGTACAGGAATAGGAATTGGTATTGCGGCCAATAAGGTACCAGGAATTAGAGCAGCACTATGTTCAGATACATTTAGTGCCCATGCAACAAGAGAACACAATAATGCTAATATATTAACTATGGGCCAAAGAGTTGTTGGAGCAGGTCTTGCTTTAGATATAGTAAAAACATTTATATCAGCTAAATTTGAAGGAGATAGGCACCAAAAAAGAATAGATAAGATTTCAGATATTGAAAAAAAGTATACACATTAGAAAAAAGCAGCTATGCTGCAACCAAGATCATTTAGATTAGAAAAAAGCAGCTATGCTGCAACCAAGATCATTTAGATTAGAAAAAAGCAGCTATGCTGCAACCAAGATCATTTAGATTAGAAAAAAGCAGCTATGCTGCAACCAAGATCATTTAGATTAGAAAAAAGCAGCTATGCTGCAACCAAGATCATTTAGATTAGAAAAAAAGCAGCTATGCTGCAACAATATTAATTTATATTATTAGAAAGCTAAATGGGGTATATAAATATAAAGGGCTATAAATACTAAAAGCAAACTTGGAGGAATAATAATGAGCAAAGTTATAGAAATAAATCATCCACTAATATTACATAAGTTGGCAATCTTAAGAGATGAAAAAACAGGTTCAAAGGATTTTAGAAAATTAGTAGAAGAAATCTCAATGTTAATGGCGTATGAAGTCACACGAGATTTAAATACGGAAGAAGTAGAAGTGAAAACACCAGTAGCAGTTACTAAATGTAAAATGCTTTCAGGAAAGAAAATGGCTGTAGTTCCTATTTTAAGAGCTGGTCTTGGAATGGTTGATGGAGTACTTAATTTAATACCAGCAGCTAAGGTTGGACATATTGGATTATATAGAGATGAGAAAACACTTCAACCAGTTGAATATTTTTGTAAAATGCCACAAGATATTGCAGAAAGAGATATTATAGTAGTTGATCCAATGCTTGCTACAGGCGGATCTGCAATAGATGCTTTAACTATGTTAAAAAATAGAGGTGCAAAAAATTTAAAATTAATGTGCTTGGTTGGAGCACCAGAAGGTATAGAAGCTATTAAAAAAGCACATTATGATGTTGATATATACTTAGCATCAATTGATGAAAAATTAAATGAACATGGATATATTGTTCCAGGTCTTGGTGATGCTGGAGATAGATTATTTGGCACTAAGTAATTAGTGATTTATTAGAATTAAAAGCTATCTACATAAGTTTCTGAATGACCCAAGATAATTTTACTGGGGGGAATATAGAAAATGGAGAGACGAGATAAGAAAAATTATTACTTGGATATTGCTGAAACAGTTTTAGAGAGAGGAACTTGTCTGAGGAGAAACTATGGTTCTATAATTGTTAAAAATGATGAAATAATTTCTACTGGATACACAGGAGCACCTAGAGGTAGAAAAAATTGCATGGACTTGAATAGTTGCATAAGAGAAAAGTTGAAAGTTCCAAGAGGTACTCATTATGAGTTGTGCAGGAGTGTACATAGTGAAGCTAATGCAATAATAAGCGCTTCTAGAAGAGATATGATTGGAGCTACATTATATTTGGTAGGACGAGATGCAAAAACAAGAGAATATGTAAGGGATGCAAACTCTTGCTCCATGTGTAAGAGATTGATAATTAATGCTGGAATTTCTAATGTTATTATAAGGGATTCAAAGCAGGAGTATAGAGAAATAAGCGTAGATTCATGGATAGAAGACGATGACTCTCTAAGAATAGTAAAAGACGCAGGGTATTAATTTTTTAGAATTTGCATATTTGAATAAATCCAACAAGCATTGCGAGTTGGATTTATTTTTAAAGTATAAACTTTACCAGATAGATAGTATGCGTAATACGCTTTTTTCTTTAATGAGAAGATAACGGCTGCACGGCGCTGGATAAGTTTCAACTAAGATTCAGATGGAGACTAAACTACGCCTGAATTAAGTTTAACTTGATTTTAAATATACATAAAGACAGTACTTAGAAATAGAATGAGAAAAATCTATAATTGCTTAAATGTAGGAGGAAATAATTTGAGTACAAAGAAAATTATTACGATTTTTGGAACTAGACCTGAGGCTATAAAAATGGCACCTTTAGTAAAGGAATTAGAAAGAAGAGAAGAGATTGAATCGAAAGTTTGCGTGACAGCTCAACACAGAGAAATGTTAGATCAAGTTTTGGAATTATTTGATATAAAACCTGATTTTGATTTAAATATAATGAAGACAAAACAGACTTTAACAGGAATTACGAGTAGGGTTTTAGAAGGGTTAGAGGAAGTTTTTAAAGAAGAAAAGCCAGATATGATATTAGTTCATGGAGATACTACAACTACATTTGCAGGTTCTTTAGCTGCATTCTATCAGCAAATTAAAGTTGGGCATGTTGAAGCAGGTCTAAGGACTTTTAATAAGTATTTTCCTTTTCCAGAGGAAATGAATAGAAAACTTACAGGAAGTCTAGCTGATCTACATTTTGCACCAACTAAAGGTTCGAAGGAAAACTTACTAAGGGAAGGAATAAATGCGAGTGATATATATGTTACAGGAAATACTGTAATTGATGCTATGAAACATACAGTTGAAGATGATTACATCTTTGAAAACGAAGAGTTAAATAATATTGATTTTAGTAAGAAAGTAATAATGATAACTGCTCATAGAAGAGAAAACTGGGGAGAAGGAATCCAAAATATATGTATAGCATTAAACAAAATAGTTGAACAGAATGAAGACGTAGAATTAGTGTACTTAGTTCATTTGAATCCTGTAGTTAAAGATGTAGTTTATGAGAGACTTGGAGGAAAAGAAAGAATTCACTTGCTGTCACCATTAGATACTAAGGAAACGCATAATTTGATGAATAAATCGTTTATGGTTATGACAGATTCAGGGGGATTGCAAGAGGAAGCACCACATTTAGCAAAACCTGTACTTGTGTTGAGAGACGTTACTGAAAGACCAGAAGCTGTAGAGGCAGGCACCGTTAAGTTGGTTGGAACTAATATAGATCAAATAGTATCAGAGGCAAACGAGTTACTTAGAAACCCTGATGCTTATTGTAAAATGAGTAAATCTATAAATCCTTATGGAGATGGAATTGCATCTAGAAGAATAGCAGATGCTATATTAAAATATTTTGGTTTGACAACAAGAGAAGTAGAAGAATTTAAAAGATAAAGTTTGTTTAAATTTTAACAATTTATGCTTGATAAAAGAAATAATAAAAGGTATAATTTAGTTATGTTAATAATTTAACGAAAGTTAATAAAATAATCTATAAAATTTTAGGAGGTCAAACATGAGAGAGGTAGTTATTGTAAGTGCAGTAAGAACAGCATTAGGTAGTTTTGGTGGAGCATTAAAAGATGTCTCAGCAGTAGATTTAGGAGCTTTAGTAATTAAAGAAGCCGTAAATAGAGCTGGAGTAAAACCTGAATTAATTGAAGAAGTTATTATGGGTAATGTAATTCAAGCTGGTCTTGGTCAAAATACCGCAAGACAATCAACAATAAAAGCTGGATTACCACAAGAAGTTTCAGCTATGACTATTAATAAGGTTTGTGGATCAGGTCTTAGAGCAGTTAGTTTAGCAGCACAAATGATTAAAGCAGGAGATGCTGATGTTGTTGTTGCTGGAGGTATGGAAAATATGTCAGCTGCTCCATATGCATTGGACAAAGCAAGATGGGGACAAAGAATGGGCGATGGCAAATTAGTTGATACAATGATAAAAGACGCATTATGGGATGCTTTTAACAACTATCATATGGGAGTTACAGCTGAAAATATTGCTAAACAATGGGGATTAACTAGAGAAGAGCAAGATGCTTTCTCAGCTTCATCTCAACAAAAAGCTGAAGCAGCAATCAAGTCAGGAAGATTTAAAGATGAAATAGTTCCAGTTGTTATTCCTCAAAGAAAGGGAGAACCAAAAGTATTTGATACAGATGAATTCCCAAGATTCGGAACAACAGCAGAAACTTTAGCTAAATTAAAGCCAGCATTTATTAAAGATGGTACTGTTACAGCAGGTAATGCATCAGGTATTAATGATGGAGCAGCAGCTTTTGTTGTTATGAGTGCAGAAAAGGCAGAAGAATTAGGACTTAAACCAATGGCTAAAATACTTTCTTACGGTTCAAAAGGATTAGATCCAGCTATCATGGGATATGGACCATTCCATGCAACTAAGAAAGCTTTAGAAAAAGCTAACTTAACAGTAGAAGACTTAGATTTAATCGAAGCTAATGAAGCTTTTGCTGCTCAAAGCTTAGCAGTTGCTAAAGATTTAAAATTCGATATGTCAAAAGTTAATGTAAATGGTGGAGCAATTGCTTTAGGTCATCCAGTTGGAGCATCAGGTGCAAGAATATTAGTAACTCTTCTTCATGAAATGGAAAAGAGAGATGCTAAAAAAGGATTAGCTACACTTTGTATAGGTGGCGGAATGGGAACAGCTCTTATCGTTGAAAGAATTTAATATAAATTAAGATTTAAAAAGGTTACTATGATAATTCTCATGGTAACCTTTTTTTATTAAATAAGAGTATAAAATAAAGTTAAAAGAAGAAAATAGAAATGCATGTATTAAATTAGATAGAGCCAGTGGAAAATGAAATTATTATGTATATTCATTATCTGATACAAGGGGTAAAAATATTATCAAAATAATTACTATATATAAACCAGTGGAAAAAATGAAAGAATTTTTAATCATATATTTCATTAAGGTGTTTTATATACTTCATAACATAGTTAATGCGAGGATTTGCTAAAAAATAATACATATAAATTTGGTAATTGTAGATTGAAAAAAAATAAATATTGAATAAGGATTAATTTCTGTATTCAATAATATGAAATGTATAATAGTAAGTATAGCTTTATAAAACCCAAAAATAGTATAAAATTCACCAAATTTTTGAAAATTGATGACAAAATTTGTAATGAAAATGTTAACAAAAATAATATTTTGTAGATAAATGTTACGGAATATTTAGAAAATTGAATCAAGCAAGCTTTTAAAAATCATTAAATGAGAAAAATGAAGAAATAACCAATATTAGCTGAGCATTCACGAGCATATGAAATATAAATTCATTATAAAGTAAAAATAAGCTGATTTTACTTTATAATAGTGTTTTATTAAAGATAAATATAAAGATATAATTACTGATATTGAGGTTAAGGGGGTTATGTATGAATAAAGAAGTGAATAAACTGCTTCTACAGACGATAAAATATGATTTGGGGAGCGGATTATTGATATCTTTAATAATAGTCTTAATTTCCACCTTTATAAATGCAGGAATCTATATGATAGGCATGTGTGTTTCGTTAATAAATTTTCTAGCAAGTGGTTATATAGTTGGAAAGTTTTTGGATAAAAATAGAGCATGGATTATAATTCCTACGTATTTTATTAGGATGGCATTCATAATTGCCACAATATTTCCTTTTTTGGGAAACATGGAATACGTAATATATTATATGATAGGTTTTGTTTCACATTATGTACTACTTATAGTTTTTCGTATTAAAGAAAATAGGAAAGGAAGTGTTTAGAGTGGAGCCCGTGATACCTATATTTTCACCTGAAATTTTTGGCGTTACAGTAGATATTACTGCAGGGATAATAATTGAATGGATTATTATCGCAATTTTAGGGATAGGTGCTTTTCTATTAACAAAAAACTTGAAGTTAAAACCTGGTAAGACCCAAGCGGCTTTGGAAAAAGTCTATCAAGCAATAAGGGACTTTATGGTTGGTACTATGGGTGAAGAATATGAATCATTTCTGCCTTATATAGGAACATTAATGATCTATTTGCTAATACTAAATCTAGTTGGATTATTAGGATTTAAGCCACCTACAAGTGATTTGAGCATAACAGCATCCTTCGCAATAACCACATTTTTAGTAGTGAATTTAAATGCTATTAGAAAGAATGGAATACTTGGGTTTGGAAAGGGATTGTTACATCCATTTATCCCTATGCTGCCATTAAACATAATAGAAAGAATTATTTTGCCAATGTCTTTGGCGCTAAGACTTTTTGGTAACATGGTCGCAGCAGTAATATTATTAGAATTGGTGTATCATGGATTGAGTTCAATATCAATTTTTGCACAGTTTGGTATACCTGTAATATTACACGCATATTTCGATTTATTTGATGGATTAATTCAAATGATAGTATTTACAATGCTAACTATGATTAATATCAAACAAATAGCAGAAGAATAAGTTTAGAAAATTATTAAAAAATTAAAATTAATTAATATCTTAGGAGGAATCATAATGAGTTTAGGAGTTCTAGCAGCTGGTATAGCTGTATTATCTGGTATTGGAGCAGGAGTAGGTATTGGAATTGCAGCTGGTAAGGCAGTTGAAGCAGTAGGAAGACAACCAGAAGCATCGGGAAGAGTAATGACATTTTTCATATTAGGTGCAGCACTTTGTGAAACTACAGCAATATATGGATTAGTAATGGCATTTATGTTAATGAACAGATAATAAATTTGTATGAGTTAATTGCATTGACTCCGAAGGGAGGATATAAGTAAAAATGGAAGTAAATGTATCAACAATTATATTCAATTGGATTAATTTTGGTCTGATAATCTTGATTTTAAAACATTTCTTTTGGGATAAAATCAAAGGAATAATTGAAGAAAGACAAAATCTCGTTAATCAAACGATAAGTAAAGCAGATGAAGATGCTGAAAAAGCTAGAATGTATTTGGTAAAAAATGAACAAATTTTACAATCAGCTAAAGAAGAAGGGAAGAAAATCACTGAAGCTCAAAGAGCAAAAGGTGATAAACTTTACGAGGAAATTGTTCAAAATGCAAAAGTTGAAGCAAATTCAATAAAAGAAAGAGCTAACTTAGAAATTGAAAGAGAAAAAGAAAAAGCAGAATATGAGATTAAAAAACAAGCAGTAGATTTAGCGGTAGAGCTTTCAGTTAAAGCATTAGAGCAGCAGGTAGATGAAGCAACACATAGAAAACTTATTGGCGATTTCATTGCTAAGGTAGGTATGTAAGTATGCAGGAGTATTTAGAAAAAAGATATGCGTTAGCTCTGTATGAAATTGCTGAAAAGAACAATAAAGTGGATGAATATTTACGAGACTTAACAGATATATGTGATATATTTGATGAAAATAAAGAGTTTTATGAAGTAATTAATCATCCTAAAATAAACACAGCAAAAAAGAAACAGTTATTTACTGATTTGTTTAAAGGAAAAATTGATGAAGAATTACTTTCTTTCATGATGATATTGATTGAAAAGGATAGAATTCTTCAGTTAAGAGAAATACTAGATCAAATGGAAAAGATTGATCTAGAAAGAAGAAATACTATAAGAGGTATAGTTAAAACAGTTGTACCACTTTTAGATGAAGAGTTAGAACAATTAAAAGCTATCTTTGAAAAAAAATACGAAAAAAATATTTTATTTGATACTAAAATAGACAAAAGTCTCCTAGGCGGAGTTTATGTTAAAGTTGGAAATGATATTATTGATGGAACTATAAAATCAAAGGTAGAAGAAATGAAAGAATTAATGCTTAAGAAAGAATAGAGGTGAATCCATGAATATTAAACCAGAAGAAATAACTTCTATTATAAAGAAGGAAATAGAGAAATACGAAAAAGATATCAAAACAGTAGATTCTGGTACTATAATCCAAATTGGAGATGGTGTTTCAAGAGTTTATGGATTAGATAATTGTATGCAAGGGGAATTATTAGAATTTCCTAACAATGTATATGGGATGGTTTTAAATCTTGAACAGGATAATGTTGGTTGTGTTCTTTTAGGAGAAGAAAAAGGAATAAAAGAAGGCGATACAGTTAAAGGAACAGGAAGAGTTGTTGAAGTTCCTGTAGGCGAAGCAATGATTGGAAGAGTTGTTAATGCATTAGGAGAACCAATTGATGGTAAGGGACCTATAAGCACAAGCCAAACTAGAGCAATCGAAATTCCAGCAGCAGGTATAATTGATAGAAGTTCTGTTAATGAGCCATTACAAACTGGAATTAAAGCTATAGATTCAATGATTCCAATAGGTAGAGGACAAAGAGAACTTATCATTGGAGACAGACAAACAGGTAAAACAGCTATAGCTATAGATACAATATTAAACCAAAAGGGTAAAGATGTTATATGTATATATGTTGCTATCGGTCAAAAGCAATCTACAGTTGCTCATATATTTAATACATTAACTGAAATGGGGGCTATGGATTATAGTATAGTTGTAAGTGCTACAGCTTCAGAATCAGCTCCACTTCAATATATGGCTCCATATTCTGGATGCACTATAGGAGAATATTTTATGCATCAAGGTAAAGATGTATTAATAATATATGATGATCTTTCAAAACATGCAACTGCATATAGAGCAATGTCATTATTACTTAAGAGACCACCAGGAAGAGAAGCTTACCCAGGAGATGTTTTCTATATACATTCAAGATTACTTGAAAGAGCTGCGAAGCTATCTAAAGAATTAGGTGGTGGATCAATTACAGCACTTCCAATTATAGAAACTCAAGCCGGAGATGTTACTGCGTACATACCAACTAATGTTATATCAATCACTGATGGTCAAATATTCTTAGAATCTGATTTATTTAATGCAGGACAAAGACCAGCAGTAAATGCAGGTATATCAGTATCAAGAGTTGGTGGTAGTGCACAAATTAAAGCTATGAAACAGGTAAGTGGTACTTTAAGATTGGAACTAGCACAATATAGAGAGCTAGAAGCCTTTTCACAATTTGGATCTGACTTAGATGCCGATTCTAGTAGAAGACTTGAAAAAGGTAAGAGATTAGTTGAAGTATTAAAACAAGATCAATATAGTCCACTTGAAGTTGGAAAGCAAATCATAATATTATATGCAGCTGTTAATGATTTCTTATCGGACATTAAAGTTAGCGATATAAAGAGATTCGAAAAAGAATTCTTAGAGTATGTTGATACTCATCATAGAGAAATTGAAAAATCAATTATTACAGGAAAAACTTTAACTGATGAAATAAAATCTATGTTAGAGGAAGCAATAGTTGAGTTTAAAAAGATATTTTTACAAGAAGCATAGCTTAAATTCTTAAGCTATGCCCTTCTTAGGAGGTGGAGATAATGGGCGCAGCTGGACTTCTTGAAATTAAAAAGAGAATTAAATCAGTTGAAAATACAAGAAAAATCACTAATGCAATGGGACTTGTTGCCACTTCTAAGTTAAGAAAAACTAAAAATGAGTTAGCAGTAAACAATAAGTTTATTGATATAACTGAACCTGTCGTAAGAAATCTTGCAACTACAGCTGGTGAAGAAGGAAGCAATGTTTATTTTGAAGGGAATGATAGTCAAAATAAACTATATGTAGTAATAACATCAGATTCAGGATTGTGCGGTGGGTTTAACAGTAGTGTAGTATCTCAATTAGTAAGTCAAATTAAAGATAAAAAGGATACTGCAAAGATTGTTTTAGTTGGAAGCAAAGGTCTTGGTTATTTAAAGAGAATTAAGATAGAACCAGTAGGAGAATATGTTGGTATTGAAGATGTGCCAACAGTAAGCGAAGCAAAAGAAATATTTGATAAAGCTCTTGAAATGTATTTAAATGGTGATGTATCAGAGGTTAATATTGTATACTCTGACTTTATATCATCAGTTAAACAAGAAACAAAGTCAGTTAAGATTTTGCCTATAAGTAAATCTGAAGGCACAACAGGATCATTTCTTATTGAGCCGGATTTAGATATAGTATTAGAAGATGCTCTTAATATTTATCTAAAAGGAAAAATCAGAAGCATTTTATTAAGTTCGAAATGTAGTGAACAAAGTACAAGAATGACAGCTATGGACGGAGCAACAAAGAATGCAGATGATCTATTAGACAAATTAAAGCTTAAATTTAATAGAATTAGGCAAGGTGCGATTACGCAAGAAATATCTGAAATTGTTGGAGGAGCAGCAGCTCAAAATTAGTAAGGAGGTATCTTATGCCTGGAAAGATGGGAAAAGTAGTTCAAGTAATTGGACCGGTAATAGATATAAAGTTTGATTCAGATTCTCTCCCAGATTTATATAATGCCATTGTTATTAAGGCGGGAGATTATGAATTAGTAGCAGAAGTTGAACAACACGTTGGAGATGATATAGTTAGAACAATAGCTATGTCAGCTACAGAAGGATTAAAGAGGGGAATGGATGCTGTTGACACAGGAGCGCCTATTTCTGTTCCAGTAGGAGAAGAAGTATTAGGAAGATTATTTAATGTTTTAGGAAAGCCTATTGATAAGTGCGGGGATATTGAAGTAAAACAAGAATATCCGATTCATAGACCAGCACCAAGCTTTAAAGATCAATCAGTTGAGCCTGAAATGTTTGAAACAGGAATCAAGGTAGTAGACTTACTTGCACCATATCAAAGAGGTGGTAAGATAGGTCTATTTGGAGGAGCTGGAGTTGGTAAAACAGTTTTAATCCAAGAATTAATAAACAACATAGCTAAACAACATGGTGGTTTATCAGTATTTACTGGAGTTGGTGAAAGATCAAGAGAAGGTAATGACTTATATCATGAAATGAGAGAGTCAGGAGTTATTGATAAGACAGCATTAGTATTTGGACAAATGAATGAGCCACCGGGTGCCAGAATGAGAGTTGCATTAACAGGTCTTACTATGGCAGAGTATTTTAGAGATAAAGGTCAAGATGTGTTACTATTCATAGATAACATATTCAGATATACTCAAGCAGGTTCAGAGGTTTCAGCATTACTTGGAAGAACACCTTCAGCGGTTGGATATCAGCCAACACTTGCAACTGAAATGGGTGCACTTCAGGAAAGAATTACATCAACAGTTAATGGTTCTATTACGTCAGTTCAAGCTGTATATGTTCCAGCCGATGACTTAACAGACCCAGCTCCAGCAACAACATTTGCACATTTAGATGCAACAACAGTTTTATCTAGAGGTATTGCGGAACTTGGTATATATCCAGCTGTTGATCCATTAGAATCAACTTCAAGAATCCTTGATCCAAGAATTGTTGGAGAAGAGCACTATAAAGTAGCAGCTGATGTTAAACATGTTCTTGAAAAATATAAGCAATTACAAGATATTATCGCTATCTTAGGTGTTGACGAATTAGGAGATGAAGATAAGGCTGTCGTGGCTAGAGCAAGAAGAATTCAAAGATTCTTATCTCAACCATTTACAGTTGGTGAACAATTTACAGGATTAAAAGGTAAGTATGTTCCAGTAAAAGAAACAGTAAGAGGATTTAAAGAAATTCTTGAAGGTAAATACGATGAATTGCCAGAATCAGCTTTCTTATTTGCAGGAACTATAGATGATGTTATAGAAAAAGCAAAAAAATTAGGATAAAGGGGATGAGCAATTATGGCTAATACCTTTTTACTAAAAATTATAACACCTGGTCGTGAAGTGTATAATGATCAAGTAGAAAAAGTAACTTTAAAAAGTGCAGATGGAGAATTTCAAGTACTTGCAAATCATCAAAGTCTAATATCTACTACTATACCTTGCATCGCGAAATTCAAAGATGCTAAGGGAAATGATGAAGAGTTATTTATTTCTAAGTCACTTGTTCAGATTAATAATAACGAAATGGTTATAAGTAGTGATGCTGCTGAGTTTGAAGAAGATATTGATGAAGAAAGAGCAGAACGAGCTTTTAGAAGAGCAGAAGATAGATTAAAAAACTCCGAAAACTACAATAGAGGAAGAGCAGAGGCAGCATTCTTTAGGGCAAAGCAAAGATTAGCTCTAAAAAAATCTAATAGATAATGTTACTATAAATTAAAGTGTACCATCTTTTATATAGGAAATATCCGTATAAAGATGCTACACTTTATTTTTTATTATTTTTTATTCTAGATATTGACAATCTATCACAAAATTTTAAGAAATTTATATTATATATTATATAGCTGGATAGAAAAGAGAATAAAAGTTAAAGGAGATGGCCATAATTAAGAAGATAAATTAAGGGGGTCTTAATATGAATATAAAAATGAGTATAGTAATTTTTATATTATTATCTTTTTTTAATATAGGTGCTATTTCCAGCGATATAGTCAGCGCTCAAAATTCATTCAATACTTTAGAAATGAAAGTGAAAGATATAAGTGAGTTTCAAGAAAATGGTGTAAAACTTCAGTATAGGACGAAAAATAATATCGCAAATGAAGCTTATAGAATAAAAGAAAATTTACCTAGAAATATGGCTCTTTCTTATAAAGATGGTGGAAATGATGAGTTTGAAGCGTTTAATAGTGATTTTAATATTGATATAAAAATATGGCGTGAAGATGTATATAGTTATGTTGAAATTATATTAACAAACAAGAATCCTAAATATGGGACAAAGTATTTGAAAAACATACTTAAGAATATTGAAAATTCAAAATTAGAAAATATGCAATATTTTCTTTACTATGAAGGTAAAGAAAAAGGATTAGATAGTGATTATTTTACAAATGGATTAGTCAGTGAATATAACATAAGAAAGGCACAACTTATGAAAATCAGTAATGGATACTCAGGAACAGGTTATTTGAACGATGGAGAAAAAATTAATTTTGCATTAGTTGATTATGATACTGGTTCACATATAATAATTGGTACGCCAATAATATTTACAACATATTAAGACATATTGAAAAAGCTTTTCAATATAACCTTTATTTTGCTTTGGGTAGAGTATAGATTTGCTTATTAGCAAAGCCTTATTGGATTTATCTAAAGTAGAGTATATGTAATATTTTGGACAGTTATTTTTCATATGCTTAACAATTCATTATGGAGGATAATATGGAGAAAATAGTGGTTAAAGGTGTAAAAGAACTGAGAGGGGAAGTTAATATAAGTTGTGCAAAAAATTCAATTTTACCAATAATTGCAGCAACTATATTGTGCCCAGAGCCTATAATTATTGATAATGCACCTAGGTTAGAAGATGTTGAGGTTATTTGTAAGTTATTAAGCGAACTAAACTGTGACGTTAATATTTCAAACGTAAACGATAGATTAACAATAAATACGAAAAATATAGTAGAAATGGATGCTAATGAAGAGCTTATGAGGAAAATGAGAGCATCATTTTTAATTATGGGACCTATGCTTGCTAGATTTGGATATTGTAAATTATCATTACCAGGCGGATGTAACATAGGAAGTAGACCAATTGATTTGCATCTTAAAGGATTTAAATTACTTGGAGCAGAGGTTGTAATAGGTCATGGGTTTGTAGAGGTGAGAGCAAAGAAAATAGTGGGCAACAGAATTTACCTTGATTTTCCATCTGTTGGCGCTACTGAAAATATTATGATGGCATCTGTCTTTGCTGAAGGAACAACTATAATAGAGAATGCAGCAGAAGAACCAGAAATCTGGGATTTAGCGCAATTCTTAAATAAGATGGGGGCTAAAATAGAAGGAGCAGGATTTGGAAAGATAACTATAACTGGTGTTAAAAATCTAAAAGGAATTAGTTATACACCTATATATGATAGAATAGAAGCAGGGACATTTATGATAGCAGCAGCTATTACAAATAGTAAAATAAAGATAAATGGAGTGAATGAAGAGCATTTAAGACCTGTAATAGAAAAGTTAAGAGAATGTGGAATAGGTTTTAGCAATTACAAAGATCATTCCATTGTAGTAGATGGACGGGGAAGTAAGAGGCCATTGGATATCAAAACACTTCCTTATCCAGGATTTCCAACCGATATGCAAGCTCAAATGATGAGTTTATTATCTATTGTTGAAGGTGTTAGTGTTATTACAGAAACAGTTTTCGAAAATAGATTTATGCATGTTGCTGAATTGCAAAGGATGGGAGCCAACATCAAGATTGATGGAAGAACTGCTATAATTGAAGGCAATCCAAGACTCACAGGCTGCGAAGTTAAAGCAACTGATTTAAGGGCTGGGGCAGCAATGATACTAAGTGGATTAGTAGCAGATGGTGAAACAGTGGTAAATGATGTTTATCATATTGATAGAGGATATGTAAGAATTGAAGAAAAGTTTAGGAATTTAGGAGCAGAAATATATAGAATAAATATGTAGATTAAGATATGAATTGTGTGTATGCATAATTAGGGTTCATAGTTATGAACAAGGTATACAAATTTTTCATGTAAGTTTTATAAAGGAATTTACATGAAATTTAGTTACCTATCCCTAATTATGCTTTTTTATTCTTTGGGAATTTATATTTTAGTAAAATCTGTGGACGAGGTACTCCTTGAGGGGATAAATTAAAAAAGGTTGATTAAATAGTTTGGGTATTTTAAAAAGAATAAAAAAGAAATCTTATTCGCCTGACTTTTCTCACATGCGTTCGAAAAGCTAGATGCGTGAAAAAAATCTACACATATGAAAAGAGTGCGAAGCACAATACGGAACTTAAATGAAAAGAGTGCGAAGCACAATACGGAACTTAAATGAAAAGAGTGCGAAGCACAATACGGAGCCTAACCACAGTCGCTTGGGATTTTTTTATCTCTAATAGCTTATATTTAAGTTAAATCTATGCGTAAGTTATAGGAGAGACTAATTAAGAAAGTTATGGTTTATCTAAATTTGGGTAGCTTAAAGTTAACATAATTAACATAATTATTAGGCTAAGACAATATACTTTAGAGTGCAGGCTTTAGGAGGTAGAGTATGAAGATAATTAATGCTAGGACTACAAGTATAAAGATTAGCAATAATGTGAAAATAATTGCAGCTATGACTTTGATCATTTTTACTATATTAATAGCATTACCAATAGCTTTCTTAGAAAATGGTAAAGGGAAAATTGATTCGTTTAACTTGAGTGACAAAGATATAATGAAGAGTTCAAAAATAACATTTCCGTCTAATGGTAAAGTTAAGCTATATCATAGGTCAGAAGATAGAGTTGAGGAAATAGATTTGGAAGAGTATGTAATGGGAGTAGTTGCGAGTGAAGTACCAGCTAATTTTGAGGAAGAAGCTTTGAAAGCTCAAGCTGTTGCAGCAAGAACATTTTATATGAGTAAAAGAAATAACCCTAATAAAGAAGAAAAAGAGAAAGGAGCTGAAATTTGTGATACAACCCACTGCCAAGTATATATGAGTAAGGATGAGAGAATCTCTAAATGGAGTAAAAGTGAAGCTGAAAGTAATTGGGAGAAGATACAAAAGGCAGTTCTAGATACAAAAGGGCAAGTTCTTACTTATGACGGTTCAGTGTTGGAATATCCTCAATTTTTTGCAACCAGCTCTGGAAAAACAGAAGATGCAAAAGATGTATTTTCTATGGATGTACCATATTTAAAATCAGAAGACAGTAAGGGTGAAGAAATTGCACCTAAATATAAGACGAGCACACAAATTCCTATAAACGATTTTATAAATAAAATTAATTCTAAATATAAAGGTGTTAATGCTAATAAAAGTAATTTGTCATCACTAATTAAGATATTAAGTTTTACAGAAGCTGGAAGTGTAAAAGAAATAAAAATAGGCAATGAGATTGTTAAAGGAACTGAATTTAGGACATTGTTCAATTTGAATTCGACCAATTTCACATTAGACTTTCAACAAGATTCTGTAGAAGTTAACTGCAAGGGTTATGGCCACGGTGTAGGGATGAGCCAATGGGGGGCTAATGCGATGGCAAAGAGTGGATCGAAGTATGATGAAATTCTTAAACATTACTATAGCGGAGTCGAAATCCAAGAAATAAATTACAACTAAGGAGAGAGTATTTACGTTAACTTAGACATAGGGTTGGCATAACTTCATATGAATAATTGAATAAATTTAAAGAGGATACTTGTTTATTTTTTTATAGCAAGTATCCTTTTCTATTTTTGACTATAAATTAGCATGGGGTATATCCTCCAATTAATTGAATTTTTGTATATGTATGTTTAAAAAAAGTGGAGATGGACATAATTTAGAACATCACTACTTAAAACAGAAATTATAAAGTAGAACTTCTTAAATTAGGGCCTAAATCCCTAATGGATATATCTATTGTTTAATAATTAAATTATATGTACTTTTTAACACTAGATATACACTTATAACAATAATTTTAAAATACCTTTAAATGTAAATAATACATGATAAAAAAGCAAATTTATGTATTATTTTTCATAAAAAGGGAACTATAACAATTGGAGGTGTTCATATTGGACAAAAATTTAAAAGAAAAACTTAAAAACTTATTTAGGAAGGAGGGATTTTATATCGCCTTATTCCTATGTCTCTGTATTGTAGTAACTGTTGGAACTATCTCTTATAAAATGCTCAACAGCAAAAACCAAGTTAATAAAACAGAAGACGTAAATAAAGATCTAACAATGAATTCTGGAAATGAAGGAAATTCTAATAATTCAGTTCAAAATGCTGAAAGAGTAGAGAATGCTCAAAATAATAGTAATAAAGACAATGCAGATAAAACAAAAATAGAAAAGGCTGCATCAGTATCTACAAATAATACGGTAACATTTGTAAATCCTATAGATGGAGTAGAAAGTAGAAAATATACTTATCCTGCGCCAGTTAAGATGGAAGAAGGAGTTTTCAGAACTATTAGAGGTATTAATCTACAATCAACAGTAGGATCAGAAGTAAAGGCAGCAGCAGATGGTGTTGTGGAAGTTGCAGAAAATACTGGTGTTGAAGAAGGGGTTGTAGTAGAAATTAAACATGCTAATGGCCTAAAGACAAGATACGGAAATCTTGATGCAAACTTATCAGTAAAAAAAGGAGATAAGGTTAAAGCAAATCAAGTTATTGCAAAAGTAGGAGATAGCGCAAAGGTATTTAGTAAAGATGTATTTGGTGAATTTTTAAATTTACAAGTAATTAATGCTAATGGAGAACAAGTTAATCCAGAAAAATATTTTAATTTAAAATCTAAATAAAATTTTATGAAAATATATATTAGTCATTTGTTTTTTTCATTAAAATAAATGACTAATAAATCAAAAAATAAATGATAATAAAATGATAAAATCAAGGAAGTGGTATTTTGAAAGACTATATTGAAGAAAGAGTTTTAGATGTTGCAAGATATATCATAGATTCAAAAGCTACAATAAGAAAAACAGCTAAGGTTTTTGGTGTTAGCAAGAGCACAATTCATAAAGATATGACAGAGAGATTGTTAAAAATTAACCCAGAAATTGCTCAAGAAACTCATTCTATTTTAGAATTAAATAAAGCTGAACGACATATTAGAGGTGGAAAAGCTACACAAATGAAGTATAAAATTATTGAATCTTAGTAGGATTAAGTCTATAATATATTATTAGTAGAATTATGTAAATATAGGTATTAATATGTATTATAGGAGTGAATAAAAAATGTGCTTTTGGAGAACGGGGATAGACCTCGCAATTGACTTAGGAACGGCAACTGTACTAGTTTACGTAAAAGGTAAAGGGGTAATATTAAAAGAACCTTCTGTTGTAGCCATAAATAAAAATAATAATAAATTGTTGGCTATAGGGGAAGAAGCAAGAAAAATGATAGGAAGAACCCCAGGAAATATTGTTGCAGTAAGGCCATTAAGAGATGGAGTGATTTCTGATTACGATATAACACAAAAAATGCTAAAGGAATTTATAAAAAAAGCGTGCGGGAAAAGAAGTATAAGTGCACCTAAAGTAATTGTTTGTGTACCATCTCAAGCTACAGAAGTAGAAAAGAGAGCTGTTATTGATGCAGCTATGAATTCAGGAGCAAAAACGGTCCATTTAATTGAGGAGCCGCTAGCAGCAGCCATTGGAGCAGGATTAGATATTACTAAGCCGAATGGATGTATGGTAGTGGATATTGGCGGAGGTACTTGTGATATCGCTGTTATCTCATTAGGTGGAGTGGTAGAAAGAGAGTCAATAAAAGTAGCGGGAGACAAGTTCGATGAAGCCATAATAAAATATGTACGTAATGAATATAAATTAATGATAGGTGAGAAAACAGCTGAAGATTTAAAAATAAATATTGGATCAGCATTTAAAAACTCTAGAAATCTAACTTGTATGATGAAAGGTAGAAACCTCATTACAGGATTACCAGATGAAATAGAAATTACAACAGAAGAAATACGAAATGCAATAAAGGAACCTGTGGAAATAATAGTTGATACTGTAAAAAAGGTATTAGAAAGAACACCGCCTGAATTAGCCTCGGATATAATAGAAAGAGGAATATTAATGACTGGTGGGGGAGCTTTAATACATGGGTTAGATAAACTTATAGAGTTTAAGACTGGCGTAGTAGCAACTATAGCCGAGAACTCAGTTGAATGTGTTGCGAACGGTACAGGCAAAGTGCTTAATTATATAGATAAATTAGATAGTCAAGTTAATTCTCAGCAAATAGTTCTTATAGAATAGCTTTATAAATAGCAGTCATTAGTAATTTCACTATTGACTGCTATTTATTTAGTTAAATATAAAATACCTAAATTTTAGGATATTTCCAGTGACTTAAACTATAGGCATCAATAAATATTTTGGATATAATTTTAGCCATATCCATAATGAATGAGAGTCTTATGCTTCGCGAAAAAAAGAATTCAGCATTATCACTAGAGTCCACAATGCCTATAACTGATGCAATTCCTACCTCGGGAAGTTCTTTTCCGACTCCTTTACCAGGATGTATTGCATAGTCCCTTATACGAATTTCACCAATATCATCTTCGTCACCTAAGCAGGCATCAACACCAATTATTGATGCATTAGGGTGATTACTATATATTTCATTTAATCGTTCATCTATGTTCAAAGCATGAATTGGAGAAGATAAAGTTCCATAAACAGGTAAAGGAAAAAAGTTTTCTGTGAGTATAGATCCAACTAGAGGACCTAAACAATCCCCAATACATTTGTCAGTACCAATACAAACTATTATGGTGTCTTTTGATATAAATTTTTTAACTTCTAAAGCTAAATTATAATAAAATTTAGGATCAAGTTTAATATCTGGCTTGCTCAA
Protein sequences of DBSCAN-SWA_1 >NZ_CP043998|432223:485474|447424_448987_+|WP_039771790.1|DBSCAN-SWA MADIDIVKENVQFEQLLRENNTNSVLKDEYLIPDTHPDVQEILTVEARPMVTNKEIIGDKVVIEGKVEYTVIYLAKEEGLAVNSVNYNQNFTNNIDLNQGENRVICEAECNIEHIEANIMNERKISIQGIVTVDWELYKSNEFEFVKDIEGNDQVEVLKKTETINKINATEDVELVGKSMIRVGMDKPQISKILKCSLLLHKKEIKITEDKVYLGCYCKLNILYKGEDSKEIIPLEDDIYLSKEEEINGITSDMIPTVSYEISNNDLMLEEDDLGEIRIINDELVVRANVKIFSKENIDTIKDAYSTNCLLSLKKDEHEVGILHGMNNSEAIVKYNIQLKDNDLRPEHIISANGAIILTDKQVVKDRVIVEGIIKASILYKTTDEEKYLSSVKAEIPFSAAIDIAGADENMKSIIKNNLENIEAAIEGNNIAIKATVILSGRVLYEMNKEFVSDVVEEEGDIPEKKASITIYVISKGDTFWNLAKKYNTTVDDLIKINKIEDPEHIEEGQKLIIPGRAIF >NZ_CP043998|432223:485474|449316_450162_+|WP_011967741.1|DBSCAN-SWA MKKVLSGNLIIIGGAEDKEGKKEILKRVCDSIDKSKDTLLIATIATDYPKEAANKYKEVFGELEVKNIKVLDISERTEASDDMNVELIRDSSLIFFTGGDQLKITSLIGGTPVYDALEEAWKNGAFIVGTSAGASVMSDTMIVQGEDDDDPRKCTLKMSPGLGLIKDVIIDQHFAQRGRIGRLLTGIAQNPEVLGIGIDENTGIVVNQSGMIEVIGEGAVYFIDGSAITYTNVSELYADDILSMHNVKLHVLTDGNKFDLIKKSPFEEEKFNHEDNTKENI >NZ_CP043998|432223:485474|463322_464405_+|WP_011967753.1|DBSCAN-SWA MLLDKLEFIENKYDELSVKISDPSIMQNQNEWRKLCKEHADLEVIVNSYREYKKVVEDLKANKEMLSGESDKEMREMLNEEITDLTNREEQLETEIQILLLPKDPNDDKNVFVEIRGGAGGEEAALFAYNLFRMYTRYAETQRWGVEIMSLNETDLGGFKEVVFMIKGNGAYSKLKYESGVHRVQRVPDTESSGRIHTSTATVAVLPEVDDVEIEVADKDVRIDVFRASGNGGQCVNTTDSAVRITHLPTGLVVSCQDEKSQLKNKEKAMKVLKSRLYEQAERERAQGIAEDRKSQVGTGDRSERIRTYNYPQGRITDHRIGLTLYKLDTFLGGDIDEMINALITADQAEKMKLMGNTQM >NZ_CP043998|432223:485474|478482_479133_+|WP_011967769.1|DBSCAN-SWA MNIKMSIVIFILLSFFNIGAISSDIVSAQNSFNTLEMKVKDISEFQENGVKLQYRTKNNIANEAYRIKENLPRNMALSYKDGGNDEFEAFNSDFNIDIKIWREDVYSYVEIILTNKNPKYGTKYLKNILKNIENSKLENMQYFLYYEGKEKGLDSDYFTNGLVSEYNIRKAQLMKISNGYSGTGYLNDGEKINFALVDYDTGSHIIIGTPIIFTTY >NZ_CP043998|432223:485474|434519_435749_+|WP_039771779.1|protease|DBSCAN-SWA MNNNDNNEKFIDVESLPVDKGQQVAWENCFQNSNNYVDPKRKKRRGLRMLGRIAGILVLTMVGGAIGSAATYSFMKTNNVAATKQITSYIPQSFTSSTPDAMSAADAFNKVAPAVVIVSTKGSSNSGFMNGEVEGMGSGFIINEEGYILTNYHVIANAKEITVTLSNNTEVSATVVNYDQDRDVAMLKLKDGTKVPAVAELGDSDEVYPGAEVIAIGTPLSKNFAQTLTKGVISGSNRTIDDSGKSVDFIQTDAAINPGNSGGPLVNAKGQVIGINSMKIGSDASGSSTPVEGIGFAIPINEVKNKIDALSKPILNLGIQIREIDSATAKKYDLVEGIYVSSVEEYSPAEKGGLKIGDIIVKCDGKEAKTFDELKTIKESKNAGDTMKIEVIRDKKTVDLSVVLEEKSN >NZ_CP043998|432223:485474|435948_436257_+|WP_011967729.1|DBSCAN-SWA MEEIILNIIMHSGEARTFSMEAITLAKQGNFDKAKGLIIKADEELGYAHNSQTSLIQGEAVNEKIEFSLLLVHAQDHLMTTMVLKDLAVELIEVHEKISSIK >NZ_CP043998|432223:485474|442082_443204_-|WP_039771787.1|DBSCAN-SWA MKIGIDGRAAKWYRGTGIGTYTYQLISSLNNVDSNNNYLIFTPQCDFISDLKNNFKTELIESIPSNSFWDDINVPNILNNADIELYHVPQNGVGLSENVECKKVITLHDIIPLRMPETVSDRYLKIFNNELPKILDNCDGIITVSNYSKDDIAKEFNFPAEKIYVTPLAAEDIYRPMSKCKSKDFITEKYGIKEDFVLYVGGFSPRKNIIGLIEAYSKLPNKLKESFKLVIIGRKGPSYTKYKNRADDLNISNNVIFTDFIPIEDMPLFYNAAEVLVYPSFYEGFGLPPIEAMACGTPVIASNVTSLPEVCHESALFIDPNDIDSLSYDIERVLSNSLLRLTMVKKSLTRSKNFSWNKTALDTMSAYEAIINS >NZ_CP043998|432223:485474|465113_466163_+|WP_017209891.1|DBSCAN-SWA MKTKISMIKNVSEDEEKIREAAECIKNGGTVVFPTETVYGLGADALNEEAVEKIFKAKGRPQDNPLIIHVSSKKLDLYAKEIPKVADELINRFWPGPLTIILSKKDIIPNVTSANLNSIGIRMPDNEVARKLIELSQTTIAAPSANISGRPSPTDFQRCIEDLDGKVDYILGGEQSDIGVESTIVDCTVVPPIVLRPGGITLEMLREVDPRIEIDKAIMEKPSENLKPKAPGMKYKHYAPNAKVTIISGERKKTIEKIREMVHYNIEKGKKVCILTVEENVDEYTEGTSIVLGSLSDLSTVARSLFEALRKCDDLGADLVFAEGYEEKGVGVAIMNRLNKAAGFDIINV >NZ_CP043998|432223:485474|461426_463187_+|WP_039772940.1|DBSCAN-SWA MERRDVGGQAVIEGVMMRGSKNLATAVRTPKGNIEIDFKDNRPVTKKYPILNIPFLRGFFVLVESMKVGMESLNYSASFLEEDNEEPSKFEKWLDDKLGERANSVLMAITMFISFLFAIGLFVALPTGIASVFKGAGISNVMLNLIEALIRIVILLLYMFSISKLNDIYRVFQYHGAEHKTIFCYEAMEELTVENVRKQSRLHPRCGTNFLFLVMFVSIIVFSFTGWGGIIERLALRIILIPVVTGISYEIIKWLGKNDSMLAQIIAYPGLKLQLLTTKEPDDSQIEVAIASLKAAEGIKDPNKNIEELIKTGTFTLKENGIDTARLDAELLLGNIIEKDRVYLITHKEDEVSKEDAEKYFDLIEKRRNKMPVKYILNKCEFMGIEFYVEEGVLIPRGDTEILVDEVLKIIEENQEMQICDLCSGSGAVGISLAHFRQNIKVDLIDYYPIPEKVSLINIEKNKLEDRVFFIKSDLLEESIKNNKIYDIIVSNPPYIEECEIGKLMEDVKNYEPHTALNGGNDGLDFYRKIIDQSQYTLRESGILAFEIGYNQGEAVKLLMENNGFTNVKIVKDFASLDRVVVGIKI >NZ_CP043998|432223:485474|466973_467603_+|WP_039772938.1|DBSCAN-SWA MSKVIEINHPLILHKLAILRDEKTGSKDFRKLVEEISMLMAYEVTRDLNTEEVEVKTPVAVTKCKMLSGKKMAVVPILRAGLGMVDGVLNLIPAAKVGHIGLYRDEKTLQPVEYFCKMPQDIAERDIIVVDPMLATGGSAIDALTMLKNRGAKNLKLMCLVGAPEGIEAIKKAHYDVDIYLASIDEKLNEHGYIVPGLGDAGDRLFGTK >NZ_CP043998|432223:485474|455221_455530_+|WP_023974841.1|DBSCAN-SWA MQNGLKYIEILNNICKYYGIDEENFIELLKNRDNKYILLLLLKYNHCLDTERVKEVFNLKTSKSISNNLKLAEEKLLINRLFREKYFELEDNIGKNSMTNLL >NZ_CP043998|432223:485474|477860_478268_+|WP_011967768.1|DBSCAN-SWA MANTFLLKIITPGREVYNDQVEKVTLKSADGEFQVLANHQSLISTTIPCIAKFKDAKGNDEELFISKSLVQINNNEMVISSDAAEFEEDIDEERAERAFRRAEDRLKNSENYNRGRAEAAFFRAKQRLALKKSNR >NZ_CP043998|432223:485474|432223_433243_+|WP_039771777.1|tRNA|DBSCAN-SWA MDKKIILAIESSCDETAAAVVVNGREVLSNIIASQIDTHKKFGGVVPEVASRMHIEAVDSVVKAALLEAGISIDDVDAIGVTYGPGLVGALLVGLQYAKGLALGSKKPLIGVNHIQGHISANFIEHKDLKPPFVSLVVSGGHTFIVHVKGYRDFEVIGQTRDDAAGEAYDKVARALELGYPGGPKIDKLAKQGNKDAIEFPRAKFQDDTLDFSFSGVKSAVLNYLNKAKMKEEETNKADIAASFQNAIIDVLKTNLFLTCERKGIKKIAVAGGVASNSCLRETLLEEGKKKGIEILFPSPILCTDNAAMIGSAAYFNYQEGAVSDLNINAKPNLKLGER >NZ_CP043998|432223:485474|440707_441763_+|WP_023974836.1|coat|DBSCAN-SWA MNRTKYSEKNYLCDYDLSLKFFEELGIKVNDIVPLRKVFLVYTDEGNKILKRVNYDVDRVNLISDSLDYVKKSYEHVITYKRFKDDLCYKEWNGQIYIVMDILNGREASFSNPVEIDLCAENIALMHKASKGLREYLKDKYKKDFLDISLKDKIKEAYDDLIWMKSLVDTYKYKNEFDKLFVNNVDKYLNEIKEVQNDLEKSSYDNLRQDGDTIRLCHNDLAYHNFLTKNNEINIIDFDFMTIDLRVMDIWNFILKCIKNAAFDVDKMSTCINGYENVSILKKEEKELLYILIKFPKDFYTISRDYYHKRKNWEYEVYLSRFEGKFSNEDFRYEFLKVLENKFFIGSEVKK >NZ_CP043998|432223:485474|481157_482216_+|WP_011967771.1|DBSCAN-SWA MKIINARTTSIKISNNVKIIAAMTLIIFTILIALPIAFLENGKGKIDSFNLSDKDIMKSSKITFPSNGKVKLYHRSEDRVEEIDLEEYVMGVVASEVPANFEEEALKAQAVAARTFYMSKRNNPNKEEKEKGAEICDTTHCQVYMSKDERISKWSKSEAESNWEKIQKAVLDTKGQVLTYDGSVLEYPQFFATSSGKTEDAKDVFSMDVPYLKSEDSKGEEIAPKYKTSTQIPINDFINKINSKYKGVNANKSNLSSLIKILSFTEAGSVKEIKIGNEIVKGTEFRTLFNLNSTNFTLDFQQDSVEVNCKGYGHGVGMSQWGANAMAKSGSKYDEILKHYYSGVEIQEINYN >NZ_CP043998|432223:485474|436269_437424_+|WP_039771782.1|DBSCAN-SWA MKNKIKYAIVFSVLLLIGIVSINLFQPNKEQQVRGNIELLVNENSYEYLVECANNFMKENDRTSISVKKLENYNQIVNNNSEGSTKSKISSIAQIDRFSFDKLKLDNYEYYNKDDKLLSEYAKNFSKYRVAQVKYGDSSIGIPLTSRPLAFYVREDLLKSYGYERDSLNTWDDIIRIGKDIHEKSNGKIFIINATDQDYEDLMDLLTMETLSDGDKSTDVVKSEIQAMMKKLEDNNILNLQNGGEFLARISSINAMKEIAALDVPCTWSVNNVPSLKPGANKFFSSEGDNLLILNQNSENDKLIEKFITYVITNNKEAVKYVKEGKFFSSYLYTYNTKDIEEPVKNFTGKSPLVVLSNIEEKTPIISNYDEYIKIKQEIRANTN >NZ_CP043998|432223:485474|471987_472677_+|WP_077723628.1|DBSCAN-SWA MFRVEPVIPIFSPEIFGVTVDITAGIIIEWIIIAILGIGAFLLTKNLKLKPGKTQAALEKVYQAIRDFMVGTMGEEYESFLPYIGTLMIYLLILNLVGLLGFKPPTSDLSITASFAITTFLVVNLNAIRKNGILGFGKGLLHPFIPMLPLNIIERIILPMSLALRLFGNMVAAVILLELVYHGLSSISIFAQFGIPVILHAYFDLFDGLIQMIVFTMLTMINIKQIAEE >NZ_CP043998|432223:485474|437580_438699_-|WP_023974834.1|DBSCAN-SWA MKIAIDARSSTLHQGTGIGTYTSNLISEILSLDSNDEFTLFCSGKFNKEFNKENVNIIYSSGRHGGFYERYYIPNALNKVHADLYHIPQNGIGLDFDTKIPTIVTIHDLIPYIMPETVGKGYLERFLNNMPNIISNSRGILTVSEYSKRDILKFFSFYPEEKIFVTPLAANNNFKPLDKNQCKLYVKNTFKVDDPYILYIGGFSLRKNALGLIKSFCKVYKDLNKPYKLLLGGPLKDEGEKLLSFVQENNLQDKVVFCGYIEDDILPVLYSGCDAFVYPSFYEGFGLPPLEAMSCKAPVITSSITSIPEVTGDSAILINPYNIEELDNALVDLLNNETLKAELSEKGYLRSLNFTWNKTAKNTLNAYRSLIS >NZ_CP043998|432223:485474|443312_444311_+|WP_011967736.1|coat|DBSCAN-SWA MMREFEIERQFNIKIEKIKANKGVYYLKTDKGERCLKKINYGPQKLLFVYGAKEHLRKNGFNNLDKYYLNINGEPYALVNEDLYTLSEWLEGRECDFHNIDEVKIAAKTLANLHEASKGYDPPENSKLKSDLGRWPHLIEKRIKSLDKMRDMVRKKSIKSDFDMLYLKSMEFYKEIGKKSLVTLNESDYYELCAIAENEKSFCHHDFTYHNIILSDSMDVHVIDFDYCKREVRTFDISNFMIKVLKRVEWNLEFATAIIESYDSVSKLKPEEYKVLYAYLQFPQRYWRLANRYYYNEVNWGQNTFAGKLESIIHEQEKYLEFLEKFKNEYKI >NZ_CP043998|432223:485474|433252_434254_+|WP_023974832.1|DBSCAN-SWA MKLLSHSNGVHKVEKDKTSKRSILKKCVIFFVGLSIFGFLVQILNDFVDNTRLKSRFKYVRIDGRKMEYKLKTGGDYTVVFDGSIGTTMYEWDDVCKSLEEKKISTFTYNREGYGFNDGGDNRTPEEQAKDLKALLRKAGAPEPYVLVGEEYGSLVLSNFANLYSDSVAGVVLINPISEENIQTKEFKNSIKSKYYRSIFEKMGTNFSLTALLNKAGLTMENNTFKKYLNQNELDEFQSFENKKNYKQAVSNELENLYKGISNSQTNELLGNKPLYLITNNEDDPVKKIGNTTVTTIYKEEIEGSPMSVLDPDSVVTGVNSVLKDAKKAAKKS >NZ_CP043998|432223:485474|453830_454568_+|WP_011967744.1|DBSCAN-SWA MIKYLKLKKIVLVVLITLSINIFSGCTSIVRGNSTSLVNSLIATESNKNDNNMRVLNYDEVKDSLIRFHVIANSDNDDDQQLKLKVKNRVIDYLYPYLNSSQSLDESRKIIKDKMEDVKTLAQQVIKDNNYDYDVKVELSRENFPDKSYGNITLPQGNYEAFRIIIGSGQGRNWWCVMFPPLCFVDESKAQVEYDKTENKIKSNGKSFELESKDDSTENVGDKQADGNNIKIKFKIVEIFRDIFK >NZ_CP043998|432223:485474|467684_468179_+|WP_011967758.1|DBSCAN-SWA MERRDKKNYYLDIAETVLERGTCLRRNYGSIIVKNDEIISTGYTGAPRGRKNCMDLNSCIREKLKVPRGTHYELCRSVHSEANAIISASRRDMIGATLYLVGRDAKTREYVRDANSCSMCKRLIINAGISNVIIRDSKQEYREISVDSWIEDDDSLRIVKDAGY >NZ_CP043998|432223:485474|445572_446112_+|WP_011967738.1|DBSCAN-SWA MIYDYLVKDINGNSVSMETYKGKVLLIVNTATGCGFTPQYEGLQKLYDKYKDSGFEILDFPSNQFFEQAPGTNEEISNFCKLTYGTTFKTFAKIDVNGENSDPLYVFLKKEAPIASEDDASKGLYNLLSEKGFNTSGDDIKWNFTKFLVSKEGKVIARFAPTYEPEKIADQIEKLINEK >NZ_CP043998|432223:485474|468458_469607_+|WP_023974848.1|DBSCAN-SWA MSTKKIITIFGTRPEAIKMAPLVKELERREEIESKVCVTAQHREMLDQVLELFDIKPDFDLNIMKTKQTLTGITSRVLEGLEEVFKEEKPDMILVHGDTTTTFAGSLAAFYQQIKVGHVEAGLRTFNKYFPFPEEMNRKLTGSLADLHFAPTKGSKENLLREGINASDIYVTGNTVIDAMKHTVEDDYIFENEELNNIDFSKKVIMITAHRRENWGEGIQNICIALNKIVEQNEDVELVYLVHLNPVVKDVVYERLGGKERIHLLSPLDTKETHNLMNKSFMVMTDSGGLQEEAPHLAKPVLVLRDVTERPEAVEAGTVKLVGTNIDQIVSEANELLRNPDAYCKMSKSINPYGDGIASRRIADAILKYFGLTTREVEEFKR >NZ_CP043998|432223:485474|483501_483756_+|WP_011967773.1|DBSCAN-SWA MKDYIEERVLDVARYIIDSKATIRKTAKVFGVSKSTIHKDMTERLLKINPEIAQETHSILELNKAERHIRGGKATQMKYKIIES >NZ_CP043998|432223:485474|474031_475546_+|WP_011967765.1|DBSCAN-SWA MNIKPEEITSIIKKEIEKYEKDIKTVDSGTIIQIGDGVSRVYGLDNCMQGELLEFPNNVYGMVLNLEQDNVGCVLLGEEKGIKEGDTVKGTGRVVEVPVGEAMIGRVVNALGEPIDGKGPISTSQTRAIEIPAAGIIDRSSVNEPLQTGIKAIDSMIPIGRGQRELIIGDRQTGKTAIAIDTILNQKGKDVICIYVAIGQKQSTVAHIFNTLTEMGAMDYSIVVSATASESAPLQYMAPYSGCTIGEYFMHQGKDVLIIYDDLSKHATAYRAMSLLLKRPPGREAYPGDVFYIHSRLLERAAKLSKELGGGSITALPIIETQAGDVTAYIPTNVISITDGQIFLESDLFNAGQRPAVNAGISVSRVGGSAQIKAMKQVSGTLRLELAQYRELEAFSQFGSDLDADSSRRLEKGKRLVEVLKQDQYSPLEVGKQIIILYAAVNDFLSDIKVSDIKRFEKEFLEYVDTHHREIEKSIITGKTLTDEIKSMLEEAIVEFKKIFLQEA >NZ_CP043998|432223:485474|472999_473479_+|WP_023974852.1|DBSCAN-SWA MEVNVSTIIFNWINFGLIILILKHFFWDKIKGIIEERQNLVNQTISKADEDAEKARMYLVKNEQILQSAKEEGKKITEAQRAKGDKLYEEIVQNAKVEANSIKERANLEIEREKEKAEYEIKKQAVDLAVELSVKALEQQVDEATHRKLIGDFIAKVGM >NZ_CP043998|432223:485474|460816_461401_+|WP_017209894.1|DBSCAN-SWA MSKLYFRYGAMNSGKSTHLMQVAYNYEERGMKVVIIKPRIDNKGGDTLVSRLGVNRRVDLLVSDQDDIFQIISNYIKENNKIDCILVDEVQFLRESQIDQLFEIAVKINIPIICYGLRTDFKRNGFEGSTRLLLLAHSIEEMKTICACGRKAIFNGRKINNKFVFEGEQIAIDDEDNVEYESLCGECYYKYKEN >NZ_CP043998|432223:485474|446727_446970_+|WP_011967739.1|DBSCAN-SWA MEKVKTIASIKNDIERHVGQKVTLKANGGRKKILVNDGIIESVYPSIFVIRLKNDTQRTVTYSYSDVLTKTVQLVFPTRI >NZ_CP043998|432223:485474|459097_460204_-|WP_039772942.1|DBSCAN-SWA MKKVLILTTSTGQGHNQAAASVEESFNNSGYEITKLDFLAKNSKLLNDIIVIGYEFSASKFPKTYGFFYKLTDTNLTNKLLKLIFFMARKKVSKLINKIQPDVIIATHSINISVISDLKKNGLDIPFILVVTDFKAHYLYVDSYVDAYITGSNYTKKSLVDRGINPNKIYPIGIPISSKFYTEVTSANDLKDDEYFNLLLMGGSLGLTTIFTVLKELLKNPHKLRITVVCGKNDNLKNRLISYCNENKFENKKLHILGFTKDISYLMDYSDILISKPGGLTVTESIVKNIPLIIPFAIPGQENENIDFLTSEGYSIYVKDLSKLNDKINYLINNPNELSKIKLKLKELSSTYSLTKIVDIADDLISKK >NZ_CP043998|432223:485474|482656_483394_+|WP_023974854.1|DBSCAN-SWA MDKNLKEKLKNLFRKEGFYIALFLCLCIVVTVGTISYKMLNSKNQVNKTEDVNKDLTMNSGNEGNSNNSVQNAERVENAQNNSNKDNADKTKIEKAASVSTNNTVTFVNPIDGVESRKYTYPAPVKMEEGVFRTIRGINLQSTVGSEVKAAADGVVEVAENTGVEEGVVVEIKHANGLKTRYGNLDANLSVKKGDKVKANQVIAKVGDSAKVFSKDVFGEFLNLQVINANGEQVNPEKYFNLKSK >NZ_CP043998|432223:485474|471629_471995_+|WP_023974850.1|DBSCAN-SWA MNKEVNKLLLQTIKYDLGSGLLISLIIVLISTFINAGIYMIGMCVSLINFLASGYIVGKFLDKNRAWIIIPTYFIRMAFIIATIFPFLGNMEYVIYYMIGFVSHYVLLIVFRIKENRKGSV >NZ_CP043998|432223:485474|476453_477845_+|WP_011967767.1|DBSCAN-SWA MPGKMGKVVQVIGPVIDIKFDSDSLPDLYNAIVIKAGDYELVAEVEQHVGDDIVRTIAMSATEGLKRGMDAVDTGAPISVPVGEEVLGRLFNVLGKPIDKCGDIEVKQEYPIHRPAPSFKDQSVEPEMFETGIKVVDLLAPYQRGGKIGLFGGAGVGKTVLIQELINNIAKQHGGLSVFTGVGERSREGNDLYHEMRESGVIDKTALVFGQMNEPPGARMRVALTGLTMAEYFRDKGQDVLLFIDNIFRYTQAGSEVSALLGRTPSAVGYQPTLATEMGALQERITSTVNGSITSVQAVYVPADDLTDPAPATTFAHLDATTVLSRGIAELGIYPAVDPLESTSRILDPRIVGEEHYKVAADVKHVLEKYKQLQDIIAILGVDELGDEDKAVVARARRIQRFLSQPFTVGEQFTGLKGKYVPVKETVRGFKEILEGKYDELPESAFLFAGTIDDVIEKAKKLG >NZ_CP043998|432223:485474|439845_440652_+|WP_039771785.1|coat|DBSCAN-SWA MDELLINQYLNKKGIAIMGQGFSYDKNMQRNDIVSQVDLIIEFHKLLLGGNLTGLSKIKSTIGREVESYKVQIRKLQKNYSYVSSKTCTNEIENIILSNGKIMLEKANKAINYIYEHDYFGVIRRSMNREEICLGKVDKSNLRKNNEKIEVCTIKSMTYNLVEEDLYNYIKKLQRKDINIDEEELIKLFVHGSHLSFNSFDYLRGLCSYPKDFLKFWERYRDSRKDNTREIYNIQNEECKGSRKARNDEQLLNGLKKSLKYESKNFII >NZ_CP043998|432223:485474|438827_439844_+|WP_039771784.1|coat|DBSCAN-SWA MENNKEILKIKGYIEENYNLDVEDIEKVKNSYKVITKDERYCLKVVKYEFSHFYFILSAMKHLQRNGFGDIPEFIMNREKKEYGNINGKYAYLTKWIPSRVSNYDNPIELSMVSNELAKLHECSKGFTLKKDMKPRIGWFSWIDVFETRRREILDFKNRISQKAYKSNFDLLYLDNMEKELNRAEKSIVGLQKNNYVKVMEKEVLSRGFCHHDYAHHNILIDNKKNINIIDFDYCILDSHLHDVSSLLIRSMKDGKWESDKCNLILNAYSERIEIRKEELPIIREFIRFPQAFWQIGLQVYWEQQPWGEEFFINKLEKYLNDCEFREKFIDSYFSGGN >NZ_CP043998|432223:485474|464470_465058_+|WP_011967754.1|DBSCAN-SWA MDIYKAVKKERLHLKIFLITMVIIAFFLPTVLIITGLTTIFYISYVIFIEFLIVIAIIIKMNAYIVEYRCLNNRLIFKVGISIKEYLIICDKVVLVHTNKSDYDLEIVLITNVVFKNKGLRPVDDGFLRRYPQIIEDYNSIKQLNSQKEYYFQVIKRGGLKKYLLLDSIYRNCVKAIYTDESIQNIKISRGQLIV >NZ_CP043998|432223:485474|452924_453767_+|WP_023974839.1|DBSCAN-SWA MKIKAYAKINIALDIVGKREDGYHILRMIMQTIDLYDIIEIEKTESEIRLNCNKHYVPTDERNLAYKAAKIFKETYSISQGVDIKLTKNIPVSAGLAGGSTDAAGVLKLMNKMFNVNASDEELKSIGLKLGADVPYCIKGGTALCEGIGEKITQLKSFKDKIIVLVKPPFGVSTKEVYKCFDLSKVVFHPKIDSLIENMNNDDVYFVANNMKNLLENVTLRKHRVIANIKEEMKSIGSIGTMMSGSGPTVFALFDDMLKAQLCYDEMKKKYKDVFITRTI >NZ_CP043998|432223:485474|450133_452776_+|WP_039771792.1|DBSCAN-SWA MKIIQKRIYEGQNIYSHKKCIRIDMDLEGYSEIASKDIPNFNFNLVNIIPELKNHRCGIDEEGGFVKRLKEGTYLAHICEHTMIAMQNNLGIDVAYGKAREIKGDMYYIIVQYEYKNTILEVANLAIDLMNSLIAQNPINFDGRMKIIQNILQNEQMGATTKAICDAAREYKLPVMQLGDSTIYQIGYGKAGRIIEASIGNKTSCVGVDISCDKLLTKQLLQTQNIPVADGSKVLNLIGLLQEAERIGYPVVLKPQCGNKGQGVILNIKDQKQLVDAYINLRKNQKDIILEKYFEGSDYRVCVVNYKVVAVSLRIAPYVIGNGKDSLRMLIEVLNKDPLRGEDHEKALTKIKIDAELISCLSKRGLELNYIPEEGEKILLRENANLSTGGIAIDCTDEICEENIESCINAAKTLGLDICGVDICAKDISVPLKDNNGVVLEINAAPGIRMHHFPSKGKRRNVGKAILETLYDEEPKNIPVISITGTNGKTTTTRLISHVLRKMGSNVGMTSTDGVYLNEKCIHKGDDSGFNSARSILMNKDVDVAVLETARGGLVKRGLAYELADVAIITNITNDHLGLDGINSIEELSFTKALVGEAVKDDGFVVVNADDKYSKTVINRFTAEKIYFAKDKENPLIQENIANGKIAVFVEDDKICVINNKKKYEIVATRELPISYNGTLEYNIENAMAACAGLVGLEVDYCMISKGFMDFGLKNEDNSGRFNMYNYLNRRVILDYAHNIEGYRAIISSLRKIKGDNDLIGVIGIPGDRKDDIGYAIGEICANNFDKIVIKEDKDKRGRKSGEIADILEKSILKTNKNANLKICLDEVQALKYAIDMSNKGDMIVVFYEKLDSLLEFINEEPNKQLDTFDEEYKQYSNTL >NZ_CP043998|432223:485474|479294_480557_+|WP_023974853.1|DBSCAN-SWA MEKIVVKGVKELRGEVNISCAKNSILPIIAATILCPEPIIIDNAPRLEDVEVICKLLSELNCDVNISNVNDRLTINTKNIVEMDANEELMRKMRASFLIMGPMLARFGYCKLSLPGGCNIGSRPIDLHLKGFKLLGAEVVIGHGFVEVRAKKIVGNRIYLDFPSVGATENIMMASVFAEGTTIIENAAEEPEIWDLAQFLNKMGAKIEGAGFGKITITGVKNLKGISYTPIYDRIEAGTFMIAAAITNSKIKINGVNEEHLRPVIEKLRECGIGFSNYKDHSIVVDGRGSKRPLDIKTLPYPGFPTDMQAQMMSLLSIVEGVSVITETVFENRFMHVAELQRMGANIKIDGRTAIIEGNPRLTGCEVKATDLRAGAAMILSGLVADGETVVNDVYHIDRGYVRIEEKFRNLGAEIYRINM >NZ_CP043998|432223:485474|460417_460627_-|WP_023974844.1|DBSCAN-SWA MREGIHPEYHHNTVVKCACGNTFTTGSVKEELKVEICSKCHPFFTGKQKIVDVGGRVDKFNKRFNLDNK >NZ_CP043998|432223:485474|472731_472947_+|WP_017209887.1|DBSCAN-SWA MSLGVLAAGIAVLSGIGAGVGIGIAAGKAVEAVGRQPEASGRVMTFFILGAALCETTAIYGLVMAFMLMNR >NZ_CP043998|432223:485474|455694_457305_+|WP_039773938.1|DBSCAN-SWA MSTKYVFVTGGVVSALGKGITAASLGRLLKNRGVKISIQKFDPYLNVDPGTMSPYQHGEVFVTDDGAETDLDLGHYERFIDESLTQNSNVTTGKIYSSVIEKERRGEYLGGTVQVIPHITNAIKDKVYQVAKDRDVDVVITEIGGTVGDIESQPFLESIRQIKSEVGAENVCYIHVTLVPYLGKAGELKTKPTQHSVKELRMIGIQPDIIVCRTEKELSDDVKAKIGLFCNIDGRSVIQNLDAENLYEVPLMLHSEGLDNLVCEKLHLGCKDIDNSEWIQMVQKIKNLKNNVKIALVGKYVELHDAYISVVEALSHGGYANNTNVEIKWINAENIENSNAQELLKDVDGILVPGGFGDRGIEGKIAAIKWARENKKPFLGICLGMQCAVIEYARSVLGYEDANSSEINPGTNYPVIDLMPDQKDIENLGGTMRLGLYPCRLAENTNSYEVYKNEIIKERHRHRYEFNNEFRKQITEAGMKIAGTSPDERLVEIVEVEDHPWYVAVQFHPELKSRPNKPHKLFVGFIKAALEENKSK >NZ_CP043998|432223:485474|473481_474021_+|WP_011967764.1|DBSCAN-SWA MQEYLEKRYALALYEIAEKNNKVDEYLRDLTDICDIFDENKEFYEVINHPKINTAKKKQLFTDLFKGKIDEELLSFMMILIEKDRILQLREILDQMEKIDLERRNTIRGIVKTVVPLLDEELEQLKAIFEKKYEKNILFDTKIDKSLLGGVYVKVGNDIIDGTIKSKVEEMKELMLKKE >NZ_CP043998|432223:485474|475587_476439_+|WP_011967766.1|DBSCAN-SWA MGAAGLLEIKKRIKSVENTRKITNAMGLVATSKLRKTKNELAVNNKFIDITEPVVRNLATTAGEEGSNVYFEGNDSQNKLYVVITSDSGLCGGFNSSVVSQLVSQIKDKKDTAKIVLVGSKGLGYLKRIKIEPVGEYVGIEDVPTVSEAKEIFDKALEMYLNGDVSEVNIVYSDFISSVKQETKSVKILPISKSEGTTGSFLIEPDLDIVLEDALNIYLKGKIRSILLSSKCSEQSTRMTAMDGATKNADDLLDKLKLKFNRIRQGAITQEISEIVGGAAAQN >NZ_CP043998|432223:485474|484937_485474_-|WP_023974855.1|protease|DBSCAN-SWA MSKPDIKLDPKFYYNLALEVKKFISKDTIIVCIGTDKCIGDCLGPLVGSILTENFFPLPVYGTLSSPIHALNIDERLNEIYSNHPNASIIGVDACLGDEDDIGEIRIRDYAIHPGKGVGKELPEVGIASVIGIVDSSDNAEFFFSRSIRLSFIMDMAKIISKIFIDAYSLSHWKYPKI >NZ_CP043998|432223:485474|444473_445334_+|WP_011967737.1|DBSCAN-SWA MEIGDIVVRKSYNKDITFKIIDIKDSGGKYNIILKGINIRIIADASLDDLEMAEEDTGSQDKILNTRVNEAIKKAMILRGDLRDKVEKSPKIKTKNELMFGRPGKILHVDGDSEYMETCLKVYKQLSLDAVGRAIAEKDQPEVIVDLVKEIKPDIVVLTGHDSVLREPRDYLNLDNYRNSRYYLESVKNLRNYNSSYDELVIFAGACQSCYERILDVGANFASSPNRVLIHCLDPVFVCEKIAYTRIDKVVSITDVIENTITGIKGVGGLQTRGKYREGYPKSPYI >NZ_CP043998|432223:485474|466213_466663_+|WP_023974847.1|DBSCAN-SWA MKIAIGCDHGGFELKNEIIKFLESEKHEIKDFGTYSTGSCDYPDIALPVAEAVAAKEYEFGILICGTGIGIGIAANKVPGIRAALCSDTFSAHATREHNNANILTMGQRVVGAGLALDIVKTFISAKFEGDRHQKRIDKISDIEKKYTH >NZ_CP043998|432223:485474|469728_470910_+|WP_023974849.1|DBSCAN-SWA MREVVIVSAVRTALGSFGGALKDVSAVDLGALVIKEAVNRAGVKPELIEEVIMGNVIQAGLGQNTARQSTIKAGLPQEVSAMTINKVCGSGLRAVSLAAQMIKAGDADVVVAGGMENMSAAPYALDKARWGQRMGDGKLVDTMIKDALWDAFNNYHMGVTAENIAKQWGLTREEQDAFSASSQQKAEAAIKSGRFKDEIVPVVIPQRKGEPKVFDTDEFPRFGTTAETLAKLKPAFIKDGTVTAGNASGINDGAAAFVVMSAEKAEELGLKPMAKILSYGSKGLDPAIMGYGPFHATKKALEKANLTVEDLDLIEANEAFAAQSLAVAKDLKFDMSKVNVNGGAIALGHPVGASGARILVTLLHEMEKRDAKKGLATLCIGGGMGTALIVERI >NZ_CP043998|432223:485474|457613_459056_+|WP_039772945.1|DBSCAN-SWA MTKKEYESMTLTKLKDIAKDLGVKNISKYKKNELIEEILKVPSNFIEKNGVILRENIAPKNVEETRSVMPRSNNTESNKESNDSEVKSRTNEIGNVEKKENLKEMINESNVANGILEILENNSFGFLRCKNYLTSSEDVYVSPSQIRRFNLRTGDEVEGKVREAKETEKFKALLFVQKVNGEHPEKAIGRKSFETLTPIYPKERLKLETSDSNDLSSRLMDIICPIGKGQRGIIVAPPKAGKTTLLKKIAQNISKNYPDVKLIVLLIDERPEEVTDMKRSINGDVVYSTFDEEPQNHAKVAQMVLERAKRMVEQGKDVVILMDSITRLSRAYNLTITPTGRTLSGGLDPGALIMPKKFFGAARKIEEGGSLTILATALIETGSRMDDMIFEEFKGTGNMEVHLDRRLQERRIFPAIDIYKSGTRKEDLILSKEELEVAFSIRKKMYRDGNSDDITENLINMLSKTGNNKEFIDVFQKKVQ >NZ_CP043998|432223:485474|454699_455116_+|WP_011967745.1|DBSCAN-SWA MKKKAIITVDSYVLDNEEDLVGVVTPGDFHEIEDGFKVEYEETKLSGMEGTKTTIIIRNDSFDLIREGTTETKMEFRNNHRTISLYKTPYGVMDLQIDTKKLNIDISKEGGTITAMYILEIGGQPALKTNLTIGVKLN >NZ_CP043998|432223:485474|483835_484870_+|WP_011967774.1|DBSCAN-SWA MCFWRTGIDLAIDLGTATVLVYVKGKGVILKEPSVVAINKNNNKLLAIGEEARKMIGRTPGNIVAVRPLRDGVISDYDITQKMLKEFIKKACGKRSISAPKVIVCVPSQATEVEKRAVIDAAMNSGAKTVHLIEEPLAAAIGAGLDITKPNGCMVVDIGGGTCDIAVISLGGVVERESIKVAGDKFDEAIIKYVRNEYKLMIGEKTAEDLKINIGSAFKNSRNLTCMMKGRNLITGLPDEIEITTEEIRNAIKEPVEIIVDTVKKVLERTPPELASDIIERGILMTGGGALIHGLDKLIEFKTGVVATIAENSVECVANGTGKVLNYIDKLDSQVNSQQIVLIE |
51 | Clostridium_phage(16.67%) | coat,protease,tRNA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
1052501 : 1058123
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NZ_CP043998|1052501:1058123|DBSCAN-SWA GATTAATGATGATTTTCAACTTATATTACCATTAAATCTAGAAAATTTAATACCATCAGATGATTCAGTCCGCTTGCTAAGCCATGTATTGGAGGGATTAGATTACACGAAGTTGTATAAGGCGTACTCTTCCGTTGGAAGAAAACCGGCAGTGGAACCTAAAATTATGTTCAAAATAATATCATATGCTTATTCTCAAAATATTTATTCAAGCAGGAAAATCGAAAAAGCATGCAAAAGAGATATAAATTTTAAGTGGTTACTTCAATGTTATAAGGCACCGGATCATGCTACAATCAGTAGATTTCGTAAAGACTATATTTCAAATGAGGTAATTGAAGATTTATTTTATCAACAAGTTAATTATTTAGCAAATCAAAATGAAATACTATTTGAAAATGCATTTATTGATGGTACTAAAATCGAAGCGAATGCTAATCGTTATACATTTGTTTGGAAAAAAACTATTTTAAAAAATGAAGAAAAAATGTTTGATAAAATTCTTGTTCTTTTAGAAAATATTAACCTTGGAGAATTAAAAAAATTTACTGTTCAGAAAGAAACATTAATAGATGATATTGATAAAATTCTTCAATGGCTTGAATATGAAAAAAAGAAAAGAAACATAGAGTTTGTTCATGGAATTGGTAAAAGAAAAACCAAAATTCAAAAGTGGACAGAGCAACTATCTGAATATAAAGAGAGAGAAGAAAAATATAATTTGAGTAAAAAAATATTTTCAAAAAGAAATAGTTATTCTAAAACTGATCCAGACGCAACTTTCATGCATATGAAAGATGATCATATGAGAAATAGTCAATTAAAACCTGCATATAATGTGCAAATCGCAGTTGAAAGTGAATACGTAACCGGCGTCGGAATATTTGATGATAGAAATGATATAGCAACATTAATACCTATGCTTAATAATATGAAAGAAAAAATTGGTCGTAAATATCTTAATATAATTGCAGACTCAGGTTATGAAAGCGAAGAAAACTATTTATTCTTAGAATCAAATAAGCAAACTCCTTATATAAAACCACAAACTTATGAGAAGTGGAAAAAAAGAAGTTTTAAAAATGATATAAGTAAGCGCGAAAATATGAAGTATGATGCTGAATCGGATTTTTATATTTGTCATAACAATAGAAAATTAATACCTACCTCTATTATTTATAGAAAATCCGCAAGTGGATACAAATCAGAAGTAACTGTGTATGAATGCGAAAACTGTGATAATTGCGATTACAAAGTAAAATGCACAAAAGCAAAAGGAAATAGAAAAATGCAGGTTTCAAAAACTTTTGTGGAAAAGCGTGAAATATCCTATAAAAATATTACAACTGAATTTGGAACTAAATTAAGAATGAATAGATCTATTCAGGTCGAAGGAGCATTTGGAGTTCTAAAAAGTGATTATGAATTCAATAGATTTTTAACACGTGGAAAAAATAGCGTTCAAACTGAATTTATTTTGCTTTGTTTTGGTTATAATATTAACAAATTACATTCAAAAATACAAAATGAAAAAACTCAGAATCATCTTCATGAATTGAAACCTACTGCCTAATTATGGAATAAATTAACTAGGCTTATTTTAGTGTGCTTAAAAATCAGAATTCTTTAAATAATTAATATTGTATTTCAAATATTTGGAGATTTGCTGGCTTAAACCGAAAAGGAGCATCGCTCCTGATTAAAATTTAATCATTTTGCGACACTCCCTTTTTTATTATTTTTGAAAGGAAATAACAGAACTTGGATTCTAGGTGTAAGTTTTAAACACAAGATTTCTGCAAATAATTATTGACATCTTAAATTTAATAAAATTTGATAATTTTTTAAAATATATTTCTTAAGATTGTCTAAATTATCTTTGATAAAATTAGTTTTAGATAGAATCTTAGTCTTGTTGTTTTTATAAATTATTTTATATTACGGATTCCTTTTTTAAAAGCATCAATTAATATTTATTTTTTATCTTTATATTTTTGTTTTACATATTCAATAAAATTATTAATCTCATCTTTAGCTTCCTTTGGAAGTTCATCATAATCAGTATCACTATTAAGTGCAATAGTAATATTTGAATCATCAGTATAATTTCTTACATCGGTTTTACCAAGGAGGTAATCTAAAGAAACGTTAAAATAATTAGATAATTTAATCATTATGTCTGTATCAGGAACTCGTTTTCCCTGCTCATAAAAACCGTATGCACTTGTAGTTATATTTAGAAAATTTGCAACATCCTTTTGTACAACGCCTTTTTCAGAACGTAATTCCCTTAATCTTTGTGCAAACATTTTATAATACCTCCATCTAGATTCTTACAATAATTATACAACCAAAAGTTGTATTAATAAACTATACCAACAAACAGTTGTAAAAAAGTGTTGACATCAACTAAATGTTGTAGTGATCTTAATACAACGAAGTGTTGGGAAAGGAGAATAGTATGAAAAATAAGTTGTTGTTATTAAGAAATAAAAATAGTCTAACTCAACAAGATGTAGCTAAAGCAATAAAGAAGACTACAAGCTATTATGGCATGCTGGAGGTTGGTAAACGAAATCCGTCAATAGAAGTAGCTTATGCACTAGCCAACTTTTATAAAGTAACAATAGAGGAACTTTTTTTTAATCAGCAATACAACAAAACGTTGGTGTAGACGCAATTTTATTTTAATATAAAAGATGGAGGAAAGAAATGGAACAATACTACAGAAATATTTACCAAATAGCGAGAGAGTGTACAAGCTTAACTCAAGAAAAGTCATCAGAACTACTAGATATATCTGTTGATAGTTTAAGAGCATATGAAGGAGGGAAGAGAACACCACCAGAAAACATAGTAATTGATATGGCTAAGATATATAATCGTCCATATTTAATTTTGCAGCATTATCAAAATACTTTGATAGGAAAAGAACTTTTTCCAAAGGTAGAAGTTAAACATTTAGCTGAAGCAGTATTAACATTTTTAGATGAGCTTGAAGATCTAGAGAACATTAAGAAATTAATGATTAAGATTTCACGTGATGGTCAAGTTGATGAAGATGAAAAAGAAGATTGGCAAATGATAATGAAAACACTTGATGAAATGGTATGTGCAATTATAACTATAAAGTTTGCTAGGTAACACATTGTGATAAGAAAACATATTATGAAATGATTTATATTTACGGGGGAATGGATATGAAAGGCGATGAATTAAAGGTAACCATTATAGGATTAGAAGATAAAAAAGGCTTTGATGAGCTTGTGGCAGAGTTACAAGTTGCTGCTGTTATGAAAATGTGTCCTCCAGAGCTAAGACTTCAGGTTTTAAATAATGCTCTAAAGATATTAAAAGCAAATTAACTGATTTTAAACATATTAAAGGAGAAATTCAGAAGATGAATATAATAGAAATCTTATGGAAAATAGGCTATGACGTTATTAAAAGTGATTCTGAAAAATGTGAATATACAATAATGTATGCTCCAGAAAGAAAAAGACGTATGTGGAAGCAGATAAAAGATGGAGCTATTACAGTTGAAAATGAGCTGCTTAATGATATCTATACAGTAACTGTTGGAGAAATTTGTTTTAATCAATGTGGAGATTTATATGTTGAATTTACTGATGTGAATACAAAAAAATGTATTGATTTTTATGAACATAAAAACATGAAAGAAGATGAATTTTATAAATAAAAAAAGAACCTTATATAAAGGTTCAATCAATGTTTGAGATACGGACGCCCATCCGTATCTCCATTATAAATTGAAATGGAGGAAAAGTAAATGGTTTTAGAATTCTTAAATGATTTAAAATCAAAAGTCAGCAAAGAAGAGTTTAATATTATTTTTGCTATGACAAGAGAAGACATAAGGTTTAATAGGACAAGTTTTAATAAAAAGACTACACCTGAAGAATTTATTGAAATATGTAAAAGGTGCTGTGTTGCTTTAAGTAGATGCAGCTAAGTTTTTTAGTTAATGTAAATTACAAATAATGAAAGTGAGGCGAGACTGTGGAAAGAGATTTTAAAGGCATATGGATACCAAAAGAAATTTGGCTGAATACTCACTTAACTATGAATGAAAAATTATTTTTAGTTGAAATAGATAGCTTAGACAATGAAAAGGGATGTTTTGCGTCTAATGACTATTTTGCTGAGTTTTTTGGCTTATCTAAAAACAGGTGTAGTGAAATAATAAAATCTTTAGAGAAGAAAGGCTTTTTAAGTGTTTCTTATAAATACAAAGCAGGCACAAAAGCAATAGAAAGTAGAATAATTAAGCTACTCGAATTATCGATAGGGGGTATTCGGAATATCGACTGCGGTGTTCGAAATATCGATAGAGGTACTCGAGATATCGACAGAGGGTATTCGGAAAACTGTGAAGATAATAATACAATACTTAATAATACAATTAATAATATAAATACTATATCTAAAGATATAGTTAGTAGCACTAAAGTGCAACCCATAATAGATAAGTGGAATGAACTTGGACTCCAAAAGCTCATATCCATAAATAAAGGCACTAACAGATATAAATTACTTCAAGCAAGACTTAAAGAATATGGACAAGATAAAATACTTCAAGCTATAGAAAATATAAAATACAGCAGTTTCTTAAAAGGTCAAAATAATAAGAACTGGACAGTAACCTTTGATTGGTTAGTGAAGCCAAATAATTTTATTAAGATCTTAGAAGGCAATTACGTAGATAAAGAAAATCCAGTTAAGACAGCTAAGAATAAAGAGGTGCAGCCACTCAGATTTAATAATTTCGAGCCAAGAAACTATGACTATGACAATTTAGAAAAGAGGCTCCTTGGGTGGGATAACGATGATTAAAAATAAAATGGATGAAGTTTTAGATGGCCAAATAAGCATATTTGATTTAGTGCTTAATGAAGTTAAAGAGCCTAAAAAAGAGTATGCACCAATAGTCAAAAGTCATAAAGATAAATTTGCAGAAATTATTAATCTATATAAACCAAATGCAGCAAGAATAGTTAAAAGAATATATGGAGCATTGCTTGTGGAGCTTGAAGAAAAGACATTGTATTTTAACAGTGATGGAGTAAAAGAATTGGAGTTGAAAAAAGATATAGATCTGCTTCCAGCTGATGAAATTTTATTTGTAAATCAAGATAGAAATTTAAATGATATGCAGCTTAAAAAACTTAAAGACATGCACGTTACAGAATACATTAAACGTAAAGGTGATGCTAATATAATAATTCAAAAGCAAGATAAGGCAATTGTTATAAATCCTAAAGGATGGATTCTAGAATACTTGCAAAAACCCAAATACCATGAGGACGAAGTATATAAAATTGAGGTTCCTAAAGAAAATATAGGCTTGCATATCTTAAGTGCAGAAACAGATATTGATGAGCAAAGCACTATTAAACCATCAACATTTGCTCATAACCTTATAGATTTTGAGGAAAATGATCTGGTAGAAATAAAGTATAAAGGCAAAAGGCATATAGGCAAGGTAGTAAGAATTTATAACAATGGTGAAACCTTAAATGTTAAATGGGATGGTAAGCAGACAGCTTTTTATTATAAAGCAGTAAAGAAGCTTAAAGAAATAAATATGAAAAATGCAATTTAA
Protein sequences of DBSCAN-SWA_2 >NZ_CP043998|1052501:1058123|1055700_1055865_+|WP_167514407.1|DBSCAN-SWA MKGDELKVTIIGLEDKKGFDELVAELQVAAVMKMCPPELRLQVLNNALKILKAN >NZ_CP043998|1052501:1058123|1055900_1056200_+|WP_084670618.1|DBSCAN-SWA MNIIEILWKIGYDVIKSDSEKCEYTIMYAPERKRRMWKQIKDGAITVENELLNDIYTVTVGEICFNQCGDLYVEFTDVNTKKCIDFYEHKNMKEDEFYK >NZ_CP043998|1052501:1058123|1056290_1056473_+|WP_011968234.1|DBSCAN-SWA MVLEFLNDLKSKVSKEEFNIIFAMTREDIRFNRTSFNKKTTPEEFIEICKRCCVALSRCS >NZ_CP043998|1052501:1058123|1055212_1055644_+|WP_039773923.1|DBSCAN-SWA MEQYYRNIYQIARECTSLTQEKSSELLDISVDSLRAYEGGKRTPPENIVIDMAKIYNRPYLILQHYQNTLIGKELFPKVEVKHLAEAVLTFLDELEDLENIKKLMIKISRDGQVDEDEKEDWQMIMKTLDEMVCAIITIKFAR >NZ_CP043998|1052501:1058123|1054961_1055174_+|WP_039773924.1|DBSCAN-SWA MKNKLLLLRNKNSLTQQDVAKAIKKTTSYYGMLEVGKRNPSIEVAYALANFYKVTIEELFFNQQYNKTLV >NZ_CP043998|1052501:1058123|1052501_1054073_+|WP_154862475.1|transposase|DBSCAN-SWA MNDDFQLILPLNLENLIPSDDSVRLLSHVLEGLDYTKLYKAYSSVGRKPAVEPKIMFKIISYAYSQNIYSSRKIEKACKRDINFKWLLQCYKAPDHATISRFRKDYISNEVIEDLFYQQVNYLANQNEILFENAFIDGTKIEANANRYTFVWKKTILKNEEKMFDKILVLLENINLGELKKFTVQKETLIDDIDKILQWLEYEKKKRNIEFVHGIGKRKTKIQKWTEQLSEYKEREEKYNLSKKIFSKRNSYSKTDPDATFMHMKDDHMRNSQLKPAYNVQIAVESEYVTGVGIFDDRNDIATLIPMLNNMKEKIGRKYLNIIADSGYESEENYLFLESNKQTPYIKPQTYEKWKKRSFKNDISKRENMKYDAESDFYICHNNRKLIPTSIIYRKSASGYKSEVTVYECENCDNCDYKVKCTKAKGNRKMQVSKTFVEKREISYKNITTEFGTKLRMNRSIQVEGAFGVLKSDYEFNRFLTRGKNSVQTEFILLCFGYNINKLHSKIQNEKTQNHLHELKPTA >NZ_CP043998|1052501:1058123|1054473_1054809_-|WP_039773926.1|DBSCAN-SWA MFAQRLRELRSEKGVVQKDVANFLNITTSAYGFYEQGKRVPDTDIMIKLSNYFNVSLDYLLGKTDVRNYTDDSNITIALNSDTDYDELPKEAKDEINNFIEYVKQKYKDKK >NZ_CP043998|1052501:1058123|1056520_1057354_+|WP_039773922.1|DBSCAN-SWA MERDFKGIWIPKEIWLNTHLTMNEKLFLVEIDSLDNEKGCFASNDYFAEFFGLSKNRCSEIIKSLEKKGFLSVSYKYKAGTKAIESRIIKLLELSIGGIRNIDCGVRNIDRGTRDIDRGYSENCEDNNTILNNTINNINTISKDIVSSTKVQPIIDKWNELGLQKLISINKGTNRYKLLQARLKEYGQDKILQAIENIKYSSFLKGQNNKNWTVTFDWLVKPNNFIKILEGNYVDKENPVKTAKNKEVQPLRFNNFEPRNYDYDNLEKRLLGWDNDD >NZ_CP043998|1052501:1058123|1057346_1058123_+|WP_039773921.1|DBSCAN-SWA MIKNKMDEVLDGQISIFDLVLNEVKEPKKEYAPIVKSHKDKFAEIINLYKPNAARIVKRIYGALLVELEEKTLYFNSDGVKELELKKDIDLLPADEILFVNQDRNLNDMQLKKLKDMHVTEYIKRKGDANIIIQKQDKAIVINPKGWILEYLQKPKYHEDEVYKIEVPKENIGLHILSAETDIDEQSTIKPSTFAHNLIDFEENDLVEIKYKGKRHIGKVVRIYNNGETLNVKWDGKQTAFYYKAVKKLKEINMKNAI |
9 | Clostridium_phage(88.89%) | transposase | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1063839 : 1072426
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NZ_CP043998|1063839:1072426|DBSCAN-SWA TTTATGCCGATAAGGTCTGATTTCGATATTCAATTGGAGTCAGACCTTTTAAATTTGTCTGTAACCTTTTTGTATTATAAAATACTATGTAGTCATCAATTGATTGTCTCAATTCTTCATATGTATAAAATTTTTGCAAATAATACATCTCACATTTTAGAATTCTCCAAAAACCTTCCATTGGTCCGTTGTCGATACACCTACTGACACGTGATATGCTTTGAGTTGCTTTGATTTTATCAAGTTTAGCTTTGAAAGTTCTATTAGTATAATCGATTAAGAAAAAGGGATTGCTCCCTTTCCCTAATCTAAGAACCGTCGTGAGAGTTTCCCACTCATACGGCTCAAGCATTTCTTCACCCTTTCAGGCGGCAACAAATATATGCAGTTTTATCTTTCTTTTATCAAAATAGTCCTTGTCTAAGAAAGGTGTTTTTGTAACCTGCTTTGGATGTCTGACTATTTTAATCCGTCTCAAATTAATTAGACTGTACTCATCCGTCTTGAAAAGCCATCTTTTCCAACCTTTTTCCTGCCAGTATTTATTTAATTTCCACCATTTGTTCTTATTGGGGTGTCTATGTTTTGCCCATTGCTGTAGTAACTGATAAAGGGTGTTGTTAATATTTGAAAAGGCTTTGCTAGCAACAACATGTTTGTGGTAATTTGTCCAACCTCTTACGACTTGGTTAAGCCTTCTTATTAGGTCAGATTGGGTGCTAGCTTTACCCTCCTTAAGGATTATTGTTGAACATTTCCTAATTATGTTTTTAATTGAATTTTTAGAAGGTTTAACTATTAATTTCCCGCTGTATTTCTTAAATGTCCAGCCAAGAAAGTCAAACCCTTTATCTATATGTGTAATTGCAGTCTTTTCTTCTGATAGTGCTAGACCTCTTGATTGGAGGAATTGACTAACCGTAGTTTTAAGTTCTTCAGCAATTTCTTTTGAGTTTGCAGTAATAACAAAGTCATCAGCATACCGAATCAAGTTCACTTTAGTTTTGGCTCTGTAATGATTTTCTATTTTACCTTTTGAATTTCTATGATATTTATCTTGAATCACTTTTTCGAGTCCATCTAATGTCATATTTGCATATATACTTGAGATTGCACCGCCTTGTGGCGAACCTGTTTCCGTTGGAAACAGCTTTTCTTCATATATATATCCTGATTTTAGGAACTGCTTCATAATAATTTTATCCATTGGTATATTGTTTTGTAACCATTCATGGTTAATATTATCAAAACAACCTTTAATATCACCTTCAAGTATCCATGTTGGAGAACATTTTCTAGCTAATACACAAAATATCTGCTCACAGGCATCTTTTGCACTTCGTCCACGGCGGAATCCAAAGGAAATGGAATCACCTTTTGTTTCTGCAATTGGCTCAAGCGCTAATGCATATAATGTTTGCATTGCTCTATCATACATTGTTGGTATGCCTAATGGACGTTTCTGCTTTTTACCTTTCTTTTCGATATATACTCGTTTTAAAGGTTTTGCTTTATAGTTTTTGTCAGTAAGTGAAAGCACAGCTTTCATCTTCGAGGCAGAGGTAGACCATAGTTTTTTGTCTACTCCAGATGTATTCTTCCCTTTATTTGTTGTTACTTTTCTTACAGCATAAGCCTTAGCTGAAAAAGAGTGGGTTAATAAGTATTGTAATCTTTTGGCTTTATTATTGTCTCCATTTTTTGTTGCCTTAGCGATTCGGGTTTGTAGTCTATTAACATCGAGTTCAACTTGCTTCCAGTCAATTGTTTCCCATTGAAATTCAAGTGATTTCGTGTCTTTTAGTCTCTCGGTTTTAACCGTCGTTGAATTACTAAAATTCATAAATATATAATCCTTTCTTGCTAAGAAATACCATAGGATAAGTCTGCACTCTTTCGAGTTAAGGCAAATTTTGAACCTTTATCTGTTTCCATTACAAAATCAGCATTCGCTTTTTATCCTTTTCTTCCGCCCTCTATGTCTTTTCGCCCCTTGCGGTTAGATACCTCTCACTGAAGGAACATATAGGGTTTACCAAGTTACACGTAATACATAATTGTAAATGCCTTAGGAGTCATCTTTAAACCGGGAGTTCTTTATCCATTCGCATTGGTTTAACAGTTGGCCTTTGCTCAGCTCCTTACCATTTTGGTCAAAGCGTTTCAGCCTATTTCGCTTTCTCCAGCGTAACGATGCCTACAATGATTCACTTTACGTTCTCCATAGCATTCTTACTCTAGCAGTTGTCCCAGTTTAGGCTACTCGAACTTCCACATTGTCTCGTGAGCTTTCTAACCCAAACGTTACCATTCACGCTAGTCACGATAGAGTTACCCCGAATGGATGGGGCAGTCTAACGACAATGTATTACGCGACTTCTTGTCGCACCTGAAATCCCCTGTCACTATGAAACAGTGGATTTGCATTCGGATTAGCACTTACTGCTAAATCAAATATTGCGCTAAGGTAAGCCTTTTTACCATTAAGTAGCTTAAATTCTGTAACATCTGTTAACCATTTTTCATTTGGTCTATTCGCATAAAATTCTCTATTTAATTTGTTTTCAGCAGTAATTTGCGGAGTACTTTGAATATAAGACTTTCTCTTTTTTCTTATAACTGACATTATGTCTATAGATTTCATTAATCTATAAATTCGTTTATGATTATATTGTTTATTCAGAAGTCTATTTATACTCATTGTTATCCGAGGGTATCCATAGATACCATTTACGTCTTCATAAGGCTTAACAATCTCTTTTAATATTATTGAATTCTCTCTATCTAATTCAGTCTCTGAACGGTTGATTAATTTGTAGTAAGATGATCGTGCAGTATTAGATAGATTGCATAAATCAGCTATCGGATATCCATTTTGCTCATGTAATTCTTTTATAGAAATATATTTATATTCTTGGAGTATTCTAGTACCTATCGCTTTCTTTCTACTTCCTTCAATTTTTTTTAAGAAATCAATATCCATCTTTAAACGTGTATTTTCTGCTTCAATAAGTTTTAATTGTGCAGATAATTTATCAGACTCAGTAAGCTCAGCAGCCTCTTTACGCTTACCACGACGGTCAATTAGTTCTTCATATCCATTAGCTTTTTATTTTTTACCCACGTATAAACTTGTTGATAAGAAACCTTAAACTTATCAGCAGTAGCTTGATAATCATCATTATTCGAAATGCAGAATGCAACAATCTCAGCTCTTTCTTCATAATTAGCTTTTCTATCCATAAAAATATACTCCCTCCATACTAACAGTTTTATTATTTTAACTGTCTAATATAAAGGGAGCATATCACAATCAGGTGGAACCGAATTAGAAGATAACATATTAACAAATTTATCTTGTGAAGTTCCAGATTGAAAAATAACAAAGTCAGTAAATATTGAAACAAAAGAAGCAATATTTGAAGATATACCTAAAACAGAATCAGAGATTTTAAAGGAAAAAGTAAATGACTTAGCGCAAGCAAATGCAGAATTAACAAGCATAGTAGCAACTATGGAAACTACTAATGCTTAGTATAATAAATTTGATCTTAAGGAGAGTGTTTAAAATGCAATTTAACAAAAATAGTGGATGCGTAAAAGTATGGGTTACATTAATAGTAGGAGGTACTTACGAATATAAGGATGTTCCTAATCTTTTGAATCTACAAGAACAGGTAAAATTAGTCCTTGTAGATATGGGAGCTATGGAAGATACAACTACAGAAAGTAGTGCATCATAGGAAAATTAGATGTAGTATTAAAAAATTCAGAGCAACATTAGGAGCTTTTAATGGTTCTTTTATGCTGATTGAAAAAGTTAATAAAGTGTAAATTCTTAAATGATTAATATGAGGTATTAAAAACTATGTTACAATATAATTATGATATTAAATCAGGTATAAAATACTATAATTAAATAAGGGAGGAATTTAATGAAGAAGACTAATAGCATTTTAATTCAATTTAGTAGAGTGGTATTTATGATATTAGGTTCAATTTTAGCTGCAATTGGATTAGAGATATTCTTAATACCTAATAGTATAATTGATGGAGGAATAACTGGAATATCAATTATGGCAAGCCGCTTAACCAATGTAGAATTAGGTATATTTATATTTGTACTTAATTTACCATTTGTAATTATTGGATATAAACAGATAGGTAAAACTTTTGCTCTTTCAACTATATTTTCAGTAATGTGTTTTTCAATTGTAGTAACTCTACTTCATCCAGTTCCGGGTATAACACAAGATACACTTTTGGCTACTATATTTGGAGGTATAATACTAGGTGTTGGGGTAGGATTAATTATAAGAAATGGGGGATCGTTAGACGGAACTGAAATTGTCGCTATTCTTTTAGATAAAAGAACTTCATTTTCTATTGGAGAAATAGTTATGTTTTTTAATTTATTTATTTTAGGATCTTCAGGTTTCTTATTTGGATGGGATAGGGCGATGTATTCGCTAATAGCTTATTTTATTGCTTTTAAAACCATAGATATAACAGTTGAAGGTATAAATGAGTCCAAGGCGGTAATTATTGTTTCAGATAAAAACAAAGAAATATCAGAGGCGATAATGTCTAGACTTGGCAGAGGGATTACTTTATTAGATGGAAAAGGCGCTTATAGTGGGAGTGAAACAGAAGTTATATATTTAGTTTTATCTAGACTTGAAGTTGCTAAATTAAAAAATATTGTACATCATTTTGACAAGGGAGCATTAATTACAATTACAAGTGTTGAAGGAACTGGTAAAAAGTATGCAAAAAAAGCAATACATTAGAATTTTATAAATATGTATTCTATAATAATAAATTTTACATAAGTACTTACAGAAATGTAGGTGCTTTTATTTTATGAAAATAACTAGTAAAAAGAGGTGTAATATGAATGAAGAATTAGTAAAAGACAAAATTGAAACTCACGAAAGAAGGCTTAATAATCATGGGGATAGGATTGATAAGCTTGAACAAGATGGAAGAGAACTAAAGACGGAGCTTAAAAATCTATGTGAAAATCTTAAAAACTTAACTAGCACGATGAAGTGGTTTATAACCGCAATGGGAGGAGCTTTAATTAGCTTCTTTTTTTATGCAGTTCAAACAGGAATATTTAATAAATAATTGGAGGTATGTAAAATGATAAAACAAATTTTAGGACTAGTAATAAGTATATTAAAAAATAAAACATACATGACAGCAGCTAGAGAGGTATGGAGCATTGTAGATGAGAACTTTAGGATTACAGAAAAAGTTGAAGATAAATTTAGAAGTAAAACTGAAGAATTCGATAAATTATTGCTTGCTAAATTTCCAGAACTAACTAATGAAGATGTTATATATTTTAGGCAAGCAATTGCAGGAAGCGTTAATGTGGGTAAGGAAGCAGTATTAGATAATTCCGTAATTATGAAGGAATTACAAGAATCAAACGCTAAATTACAAGCAGAAAACGCAAGTCTAAAAGATCAATTAAGCAAATTTCAATCGCTTGCAGCAGCAACAGTAAACGCAGATGTGCAGCAAACAGTATAAGCTTAGTTTTTAGGGTAGCCTTTAAGGTTACTCTTATTTTTATATTTAAAATAAGAAAGGAAGATATAAATGAAAGGTATAGATATAAGTAATCATAACGGAAATATAAATTTTAACCAAGTAAAAACAGCAGGAGTAGAGGCTGTTTATATTAAAGCTACAGAAGGAACAACGTTTAAAGATAGCTATTTAGATACAAATTATTCTAACGCACATTACGTAGGATTAAAAACAGGGTTCTATCATTTCTTAGTTGGAACTAGTGAGCCAGAAACTCAGGCTAATAATTTTTATAATGCCATAAAAGATAAAACCAGTGATCTCATTCCAATGCTAGATGTGGAAACTAATTTTGATGGACTAATGGATTATATTTTAAGATTTATTGCTAAATTTAAAGAGCTATCTAATATGCAAATAGGTATTTATACTTATACTAGTTTTATGGATAACTTAGATAATAGAATTGCAGATTATCCATTATGGGAAGCAAACTATAATAATGATCCATGGAGATTAAATTCTAATTTCTTCACTAATAGAGTAGGACACCAATATAGTGAAACAGGATCTTTAAGCGGAATAAATACAGAATGTGATATGAATGAGTTTAATGATGGAATATTAAATAAAACTACTGGATATGTTGTTACAAACTATTTACCTAATGGCTATCAAGGAGATAATAGTTTTAATGGTGTTGATGCTGATTATGTGCTCCAATATTTTAAAGGAGTTAGATGTTATTTTAGGGGAAACGAAAAAGGGGTATGGATTGAAACTCAAAATCTATCTATGAGCAAATGTTTAGAGTTAAAAGAAACTTTGGGAAGCTGGTTTTATGATATAAAGTAATATGGTATAATGATTATTACTAAATTGCATATACTCTGTTTAGTAAAGGTAGACTAGGTAGAATACTTAGTCTACCTTTTTTGCTTTAATATAATAATTCTTATAAATCAGATGAAAATAGTCTTGTATAATTCATGAAATTATGATATTATAATGTTACACACAAAGCTAACAGCGATAGTAGATAGCGTTAGACTCCCAAGATAATTACAAGATTCTTTTTTAAGCATTAAGTCTTGTAGGGTAGTAAAGAGAAATCTTTATTACCCTTATTTTTTTGCGCAAAAAAGAGATAGCAAAAAATATTAGGAGAATAATGATCCAAGCTATCTCTTTATTTATTAAAAATAGGAAATCGTATCTTAATTTTTAACACTATTAAGATAAAATATACATAAAGTTATAAAAATATATTCCAATAAAATAATTGATTAACACGATTTTAAGAGAATAAATCTTAATTTTAAGTATTCAAATAACTTTTCATCTTTTCAAATACACTTCGAGTAGGTATATAATTTTGATAACAATATCTATATAAAGTTCTTTTAGATATATCCAAAGATTTACACAACTTATCCTTATTAATGTGGATATTTTTATTAAGTACGGTGGATAAATATTGATGAAAGTTATCCATAGATTCTAAATACGAATCAAAAAAATACTTACTATTAATATTGAAATAACTAGCTAGTTTTATTGATTGCTCTTTTGTGGGGAATAACTCGCCACGTTCATATTTTGATATAATCGATTTGCTAATACCTATAATTAATGACAATTCTTTTTGTGTTAAATCATTTAACTTTCTTAATCTAACCAAATTTTCAGCAACCGTATTTGCTGGAAGATCTTTAAACTCATCTTTTAAATCAATTCTCAAAATACAGTTTTCTAAAATCGCTTTTTCATGTACCGAGCATTTAAAGGTGGTACAGGTGATTATGTGGCTCTCTTTGAACCTACAGCTTCTGCAATTCAGAAAGAAGGAACTGGATATATTCTTGCATCTGTTGGTGAAGAATCAGGATTAATTCCTTATACTTGTTATTTTACAACAAAATCTTATATGGATAAAAATCCACAAGTAATACAAGGGTTTACAAATGCTATCTATAAAGGTCAACAGTGGTTTTTTAGTCACAGTACAGAGGAAGTTGCAGATAGTATAATTGATTATTTCCCAGGTACAGATAAAGATACAATTATGACAGTTATAGATAACTATAAAAAGATTGATGCTATAGCTCATACACCAGAAATTAAAGAAGAAAATTTAAATAGACTTATGGATATAATTACTGATTATGATTCAAGCTTAATGCCGCAAAGACCTGAATTTAGCAAGATTGTGGATAATTCGTTTGCTGAAAAGGCAGCTAAATAAAGGTCACATAAAGATGAAAAGGTGGTGATTTTATTTGAGCTTGTTAGAAATATCAAATATATCAATGAATTATCATTCTATTAAAGGTGAAACACAGGCTTTAAATAATGTTAATTTTCAAGTAGATGATGGTAAGTTTATTTCTATTTTAGGACCGTCAGGATGTGGAAAATCTACATTATTAAATATAATGAGTGGACTGTTAGAACCATCTAATGGGAGCGTATTATACAAAGGTGAAGATGTAAAAAAGAATTTGGATAAGATAGGATATATGTTTCAAAAGGATCATTTATTTGAGTGGAATACGGTTTGGGAAAATGTAATCTTAGGATTAAAGATAAAAAAGCAGCTAAATAGTGAATCAAAAGAAAGAGTAAGTGGATTATTAGATGCTTATGGGTTAACGAGATTTAAGAACCATCATCCTAGTGAACTTTCAGGTGGTATGAGGCAAAGAGTTGCACTTATAAGGACTTTAGCATTAAATCCAGAGATACTCTTTTTAGATGAACCATTTTCAGCACTAGATTATCAATCGAGACTTTTGGTATGTGATGATGTTTATAAGATAATAAAAACAGAAAAAAAGACAGCAATAATGGTGACACATGATATAGCAGAAGCGATTTCTTTGTCTGAAAAAGTAATAGTATTATCTAAGAGACCATCTAGTGTGAAGGCAGAAATTCCTATACATTTTAGTGATGAAGAATTAACTCCTTTCCAAAAGAGAAGAGCTCCAGAGTTTAGTGAATATTTTAACATGTTATGGAAGGAGTTGAATGATGGAAATGGCTAA
Protein sequences of DBSCAN-SWA_3 >NZ_CP043998|1063839:1072426|1071658_1072426_+|WP_017209855.1|DBSCAN-SWA MSLLEISNISMNYHSIKGETQALNNVNFQVDDGKFISILGPSGCGKSTLLNIMSGLLEPSNGSVLYKGEDVKKNLDKIGYMFQKDHLFEWNTVWENVILGLKIKKQLNSESKERVSGLLDAYGLTRFKNHHPSELSGGMRQRVALIRTLALNPEILFLDEPFSALDYQSRLLVCDDVYKIIKTEKKTAIMVTHDIAEAISLSEKVIVLSKRPSSVKAEIPIHFSDEELTPFQKRRAPEFSEYFNMLWKELNDGNG >NZ_CP043998|1063839:1072426|1068731_1068968_+|WP_039773912.1|DBSCAN-SWA MNEELVKDKIETHERRLNNHGDRIDKLEQDGRELKTELKNLCENLKNLTSTMKWFITAMGGALISFFFYAVQTGIFNK >NZ_CP043998|1063839:1072426|1064202_1065681_-|WP_039773913.1|DBSCAN-SWA MNFSNSTTVKTERLKDTKSLEFQWETIDWKQVELDVNRLQTRIAKATKNGDNNKAKRLQYLLTHSFSAKAYAVRKVTTNKGKNTSGVDKKLWSTSASKMKAVLSLTDKNYKAKPLKRVYIEKKGKKQKRPLGIPTMYDRAMQTLYALALEPIAETKGDSISFGFRRGRSAKDACEQIFCVLARKCSPTWILEGDIKGCFDNINHEWLQNNIPMDKIIMKQFLKSGYIYEEKLFPTETGSPQGGAISSIYANMTLDGLEKVIQDKYHRNSKGKIENHYRAKTKVNLIRYADDFVITANSKEIAEELKTTVSQFLQSRGLALSEEKTAITHIDKGFDFLGWTFKKYSGKLIVKPSKNSIKNIIRKCSTIILKEGKASTQSDLIRRLNQVVRGWTNYHKHVVASKAFSNINNTLYQLLQQWAKHRHPNKNKWWKLNKYWQEKGWKRWLFKTDEYSLINLRRIKIVRHPKQVTKTPFLDKDYFDKRKIKLHIFVAA >NZ_CP043998|1063839:1072426|1067407_1067581_+|WP_023973953.1|DBSCAN-SWA MQFNKNSGCVKVWVTLIVGGTYEYKDVPNLLNLQEQVKLVLVDMGAMEDTTTESSAS >NZ_CP043998|1063839:1072426|1069448_1070234_+|WP_039773910.1|DBSCAN-SWA MKGIDISNHNGNINFNQVKTAGVEAVYIKATEGTTFKDSYLDTNYSNAHYVGLKTGFYHFLVGTSEPETQANNFYNAIKDKTSDLIPMLDVETNFDGLMDYILRFIAKFKELSNMQIGIYTYTSFMDNLDNRIADYPLWEANYNNDPWRLNSNFFTNRVGHQYSETGSLSGINTECDMNEFNDGILNKTTGYVVTNYLPNGYQGDNSFNGVDADYVLQYFKGVRCYFRGNEKGVWIETQNLSMSKCLELKETLGSWFYDIK >NZ_CP043998|1063839:1072426|1066206_1066821_-|WP_084670614.1|transposase|DBSCAN-SWA MDIDFLKKIEGSRKKAIGTRILQEYKYISIKELHEQNGYPIADLCNLSNTARSSYYKLINRSETELDRENSIILKEIVKPYEDVNGIYGYPRITMSINRLLNKQYNHKRIYRLMKSIDIMSVIRKKRKSYIQSTPQITAENKLNREFYANRPNEKWLTDVTEFKLLNGKKAYLSAIFDLAVSANPNANPLFHSDRGFQVRQEVA >NZ_CP043998|1063839:1072426|1070697_1071120_-|WP_039773909.1|DBSCAN-SWA MRIDLKDEFKDLPANTVAENLVRLRKLNDLTQKELSLIIGISKSIISKYERGELFPTKEQSIKLASYFNINSKYFFDSYLESMDNFHQYLSTVLNKNIHINKDKLCKSLDISKRTLYRYCYQNYIPTRSVFEKMKSYLNT >NZ_CP043998|1063839:1072426|1067773_1068628_+|WP_023973952.1|DBSCAN-SWA MKKTNSILIQFSRVVFMILGSILAAIGLEIFLIPNSIIDGGITGISIMASRLTNVELGIFIFVLNLPFVIIGYKQIGKTFALSTIFSVMCFSIVVTLLHPVPGITQDTLLATIFGGIILGVGVGLIIRNGGSLDGTEIVAILLDKRTSFSIGEIVMFFNLFILGSSGFLFGWDRAMYSLIAYFIAFKTIDITVEGINESKAVIIVSDKNKEISEAIMSRLGRGITLLDGKGAYSGSETEVIYLVLSRLEVAKLKNIVHHFDKGALITITSVEGTGKKYAKKAIH >NZ_CP043998|1063839:1072426|1071147_1071624_+|WP_011968276.1|DBSCAN-SWA MYRAFKGGTGDYVALFEPTASAIQKEGTGYILASVGEESGLIPYTCYFTTKSYMDKNPQVIQGFTNAIYKGQQWFFSHSTEEVADSIIDYFPGTDKDTIMTVIDNYKKIDAIAHTPEIKEENLNRLMDIITDYDSSLMPQRPEFSKIVDNSFAEKAAK >NZ_CP043998|1063839:1072426|1066922_1067081_-|WP_023973955.1|DBSCAN-SWA MDRKANYEERAEIVAFCISNNDDYQATADKFKVSYQQVYTWVKNKKLMDMKN >NZ_CP043998|1063839:1072426|1063839_1064190_-|WP_084670616.1|transposase|DBSCAN-SWA MLEPYEWETLTTVLRLGKGSNPFFLIDYTNRTFKAKLDKIKATQSISRVSRCIDNGPMEGFWRILKCEMYYLQKFYTYEELRQSIDDYIVFYNTKRLQTNLKGLTPIEYRNQTLSA >NZ_CP043998|1063839:1072426|1068983_1069379_+|WP_039773911.1|DBSCAN-SWA MIKQILGLVISILKNKTYMTAAREVWSIVDENFRITEKVEDKFRSKTEEFDKLLLAKFPELTNEDVIYFRQAIAGSVNVGKEAVLDNSVIMKELQESNAKLQAENASLKDQLSKFQSLAAATVNADVQQTV |
12 | Paenibacillus_phage(33.33%) | transposase | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_4 |
1217928 : 1228156
Sequences of DBSCAN-SWA_4
Nucleotide sequences of DBSCAN-SWA_4 >NZ_CP043998|1217928:1228156|DBSCAN-SWA AATGTTAAATATTAGAAGCGTATTCGTTGAAAAGAAAAAAGGATTTAATGTAGAAGCTCAAAGTTTATTAAATGATTTTAGAGATAACTTAGGAGTAACTGGATTAGAAGACGTAAGACTTGTTAATAAATATATAATATCAGATATACCTGAAGAATATTATAATAAGGCTTTACATACAATTTTTTCTGAAGCAACAGTAGATGTAGTTTACGAATCAGAATTACCAATGAATGAAGGAGAAGTAGCTTTTGGTGTAGAATATTTGCCAGGTCAATACGATCAAAGAGCAGATTCAGCTTCAGAATGTCTAGCTCTATTAACAGCAGAAGACAAGGTTGAAATAAAATCAGCTAAAGTAGTATTATTAAAAGGAAACCTTTCAAAAGATGATATTGAAAAAATTAAGAAATATTATATAAACCCAGTCGATTCAAGGGAAGTAGATATAAATAGCAAAGATTTATCATCACTTTCAAACATACCTAAAGATGTACAAATCTTAGATGGATTTACCAGCAAGACATTGGATCAATTAAAAGAATTTCATAGTGGACAAGGTTTGGCTATGAGTATTGATGATCTTCTTATGATTCAAGATTATTTCAAAGGAGAGAAAAGAGATCCAAGTATAACTGAAATTAAAGTTATAGATACATACTGGTCAGATCACTGTAGACATACAACATTCTCAACTATATTAGAAGATATCCAAATTGAAGATAATAAATATACAGCTCCAATAAAAGCAAGTTATGAAGGTTATATAAAATCTAGATCATATGTTTATGGCGAGAAAGAAAAGAATAAAACTCTTATGGATATGGCAGTAATTGCTATGAAAGAACTTAGAAAAAGAGGAAAACTTGAAGATCTAGATATTTCCGAAGAAATAAATGCTTGTTCAATTAACGTGAAAATTGAAACTGATAAAGGCATGGAAGATTACTTAGTAATGTTCAAGAATGAAACACATAACCATCCAACAGAAATTGAACCTTTTGGTGGAGCAGCAACATGTCTTGGTGGAGCTATAAGAGATCCACTATCAGGAAGAACTTACGTATATCAAGCAATGAGAGTTACAGGAGCAGCAGATCCAACAGTTCCAGTTGAAGATACATTAGAAGGGAAACTTCCTCAAAGAAAGATAACACTTGGAGCAGCTCATGGATATAGTTCATATGGAAATCAAATTGGTCTTGCAACAGGTCAAGTTGAAGAAGTATATCATCCAAACTATGCAGCAAAGAGAATGGAAGTTGGAGCAGTTATTGCAGCAGCACCTAAGGAAAATGTGGTAAGAGAAGAACCAGCTTTAGGAGATGTTATTATCTTACTTGGTGGTAGAACTGGAAGAGACGGTGTTGGAGGAGCTACAGGTTCATCTAAGGAACATACAGTAGATTCACTTAATGAATGTGGAGCAGAAGTTCAAAAAGGAAATGCACCTACTGAAAGAAAGCTTCAAAGATTATTTAGAAATTCTAAAGTAGCAAAGATGATTAAGAGATGTAATGACTTTGGTGCAGGTGGAGTTTCAGTTGCAATTGGAGAACTTTGCAGAGGATTAGATATAGATTTAGATAAAGTTCCAAAGAAATATGAAGGTCTAGATGGAACAGAACTTGCGGTTTCAGAATCACAAGAAAGAATGGCAGTAGTTGTTAAGAAAGAAGATGCAGATGAATTTATAAGACTTTCAAACGATGAAAACTTGGAAGCCAATTTAGTTGCACATGTTACTGATACAGATAGACTTAGATTATTCTGGAGAGGTAAAAATATAGTTGATTTAAAGAGAATATTCTTAGATACAAATGGTGCAACTCAAAAGACAAATGTTACAGTTAAAGCTCCAGTTGATTATCCATATGTAGTAGCAGATATTGATGTTAAAGAAGAATGGATAAATAATTTAAGAAAATTAAATGTATCATCTCAGCAAGGATTATCAGAAAGATTTGATGCAACAATAGGACATGGAACAGTACTTATGCCATTTGGTGGTAAGTATGCAAAGACTCCAGCAGAAGGAATGGCAGCTAAAATCCCAGTTCTAGATGGAGAAAGTGCAGATGCTACATTAATGACATTTGGATTTAATCCAGAATTAGGTACTTGGAGTCCATATCATATGGCATACTATGCAGTAATTGAAAGTATATCAAAACTTGTAGCTATGGGTGGAGATTACAGAAAAGCTAGGCTTACATTCCAAGAGTATTTTGAAAGATTAGGATCAGAAAGCTCTAGATGGGGAAAACCATTTGCAGCATTGCTTGGTGCATATGAAGCTCAAATGGCATTTGAAACAGCAGCAATCGGTGGTAAGGACTCAATGTCAGGAAGTTTTGGAGATTTAGATGTACCTCCAACATTAGTATCATTTGCTGTAGGAGTAGAAAAAGCTAGAAATATAATATCACCAGAATTTAAAGAAGCAGGATCAAGTTTAGTTTTACTTCAAACTGAAAAACTAGAAGATGGAACTATAAATTTAGATAAGATTAAGAAGAACTTAGACGTACTATATAACTTAATTCAAAGCGGAAAAGTAATTTCAGCATCTGCTGTTAAGTATGGTGGAGTTTCAGAAACTGTTACTAAAATGACACTTGGAAATAGAATTGGTGCAGAAATTGAAAACTTAACAAAGGATGAGCTATTTGGATTTAACTATGGAACTATAGTACTAGAAGTTAAGAATGGTGTTAATGTAGAAGAAGAATTCAAAGAGTGTTTATATAAAGAAGTTGGTAAGACAATAAGTTCAGCAGTTATAATTTCTAAGGAATATGATTTGAATTTAGATATAGAAGCTTTAGAAAAAACATACGAAGAAAAATTAAGCTCAGTATTTAAAATTAAAACTGAAGATGTAGAAGGAAAAGTAGAAACAGTTTTATATGATAAGAAATCAACACTTTCTCCAGCAATTAAAGTAGCTAAGCCAAAGGTTGTAATTCCAGTATTCCCAGGAAACAACTGTGAATATGACTGTGCAAGAGCATTTGAAAAAGAAGGAGCAGAAGTAACTCAAGTAGTATTTAGAAATATTACTAAAGAAGCACTTAATGAATCTATTGAAAGACTTGCAAAAGAAATAAGTACTGCTCAAATTCTTATGATTCCAGGAGGCTTCTCAGCAGGGGATGAACCAGATGGTTCAGGTAAATTCATTGCCAATGCTCTTAGAAATGAAAAGATAAGCAATAGCGTAATGGAATTACTTAAAAATAGAGATGGATTAGCACTTGGTATTTGTAACGGCTTCCAAGCGTTAATTAAATTAGGATTAGTACCATATGGCGAAATAGTTGATATTAAAGAAGATATGGCAACATTGACTTACAACAATATAAACAGACATATGTCTTCAATTATAAGTACAAAGGTTGTTTCAAATAAATCACCTTGGTTCAGTGAAGTTAATGTAGGAGATATACATTCAGTTGCAATCTCGCATGGTGAAGGAAGATTTGTTGCACCAGAAAGCTTAATTAAAGAATTAATTGCTAATGGTCAAGTGGCAACTCAATATGTTGACTTTGATGGAAATGTATCATTAAATATGCCGTTCAATCCAAATGGATCAATGTACGGAATAGAAGGTATAACAAGTCCAGATGGAAGAGTCTTAGGTAAGATGGCACATAGTGAAAGAATAGGAACAGATTTATATAGAAACATCCCAGGAGACTTTGATCAAAAGATCTTCAAAGCAGGAGTAGAATATTTTAAATAAAAGTTGAAAGTTAGCATTGCTTGCTGATTGCTAACTCTCAATTAGATGAAAGATGCAGAATATAAAAATAGTTATATATTTAAAAATTTAAATAGGTATATATGTAAGAAGTTAAATTTTTAAATATGTACAAAGTTAAGTATATAAATATTTAAAAAGATAAATATGAAGATATGTAAATAGATAAATATGTAAATATTTATAGTGATAATGCGGGTTACAGACATTTATAAGGAAACTCGACTCACATACGTTCGCTGAGTAAGTTCGAGAAACCAAATGTAAAAGCTCCAAGGAGAAAGTTCTGCTAACCAAATACAAAATTTGGAGCATCACTTTTTGGACTCTCACTTATAATGCGGGGGATAGCCCTTAAGAGAAATATATAAATGTATTAATAGGAACATTACAAAAACAGGAGGCTTAAAAATGCAGGTAGCAATATTTTTTGGAAGTAAATCAGACACAGAGGTTATGAGAGGAGCAGCAAATGCTTTAAAGGAATTTGGAGTAGAGTACAAAGCGTTTATACTTTCAGCTCATAGAGTACCAGAAAAATTAGAAGAAACATTAGAAGAAATTCAAGCTCAAGGATGTCAAGTTATTATAGCTGGAGCAGGGCTTGCAGCACATTTACCAGGAGTAATAGCATCAAAGACAATACTTCCTGTAATAGGAGTTCCAGTTAAGGCAGCTCTTGAAGGTGTTGATGCATTATATTCTATAGTACAAATGCCAAAGTCAATTCCAGTTGCAACTGTTGGTATAAATAACAGCTACAATGCAGGAATGTTAGCGGTTCAAATGTTATCAGTTAATAATGATGAATTAAAAAATAAATTAAAAGAATTCAGATTAAATATGAAGAAAAAATTCATTGAGGAAAATGCGGAAGGGGTAGAACTATAATGGAAAAATTAGAAATGTTATATGAAGGAAAAGCAAAGAAAATTTACGCAACAGATAAGGCTGATGAAGTAATTGTATATTACAAAGACGATGCTACAGCATTCAATGGAGAAAAGAAAGGCCAAATCGAAGATAAAGGTATAATGAATAATGCTATAACTTCAGTATTATTTGAAATATTAGAAAAAGCAGGAGTTAAAACTCATTTTATAGAGAAACTAAATGATAGAGAACAATTATGTAAAAAGGTTGAAATAGTTCCACTTGAAGTAATAGTGAGAAATGTTGCAGCAGGAAGCATGGCTAAGAGATTAGGTCTTGAAGAAGGATTTAAGCTTAAGACTACTGTATTTGAATTATCATATAAAGATGACTCACTAGGAGATCCATTAATAAATGATTATCATGCAGTTGGAATTGGTGCAACTACTTTTGAAGAATTAAAAGTAATCTATGATATGACAGCAAAAATTAATGACACTCTTAAAGCTGTATTTAAAGAACAAAACATAAACTTAATTGACTTTAAAGTTGAATTTGGTAGATGTGCTGATGGAACAATAGTTTTAGCTGATGAAATATCACCAGACACTTGTAGATTCTGGGATGCAACAACAGGAGAAAAATTAGATAAAGATAGATTCAGAAGAGACTTAGGTAATGTTAAAGATGCTTATGTTGAAATATTAAAGAGAATTTCTAAGTAGTATATATTTAGAATCAAATTTACTATAAAATTTATATTAGAATGCAATTAGCAATGCACAATGAGGGAACTAAGTTCACAGAGGAAGGTTGAGAATTCGTACATTAAGTCTTGAGTGTTATTTTGAATTCTCATTTCTCTGATGAAGTTTGATGAATTATGTGATTTAGAAGTCAAAAAAAATTTCATCCTTAATTGTGCATTAGTTCTCATGTATTTTAAGTTTTTCAAAAATAGATTAGTGAAAGGATTGTATAGATGAGTAATCCGAATTTTGAATTAATAATGGATCCAAGTAATGATAAATTTAAGGATGAGTGTGGGGTATTTGGAGTATATACTAATAAGCCAATAGATGTAGCATCAATGACTTACTATGGACTTTATGCTCTTCAACATAGAGGGCAGGAAAGTGCTGGAATTGCAGTAGCAGATGGTGAAAAAATTGACATACATAAAGGATTAGGTTTAATAACTGAAGCATTTAAGCAGGAAGATTTACAAAAGCTAAAAGGTCATATAGCTATAGGCCACGTAAGATATTCAACTGCTGGTGGAAAAGGCATTGAAAATGCTCAGCCAATACTCGTTTCATCAAAGATGGGACCAATAGCTATGGCTCATAACGGAACTTTAGTAAATGCAGATGTAATAAAAGAATTGCTTGAAGATGGAGGACAAATTTTCCATACTACAACAGATTCTGAAGTAATTGCATGTCTTATAGCAAGAAGCGCAAAAAAAGGTTTTGCAAAAGCAGTAGTTGATGCTATGTCAGCTGTTAGAGGTTCATTTGCATTAACTATTATGTCAAAGGATAGATTAATTGGGGCTAGAGATCCACATGGAATTAGACCGCTTTCATTGGGGAAAATTGAAGAAGGTTACATTCTAACTTCAGAAAGCTGCGCTTTAGATGCAATAGGTGCTGAATTTGTAAGGGATATAGAACCAGGAGAAATAGTTATAATAGACAGTGAAGGAATAAGTTCATATAGATATTCTGAAAATACTAAATGTCAGACATGTGCTTTTGAATATATATATTTTGCTAGACCAGACTCTAGAATTGATGGGCTTGAAGTTCATACAACAAGAGTTAAAGCAGGAGAACAGTTATATAAAGAGCATCCATTAGATGCAGATGTTGTTATAGCAGTTCCAGACTCTGGAATACCAGCAGCTATCGGATATGCAAAGGCTTCTGGTATACCTTATGATACTGGATTTATTAAAAACAGATACGTTGGAAGAACTTTTATATCGCCATCTCAAGAAATTAGAGAAAGAGCAGTTGCAGTAAAGTTAAATCCACTAAAATCAAACTTAGAAGGAAAAAGAGTTATACTTATTGATGACTCAGTAGTAAGAGGCACTACATCAAAACATTTAGTTGAATCACTTAGACGTGTAGGTGTAAAAGAAGTTAGTTTCTTACTAGCATCACCAAGTGTTAAGTATCCATGTTATTTTGGAATAGATACACCTTATAGAAGTGAGCTTGTTGCTGCTAATAATACTATAGAAGAGATTAGAGATATGATTGGAGCAGATTATTTAGGATATCTAAGTGAAGAAGGCGTTTATAAGAGCTGCGGTGATAGAGAAGAATTTTGTATGGGATGCTTTAATGGAGTTTACCCAGTTGCAACACCAGTAGAGAAAGAGATATAGACATCTAAGGCACATTCATCTATTGTTTTTTGAATATGTCAATAGCATTTTGAAAGGTGGAGTTAATAAATGATTACTTACAAAGAAGCGGGAGTTAACATAGAAGAAGGATATAAATCAGTTAAGCTTATAAAAGAATATGCAGCAAGAACTATGAGTCAATATGTTTTAAATGGTCTTGGAAGTTTTGCTGGGATGGTTGAATTACCATCAGGTTATGAAAAACCAGTTTTAGTTTCTGGAACTGATGGAGTAGGAACTAAGCTTGAAATCGCATTTAAGAACAAGAAGTACGATACAGTTGGTATTGACTGCGTAGCTATGTGCGTAAATGATATTTTATGCCATGGGGCAAAACCATTATTTTTCTTAGATTATATAGCTTGTGGGAAGCTTGAAGCTGAAGTTGCAGCAGATTTAGTTAAAGGTATATCGGATGGATGCGTTGATTCTGACTGTGCCTTAATTGGTGGAGAAACAGCTGAAATGCCTGGATTCTATTCAGATGGAGAATATGATATGGCTGGATTTGCAGTTGGTATAGCTGATAAAGATAAGATTATTAATGGAAGCAATATTAAAGATGGAGATAAGTTGATTGGTATAGCCTCTTCTGGAATACATTCTAATGGATATTCATTAATCAGAAAAGTATTCCCAGATTTAAATGAAGAATTTAATGGTGAAGAAGTATGGAAGACATTAATTACACCAACTAAGATTTATGTAAAACCAGTACTTAAATTGTTAGAAAGCTATGAGATTAAAGGTATGGCTCATGTTACAGGTGGTGGATTTATAGAAAATGTTCCAAGAATGTTTAATGGTGGGGACTTCACAGCTGTAATTAACAAAGATTCATATCCACTTCCAGCTATATTTGAAAGAATCATTGAAAAAGGTGTAGACAAGGAGCATATGTATAACACTTTTAACATGGGAATAGGGTTTGTTCTTGCTGTTAAAGATGAAGATGTGGAACCTATTATAAAGGCTTTAGTAGAAATGGGAGAAAAAGCTTATGAAATAGGATACGTAACATCTGGGGGTGAAGGTATTTGTTTAAAATAGCGGTCTTGGTTTCTGGGGGCGGAACAGACCTACAATCGGTAATAGATGCGGTTGAAAGTAACTATATGAATGTTAAGATAGAGATGGTTATAGGAAGCCGTGATAATATTTATGCTTTAGAGAGGGCTAAAAAGCATAATATAGATACTTTTGTTGTTAATAGGCGTGAATATGGTGAAGAATCCTCTAACAAGATCTTAGAATTAACAACGGGAAAGGTTGATTTAATAGTTCTTGCAGGATTTTTGGCAATTTTAGATGGGGAAATATTAAAGGAATTTGATAATAGAATTATAAACATTCATCCATCTTTAATTCCATCTTTTTGTGGACCTGGAATGTACGGATTAAAGGTTCATGAAGCCGTAATTAAAAGTGGTGTAAGATTTTCAGGATGTACAGTTCACTTTGTAAATTCTGAAGTTGATGGGGGTGCCATACTTCTTCAAGAAGTTGTGCCAGTTTATTTTGAAGATGATGCGGAAACTCTTCAAAAGAGGATTTTAGAAAAAGAACACGAAATATTACCTAAGGCAATTAAGTTAATTAGCGAAAATAAAATCAGAGTAATTGATGGTAGAGTCAAGATAGAAGAATAAAGGAGGCCTTTTCGTGAAAAAGAGAGCTTTAATAAGTGTATTTGATAAAGAGGGAGTTTTAGATTTTGCTAAATTTTTAGTATCTAAAGATGTTGAAATTGTATCAACAGGTGGAACTTATAAATATTTAAAGGAAAATGGATTAAATGTAATTGAAATCAATGAAGTTACTGATTTTCCTGAAATGTTAGATGGAAGAGTTAAAACACTTCATCCATTAGTTCATGCTGGAATATTAGCTATAAGAGACAATGAAGAACATATGAATACATTAAAAGGAAGAAATATTCATACTATAGATTATGTAGTTGTAAATCTATATCCATTCTTTGAGAAAGTTAAAGAAGATTTAGAATTTGAAGAAAAGGTTGAATTTATAGATATTGGTGGACCTACAATGCTTAGAGCAGCAGCTAAGAATTTTCAGGATGTTGTAGTAATTTCTGATAAGAATGACTATAAAGTTGTTATGGAAGAGATTGAAGCAGATGGAGAAACTTCTTATAAGACTAAGAAGAAATTAGCTGGTAAAGTATTTAATCTTATGAGTGCTTATGATGGGGCTATTTCAAACTTCTTATTAGCTGATGATGAAGAAGAATATCCAGAATATCTTTCAGTTTCATATAAGAAGATGCAAAGCCTTAGATATGGTGAAAATTCACATCAAACTGCAGCTGTTTACGCATCAACAATGCTTGATGGAGCTATGAATACTTTTGAAACATTAAATGGTAAGGAATTATCTTATAATAACTTTAAAGATGTTGATATAGCTTGGAAATGTGCTAATGAATTTGATGAACCAGCATGCTGTGCATTAAAACATAATACACCTTGTGGTGTTGCAATTGGAAAAGATTCTTATGAAGCGTATATGAAGGCATATGAAGTAGATCCAACTTCAATATTTGGAGGAATCATTGGATTTAATAGAAAAGTAGATAAGAAAACTGCTGAAGAAATGGTTAAAATTTTCTTAGAAGTTATAGCTGCACCAGAATATGATGAAGATGCTTTAGAAATTTTAAAAACTAAGAAGAATTTAAGAGTTCTTAAATTCCATAATACTCCAAAGGCAGATAAATATATGGTTACAGTTGATGGGGCAATGCTTGTTCAAGAGGAAGATAATAAATTAGTAGAAGAAATTAAATTTGTAACTGAAAAGAAACCAACTGATGAAGAAATGAATGATTTATTATTTGGAATGAAAGTAGTTAAATACGTTAAATCTAATGCTATAGTTGTTGCTCATAATGGAATAGCACTTGGAATTGGCGGTGGTCAAGTTAATAGAATCTGGCCAACAGAAGATGCTTTAAAGAGAGGAAAAGGAGCTACAATCCTTGCATCAGATGCTTACTTCCCATTTGGAGATGTTGCAGAGACAGCGGCAAAAGCTGGCATTAAAGCGATAATTCAACCAGGTGGATCTATTAGAGATCAAGAGTCAATAGACGTTTGTAACAAATATGGAATCTCAATGGTATTTACAGGATATAGACACTTCAAGCATTAA
Protein sequences of DBSCAN-SWA_4 >NZ_CP043998|1217928:1228156|1222583_1223291_+|WP_011968398.1|DBSCAN-SWA MEKLEMLYEGKAKKIYATDKADEVIVYYKDDATAFNGEKKGQIEDKGIMNNAITSVLFEILEKAGVKTHFIEKLNDREQLCKKVEIVPLEVIVRNVAAGSMAKRLGLEEGFKLKTTVFELSYKDDSLGDPLINDYHAVGIGATTFEELKVIYDMTAKINDTLKAVFKEQNINLIDFKVEFGRCADGTIVLADEISPDTCRFWDATTGEKLDKDRFRRDLGNVKDAYVEILKRISK >NZ_CP043998|1217928:1228156|1225033_1226035_+|WP_011968400.1|DBSCAN-SWA MITYKEAGVNIEEGYKSVKLIKEYAARTMSQYVLNGLGSFAGMVELPSGYEKPVLVSGTDGVGTKLEIAFKNKKYDTVGIDCVAMCVNDILCHGAKPLFFLDYIACGKLEAEVAADLVKGISDGCVDSDCALIGGETAEMPGFYSDGEYDMAGFAVGIADKDKIINGSNIKDGDKLIGIASSGIHSNGYSLIRKVFPDLNEEFNGEEVWKTLITPTKIYVKPVLKLLESYEIKGMAHVTGGGFIENVPRMFNGGDFTAVINKDSYPLPAIFERIIEKGVDKEHMYNTFNMGIGFVLAVKDEDVEPIIKALVEMGEKAYEIGYVTSGGEGICLK >NZ_CP043998|1217928:1228156|1223548_1224964_+|WP_039770442.1|DBSCAN-SWA MSNPNFELIMDPSNDKFKDECGVFGVYTNKPIDVASMTYYGLYALQHRGQESAGIAVADGEKIDIHKGLGLITEAFKQEDLQKLKGHIAIGHVRYSTAGGKGIENAQPILVSSKMGPIAMAHNGTLVNADVIKELLEDGGQIFHTTTDSEVIACLIARSAKKGFAKAVVDAMSAVRGSFALTIMSKDRLIGARDPHGIRPLSLGKIEEGYILTSESCALDAIGAEFVRDIEPGEIVIIDSEGISSYRYSENTKCQTCAFEYIYFARPDSRIDGLEVHTTRVKAGEQLYKEHPLDADVVIAVPDSGIPAAIGYAKASGIPYDTGFIKNRYVGRTFISPSQEIRERAVAVKLNPLKSNLEGKRVILIDDSVVRGTTSKHLVESLRRVGVKEVSFLLASPSVKYPCYFGIDTPYRSELVAANNTIEEIRDMIGADYLGYLSEEGVYKSCGDREEFCMGCFNGVYPVATPVEKEI >NZ_CP043998|1217928:1228156|1226022_1226634_+|WP_039770439.1|DBSCAN-SWA MFKIAVLVSGGGTDLQSVIDAVESNYMNVKIEMVIGSRDNIYALERAKKHNIDTFVVNRREYGEESSNKILELTTGKVDLIVLAGFLAILDGEILKEFDNRIINIHPSLIPSFCGPGMYGLKVHEAVIKSGVRFSGCTVHFVNSEVDGGAILLQEVVPVYFEDDAETLQKRILEKEHEILPKAIKLISENKIRVIDGRVKIEE >NZ_CP043998|1217928:1228156|1217928_1221675_+|WP_039770444.1|DBSCAN-SWA MLNIRSVFVEKKKGFNVEAQSLLNDFRDNLGVTGLEDVRLVNKYIISDIPEEYYNKALHTIFSEATVDVVYESELPMNEGEVAFGVEYLPGQYDQRADSASECLALLTAEDKVEIKSAKVVLLKGNLSKDDIEKIKKYYINPVDSREVDINSKDLSSLSNIPKDVQILDGFTSKTLDQLKEFHSGQGLAMSIDDLLMIQDYFKGEKRDPSITEIKVIDTYWSDHCRHTTFSTILEDIQIEDNKYTAPIKASYEGYIKSRSYVYGEKEKNKTLMDMAVIAMKELRKRGKLEDLDISEEINACSINVKIETDKGMEDYLVMFKNETHNHPTEIEPFGGAATCLGGAIRDPLSGRTYVYQAMRVTGAADPTVPVEDTLEGKLPQRKITLGAAHGYSSYGNQIGLATGQVEEVYHPNYAAKRMEVGAVIAAAPKENVVREEPALGDVIILLGGRTGRDGVGGATGSSKEHTVDSLNECGAEVQKGNAPTERKLQRLFRNSKVAKMIKRCNDFGAGGVSVAIGELCRGLDIDLDKVPKKYEGLDGTELAVSESQERMAVVVKKEDADEFIRLSNDENLEANLVAHVTDTDRLRLFWRGKNIVDLKRIFLDTNGATQKTNVTVKAPVDYPYVVADIDVKEEWINNLRKLNVSSQQGLSERFDATIGHGTVLMPFGGKYAKTPAEGMAAKIPVLDGESADATLMTFGFNPELGTWSPYHMAYYAVIESISKLVAMGGDYRKARLTFQEYFERLGSESSRWGKPFAALLGAYEAQMAFETAAIGGKDSMSGSFGDLDVPPTLVSFAVGVEKARNIISPEFKEAGSSLVLLQTEKLEDGTINLDKIKKNLDVLYNLIQSGKVISASAVKYGGVSETVTKMTLGNRIGAEIENLTKDELFGFNYGTIVLEVKNGVNVEEEFKECLYKEVGKTISSAVIISKEYDLNLDIEALEKTYEEKLSSVFKIKTEDVEGKVETVLYDKKSTLSPAIKVAKPKVVIPVFPGNNCEYDCARAFEKEGAEVTQVVFRNITKEALNESIERLAKEISTAQILMIPGGFSAGDEPDGSGKFIANALRNEKISNSVMELLKNRDGLALGICNGFQALIKLGLVPYGEIVDIKEDMATLTYNNINRHMSSIISTKVVSNKSPWFSEVNVGDIHSVAISHGEGRFVAPESLIKELIANGQVATQYVDFDGNVSLNMPFNPNGSMYGIEGITSPDGRVLGKMAHSERIGTDLYRNIPGDFDQKIFKAGVEYFK >NZ_CP043998|1217928:1228156|1226647_1228156_+|WP_039770437.1|DBSCAN-SWA MKKRALISVFDKEGVLDFAKFLVSKDVEIVSTGGTYKYLKENGLNVIEINEVTDFPEMLDGRVKTLHPLVHAGILAIRDNEEHMNTLKGRNIHTIDYVVVNLYPFFEKVKEDLEFEEKVEFIDIGGPTMLRAAAKNFQDVVVISDKNDYKVVMEEIEADGETSYKTKKKLAGKVFNLMSAYDGAISNFLLADDEEEYPEYLSVSYKKMQSLRYGENSHQTAAVYASTMLDGAMNTFETLNGKELSYNNFKDVDIAWKCANEFDEPACCALKHNTPCGVAIGKDSYEAYMKAYEVDPTSIFGGIIGFNRKVDKKTAEEMVKIFLEVIAAPEYDEDALEILKTKKNLRVLKFHNTPKADKYMVTVDGAMLVQEEDNKLVEEIKFVTEKKPTDEEMNDLLFGMKVVKYVKSNAIVVAHNGIALGIGGGQVNRIWPTEDALKRGKGATILASDAYFPFGDVAETAAKAGIKAIIQPGGSIRDQESIDVCNKYGISMVFTGYRHFKH >NZ_CP043998|1217928:1228156|1222104_1222584_+|WP_017210869.1|DBSCAN-SWA MQVAIFFGSKSDTEVMRGAANALKEFGVEYKAFILSAHRVPEKLEETLEEIQAQGCQVIIAGAGLAAHLPGVIASKTILPVIGVPVKAALEGVDALYSIVQMPKSIPVATVGINNSYNAGMLAVQMLSVNNDELKNKLKEFRLNMKKKFIEENAEGVEL |
7 | Cyanophage(28.57%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_5 |
2472234 : 2476717
Sequences of DBSCAN-SWA_5
Nucleotide sequences of DBSCAN-SWA_5 >NZ_CP043998|2472234:2476717|DBSCAN-SWA ATTAAAAGATTCTATCTTGATTATTAAGTTGTGAGCAACGATTAAATTCCATTTCTAATACCGTGTTTACTGTATGTTTACCTAGATTATCTAAAGAATTATATTTTTTTAATAAACATTCTAATTCTTCTGATAGTTGTAAACGTGTTTTTATTTTGTTTTCATCCCATCCCATTAAAATAGATGGAGTTGTTTCTAATATTACTGCAAGTTTTTCGATTTTGTCAGAAGGTATATTAGAGATTACACCGCTTTCATATCTTTGAAGTGTTGGCTTACTAATAGATAATCTTTTAGAAACATCTTCTAATGTGAGATTCAATTCTAATCGTCTATTTTTGATATTTTCTTTCAAACCCATTTTATATCACCTCTTAGTTCTATATTAAAAGTAAGTAAATTATAGATTATCAATTAATATAATTTATTGATAATCTATAATAAAATCGAAGCGTCCTAATAAAACTTAATAACTTTTTATTTATTTTGTTTACTGCAGTTAGGCAAATTAAAAAAATCATTCTAATTTGGAGACTATTAATATAATTTATTATAACATCTGTTTCCGGATATGCAACAATTATTTTCCAGTATATAGAAAAAGTTACGTAAGAAGTATTGACAATAATAGCCATAATATATAAAATATTACTTAACGAGTAACGAAAGGAGAGCATTTATGATATTAGTTAATGAGTTAAAGGGAAAGATAAAAGCAAAAGGATATACTCAGGAAAAGCTGGCAAGGGAATTAGGAATGTCTCCAAAAACCTTAGGTAATAAACTTAATAAAGGAATATTTGGTTCTAATGAAATTGATAAGATGATAAAACTATTAGATATAAATAATCCAATAGAGATTTTTTTTAATAAATAAATTACTTAAAGAGTAAAATGTATTGACTTTATATATATAGTATTAGAAATCTAGAATTGATTATATATATTGCAAAAATAATTCTTCATCACAATTCTAAAAATGCTGCAAGAATTTTATACGTAATTGTGAAATGTGCATTGGGAATTGCAACGTATATATTGTAATTTAAGAGCATTATGTTGAGCTGATGGTTATTTTTATAGAAGGACAAGCTATGGAAGAATCATTAAAAGAAATTTTAATTGAATTAAGAAAATAGTAGTCTTAAATTAAAAAATAAATGCAAATTTATTTTAATACATCTTTAGCTAGAATGTATCAGGGATACAACTTTTGATAGAAATGTATAAAAAGAAAGTGAGGACTTACAAATGAATTTTAGGATTTTTAAATGTTATATAGATGTTTGTAAGTTAATTGAGTTAAACCCATCATGGAATGGTCTCAAAAGATTTAGGCAATTTTATTTATGGGAGCGTGAAAATAATGGCAGATATTAAATGGATTAAATTAGCTACTAATATGCATGATGATGAAAAGATGAAGTTAATAGATGCAATGCCTAACAGGGATACAATTCATTACGTTTGGATAAGAATACTTTTACTTGGTGGAAAACTTAATGCTAATGGAAAGGTTTTCTTATCAGAAGGGAAACCTCTCACTGCCAAAATGTTGGCTGTATTATTTTCTAGGCCTTTAGAGGATATTAAGATTGTATTAAAAGTATTATCTAACTTTGGCATGATTGAAATAGCTTCTGATAAAGTAATTAGAATTGTGAACTGGGATAAGCATCAGAACATAGAGGGAATGGAAAGGGTCCGTGAACAAAATAGAAAAAGAGTTGAGAATCATAGGGAAAAGAAGAAAGAAGAGAAGAATGCAGCTAAAAGTAATAAGGAAGAAACTCAGGAAGATAAAGTCTTAGAAGAATTTATAGATTTAGAAGAAAATCAAGATCTGGATGAAAGTGTAGAATTAGAAAAAACTAATGAATTAGAAGGAAAGAAAGATTACTCTAAGAATTCTACTATAGAAGAAAACAAAGCTCTAGGTAAGAATGATATATTAGAAAATTTGGAAACTAGTGAAGAGGCTTCTGGAAATACGTATATTAATGATAAAACTAATATTACTACTAGCGAAGCAGGTAATAATATTACTGTAGAAATTATTGATAATAATGAAGATATCAGTAATAACATTTTAGAAACTGATGATAATAATTGTATTGTTACTAAAAATAATAGTAACGTTACTCAAAATAAATGTAACGTTACAGTAACGCAACAGAATAAGAAGGAGAAAAAGAATAAGAATAAGAAGGAGAAAAAAGAGATAGATAAAGATAAAAACATAGAGGGTAAAAAGAATAATGGTTTTGATATAAATAATAAAGGCTCAGCTTGTGATGATGAAGTTAGCCAGTCGAATCTATCTAAGAAACACAATAATACTAAAAGTGAATCAGGGGAAGAGGAGGACATAAATCTTAAAGCTTTAGAGCTTATGCATTATCATGAAAAAATAACAGGAAAGCCAGGAGGATGCGACTATGTTGCTCTTAGATCGGCTATTGATATCCATGGAGAAAAAATGGTTAAGATGGCCATGGATGTTGGGTTTGAGAAGAATTGTCCTGACATAAAGTATGCAATTGGGGTATTAAAAAACTGGAGGAGAGATGGGTATCCAGAAGATCATATGGAGGTAAAGAAAAATGGGGTTAGAAGCAATGGAAAGAGTAACAGAGCAGATAAAAATGAATTTGCAGGATTCAAGCCGAAGGAACCGCGAAAACTTACAGAAGCTGAACGAAAGAGGATTGAAGCAAACCTCATATAAATGCGATAAATGCTGCGATACTGGATGGATACTTATCCCCCAGGAACATATGCAGCCTCTTGCTGTAGCCTGTGAATGCAGAAAAATAGAAAAACTAAAGAATGAATGGAAGTATTCTGGAATCAATGTTGAACAAAGTAAACTTACTTTTTCTAGTTTTGAAGTTTGGAATAATGCGTCACAAAGGATGAAGGACACTGCAGCAGCATATTGTACTGATTTTGATGAAATAAAAGATACTAGGCGAAATAGTATTTTATTATGTGGACAGGTTGGCAGCGGTAAAACGCATTGCAGTATTGCTGTTGCATTGAATTTTTTAAAACAAAGAATTAAAGTGCTGTACATGCCTTATCGTGATGTAATCACAAAGATAAAACAAAATATGATTGATGAAGAATATTATACTAGGACCATCTCAAAGTATCAATTATGTGAGGTACTACTTATTGATGATCTCTTTAAGGGAAAAATCAATGAAACAGATACAAATATTATGTTTGAAATTATTAATTACAGGTATCTTAATTTTCTGCCGATCATAGTCAGCAGCGAATTCTCCATTGACAGATTACTGACATTTGATGAAGGGGTCGCTTCAAGAATATATGAAATGTCAAAAGATTATGTTGTAGAAATTGAGAAGGATATTAGGAATAATTATAGACTTAAATAAATTTACAATGCACAGTGCACAATTCACAATAAACAATTACAGAGTGAAAATTCTCATGAAAACGAATTTTTTCAGAATTAAACAAAGCTAAATTATGAAGGGAAGTTGTTTAAATGAAATCATCAGGAATAGTAAGAAAGCTCGACCCACTTGGAAGGATTGTAATACCAAAAGAAATAAGAAAGGTACTAGAAATTTACGAGGGAGATTCCATGGAAATAATTAAGGTTGATAATGGGGTGGTTGTTAAAAAATATATTAAAGGATGCATTTTTTGTGGAAGTGATAAAGATGTTGTTGAATTTAATGGAGCAGTTGTTTGTGATGGATGCAGAAAGGCTTTAGGGCAGGATTAAACCAGTTGATATGTGGAAAGATGGATGGACAATATATAGTTAAGATACTGAAATCAGAATAAATAAGATATATGCTTTAAAATGACTTAAAACAATATACATTGTACGATCAGAATCTGTTGCCCATGAGCGTATGGTTGAAATAACTGAAAGGCGGCAAGAGCATTATCTAAATTAAATGAAAATCTTGTCTGTTAATTGCAATATAATAAGTACTAATATGAAGGTCATTTATAAATGATAATCAAAAAAACGCTCTTTTTCAAGAGCGTTTTTGGCATGCAATCAAACTTAATTTATATTAGAAATAAGACATATAGATTGTAAAATTTTACTTTTATAAATGTTAAAGGTTATGTTTTTTATCTATAGTTTAAAAAGCTTATTTTATATATATAGTTTGAAGATTATAGTTTTATAAAGTATTTTCAATCAGTCTTTTAATCTCTTCCTTTGGTAAAAAGCCAACAAATTGGTTCACATTTTCATTATTCTTAAAGATAGCTACAGTAGGTATACTTGAAATGTGATATTCATCTGCTAAATCTACACTTTTATCCACATCTACTTTTATAAAATTAACTTTCTCTTTCATTTCCTCTGATAACTCTTCAAGAATCGGTGCTATCATTTTACAAGGTCCGCACCAGGTTGCAAAAAAATCTACAACCGTAACGCCACCTTTTATTTCATTTCCGAATTCATTATTATCTACTATTTTCAT
Protein sequences of DBSCAN-SWA_5 >NZ_CP043998|2472234:2476717|2472234_2472594_-|WP_012058440.1|DBSCAN-SWA MGLKENIKNRRLELNLTLEDVSKRLSISKPTLQRYESGVISNIPSDKIEKLAVILETTPSILMGWDENKIKTRLQLSEELECLLKKYNSLDNLGKHTVNTVLEMEFNRCSQLNNQDRIF >NZ_CP043998|2472234:2476717|2476408_2476717_-|WP_023975156.1|DBSCAN-SWA MKIVDNNEFGNEIKGGVTVVDFFATWCGPCKMIAPILEELSEEMKEKVNFIKVDVDKSVDLADEYHISSIPTVAIFKNNENVNQFVGFLPKEEIKRLIENTL >NZ_CP043998|2472234:2476717|2473599_2474961_+|WP_023975158.1|DBSCAN-SWA MADIKWIKLATNMHDDEKMKLIDAMPNRDTIHYVWIRILLLGGKLNANGKVFLSEGKPLTAKMLAVLFSRPLEDIKIVLKVLSNFGMIEIASDKVIRIVNWDKHQNIEGMERVREQNRKRVENHREKKKEEKNAAKSNKEETQEDKVLEEFIDLEENQDLDESVELEKTNELEGKKDYSKNSTIEENKALGKNDILENLETSEEASGNTYINDKTNITTSEAGNNITVEIIDNNEDISNNILETDDNNCIVTKNNSNVTQNKCNVTVTQQNKKEKKNKNKKEKKEIDKDKNIEGKKNNGFDINNKGSACDDEVSQSNLSKKHNNTKSESGEEEDINLKALELMHYHEKITGKPGGCDYVALRSAIDIHGEKMVKMAMDVGFEKNCPDIKYAIGVLKNWRRDGYPEDHMEVKKNGVRSNGKSNRADKNEFAGFKPKEPRKLTEAERKRIEANLI >NZ_CP043998|2472234:2476717|2475750_2475993_+|WP_012058444.1|DBSCAN-SWA MKSSGIVRKLDPLGRIVIPKEIRKVLEIYEGDSMEIIKVDNGVVVKKYIKGCIFCGSDKDVVEFNGAVVCDGCRKALGQD >NZ_CP043998|2472234:2476717|2472912_2473110_+|WP_023975159.1|DBSCAN-SWA MILVNELKGKIKAKGYTQEKLARELGMSPKTLGNKLNKGIFGSNEIDKMIKLLDINNPIEIFFNK >NZ_CP043998|2472234:2476717|2475010_2475637_+|WP_031275900.1|DBSCAN-SWA MQPLAVACECRKIEKLKNEWKYSGINVEQSKLTFSSFEVWNNASQRMKDTAAAYCTDFDEIKDTRRNSILLCGQVGSGKTHCSIAVALNFLKQRIKVLYMPYRDVITKIKQNMIDEEYYTRTISKYQLCEVLLIDDLFKGKINETDTNIMFEIINYRYLNFLPIIVSSEFSIDRLLTFDEGVASRIYEMSKDYVVEIEKDIRNNYRLK |
6 | Clostridium_virus(16.67%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_6 |
3634003 : 3642401
Sequences of DBSCAN-SWA_6
Nucleotide sequences of DBSCAN-SWA_6 >NZ_CP043998|3634003:3642401|DBSCAN-SWA TTTAATCTTGACCTAACGCCTTTTTGCACTCACTACAGACAAGTGCATCTCTAAATTTTGAAATACCTTTATCATTTCCACAAAAGATGCAGCCTTTACTGTATTTCCTAACAACTACCTCATTATCAACCTTAATTATTTCCATAGAATCGCCATCATTAATTCCAAGTACCTTTCTTATTTCTTTTGGTATTACAATCCTTCCAAGTGGATCAAGCTTTCTCACTATTCCTGATGATTTCATTTTTACATTCTCCTCTACAAAATTATTTTCCTTTATATGATTAAATTATTTCTTGCATATCTCAAATTTTATATACTTACTAAGCCATCACAACCACAATATATTGAGATGATTTCTTGCCTTGAATTACTCTTGTCTTTTCTTCTAATATCTTTATTTTCTTTTCTAAAATTAGATTTCCAGGCACATGAGAGAAAATAATAAATCCAAAATGCCATGATTATTTTTCATCAGGCAATCTACTGATGTAGCATGATGGGAAATAGGCTTGGCAGATGGACTGATTATTTTTTTGAATGTGCCTTATAACCGAGCTTAATGTTCTCTCCAGTAAGCTTTATATTTTCATTGATAATTTCCTCAATGGCTTTTTTATCCATATCCTAAACCCTCCTTAAATTTTCTTAATTTCTAGTCAAAATTTTGACCTTTTTAACCCAATAATTGTTGTGTATTGAATTTATCTCAATCTATAATTATAGATAAGCATATTTACAAAGTTGCTAAAACTTTAAGTTCGTATCTTCACTAGAAATCATAAATATATTTGTGGAGAAAACATTTGAAAATGAGCTGTTAAAGGTTCTTAGCTGTAGGTTGTTCTATTTTAGCTTGTCAAACTGAAAGTTGGAGCATGCTAAAGTGGATACAACCTGCTGCTTAGAACCTTCAGCGATATTTTCATAGCTTTTCGGAATTAAAATATTTATGATTTCGGTAAGTTTCCACTTAAGTTTAGTTTTAAAGTGGGATATCTATATTTTGTGCTGAACTTATTTTAATCTATAGTTATTGTGTATATCTTTCTCAATTTCCACCACATAATCTTTACTCATCTCATAAATTCTTGAGCCAACAGCTTCATCAAAATTTAGTAATCTTTCAATGCTAAATTCACTGCTGACTATGATTGGCAGAAAATTCAAATATCTATAATTAATGATTTCAAAGACTATATTTATATCACTTTCATTGATCTTGCCCTTAAAGAGATCATCAATGAGTAAAACCTCACATAGCTTATACTTTGAGATAGTCTTAACATAATATTCTTGGTCAAGGATGTTTTGTTTTATCTTAGTAATTACATCTCTATAAGGCATGTACACAACTTTAATCTTCTGCTTTAACAAATTTAATCCAATTGCAACACTGAGATGAGTTTTGCCACTGCCTACCTGACCACAAAGTAGAATGCTATTTCTTCTGCTATTTCTAATTTCATCAAAATCAGTGCAATAAGCTGCTGATGTATCCTTTGCTCTTTGAGAAGCTCTATTCCACACCTTAAAATTAGCAAAAGTATGCTTTGTCATTTCAACATTAATTCCTGAATGCTTCCATTCATTTTTTACCTTCTCAATTTCTCTACACTCACAGCTAACTGCAAGGGGCTGCCTATTTTCTTGTGGAATAAGTACCCACCCAGTATCACAGCATTTATCACACTTATATGAGGCTTTCTTCAGCTTTTTTTCGCTGCTCACCAGTAAGGCTTCGTGGTTCCTTTGGTTTGAATCCTGCAAATTTGTTTTTATCTGGGTTACTATTCTTTCCATAGCTTCTATTGACATTTTTCTTTACCTCCTTGTCATCTGGATACCCTTCTCTTCTCCAATTTTTCAGTATGCCATCAATGTAAGTCATGTTAGGTTTATTAGCTTTTAATGCTATATCTATAGCCATCTTTACATATTCTTGACCATGCACCCCTATAGCTAACTTAAGTGCGCCTAAATTAAGAACATTAGGTATTCCAGCTATTAGTTCACAATACTTAGCAAGTTCAATAGATTTAGAATTTATATCATCTTCTTTCTTTATCTCTCTATCTTTATTATTCTCATTCTTAATCTTGTTCTTATTCTCTCTCTTATTCTGCACCGTTACAGTAACGTTACTTTTATCATCTGTAACGTTACAAGATTTTTTTGTAATGTCACACATATCATTTGTAACTTCAATGCTATATTCTTTACTTTCAGCACAGCTATGTTCTTCAATTTCAACACTAGTTTCTTCACTTTCATTAACTACAGCTTCAAGTTGTTTTTTCTTTTCTCTATAGTTTTGAACTCTTTTTCTATTTTGATCTCTAACTCTGTCCATTCCCTCAACATTTTGGTGTCTTTCCCAATTCACTATTCTAATTACGTTATTTTCAGCTATCTCAATCATTTGAAAATCTGATAACACTTTAAGTGCAAGTCTTATAGAAGCTAGAGGCCTTGAGAATATTGTAGATAACATTTCATCAGTATATGGGATATTCTCATTTAGATATATAAGTCCATTAGCATTAGTTTTGCCAGCTTGTATAAGTAATCTTATCCATAAATAATGAATAGTATCTCTCTCTGGCATTGCATCCACTAATTTCATCTTTTCATCATCATGCATGTTAGTAGATAACTTAATCCATTTAATATCTGACATGTTTCTCACTCTCCTCTAAAAGAAATAGTCTAAATTTTTTAATTCCATCCTTAAGGGTATTGATTCCATGGAAATACACACATCTATCTGATGTCTAGCCGTTCTAATACTCCCATATATTCTGATTGGAGCTACGAACGGCACGACCCCAGATAAGTTCAACTAAATTCATCTTAAATATAAAATTTAACATGAAAATTTTTACTTTATATATACTCTAAGTATTTTTAAATCCAAACTGTAAACCTCTCAATAATTTAATTTCCATTAATAAATTTATCTGTATTAATGTCTTCTAAATAAGCCCTTTGCATTTCAGCACTTAACCTTCCCCATTTTGAAAGCATATTTCTCATTACTGTTCTTTTAGCCATAGCTTTATAATCATTATTCCATCTTGGATCTCCCTTAAAGGAATTATTCCTAAATGCATCCATATTATCTTTGCTCCAATAAACATATTTTCTAAAGCCATTTACCATCTCAAAATATCCTGCATATCCTATAACTGCATCTGACTTTTTGGCTGAAACATCTATATCAAATTCTTCAGTTAATGGATTCCATGATTTTAGCTGCCCTTCATAAACTTCAATTACATTTATAGCTTTATACTCCCCTGTTCTAAGTAATAATTGAATATATCCCTTATATCCAAGCTGAAAATTTGATTTCTTTTTATAAGGAATAATCCAGACATACTCCAAATTTTTATCGATAGATAAATCTAAGGAAGCTGCAATCATACATGCATCAATTATTGATCTAGGCTCACATTCAATAAGCAGAGAACCCAAATCTGCGCTTTGGTGTGAATCGCTTGCTCCTAAGGCGTTAGGTACAGGAATTTCCTTAACTAAATTTATTATTGAATTTATATACTCAAAAGCTTTATCTTTTAAAACTTCTGTAAACTTTGACTTTATCTCATCACTATTTATTAAATTTTTGAATATAGTTTCTTGAACATTTACTGTGCTTTGCTCTTTTTCAATCAATTGATTTTTTAAACTGCTATTAGTTGCCATAAACACAACACCCTCTCTTTATTTAGATGAATAATTAGTTTAATATGTTTTATCATTAACTAACTTGAAATCTCCTTAATTTCAAATCTTCTGCTCATAGACTGTCTGCAAACTTCTTTATAAATCTCAGGATATTTTTCTTTTAAAACCTTACTATCTATCCTATTTGAAGTTACTCCCTTCCAAATTACTTGGAACTTTTCCACAATTCCTTTTTCAGCATTTCCAAGCTGATTTTTTAGATTGTTTTCTATAACTTTAAGAGATTCATCTAGAATCTTCATTTGATTTTTTATGTTTAAATATTCATTTATCTTGTCCTTATACTCTTCCTTCAAGTTAACTTCCAACGTCTTATCTATACTTTTAAAAGTCTTACTTAAATATTTACTAGCGGCTTCACTTCCATCAAGCTTTGGTGGAATTCTTTTTTGAACATGATTAAACCAAAAATCTTTTTCAGCTTCAACTATCATAGAAATTAATTCTTCATCACGTTTAATCTCTTTATACACAAACCTTTGTCCACCTATTAATGCCGCTATATAACAAGTATCAGCACCCAAGACCTCCATATAATGCTGACATTGAAGTATGTGACTAGGTGGAATTTCTTCACCAGCCCATTCCTTTGCTCTAAAGGCATTCACCGTTGTGCATTCCAGGAGTGAGTTTTCACCAACAATTCTTCTATCAATATTACCCATCATGAATTCATGAGTCTTATGAACTAACTGCCTTTTATCCTTCCTTACCTTCTTGCCACTCCTTATTGAAAATTCTCTAGCTACAACTTCCTCTAAGGTATTCCCAAAGTAAGATGATTCACCAGACTCCTTCACTTCTCTAATTTCTTCTGTCTTGTCCACATAAACTTCAAAAGGACTTTTCCACCTGTTAACTCCCATAATAGCTCCAACATCAGAACCTCCAATTCCCTTTTGCCTTTCCTTAAGCCATTGTAATTTATCCATTCCCTTCACCTCTCAATGAAACATTCTAAATTAAAATTAATTTCCACTAAAATCATCAAGTCTAATGATTTTATTTTCATCTACATGTTTAAAAATTTAAAAACTGTACATAACTATAATTAGTTGACTGTTCGTTCCACGCAACACTTAGCTTAAAAAATTAAACACCTTGTGAAGAAGCAGCTATACTGTAACTAAGATCAATTCACCTATGAAAAGATGCATAGCATAATAACAACTTTTCATCTTACAAAAGGTACTCCTATATAAAACGAGCATGAAACATAATTATAAACTTTTCATCAAAATTAATGTCATTTTATCTTTAATAATTAATAGTTATAAGCTGTTAACTTAAAAATATATACTTTCTGTAATTAATTTTTTTGTCATCGCAATATTTAATTATATTTGTGATAACCTTTATTCCTGCTTTACCGTTGCCATTTGCTATTCTCCATATGGTACTTGGTGCTAAATCAAGATTCCGAGCACATTTATTAAAGTTACCATCAAACTGCTCATCAACAAATTTTTTAACTGATTCTTTTGTTGTATTCATATATTAACCTCCTATTCTCCTTATGCAACATTCCTTACACGCAATATTATAATCCCACTGTTTCTTAAACGCAACACTTTTTTTACTATTTTTTTACTTATCATTGCATTTACGCAATAAATTATTTAAAATTAATATAATATATGTACGCACATCCGTTCGTTGGATATTAATAATAAATTTAGACTCTCACTTATCACTTAAAGGAGTTGATTATATGTTTAATGCCGAATTACTTAGTAGTTTAATAAAAGAAGCACAAGGTGATATTTCTTTAAACAACTTTGCTAGTCAATGCAAAATAAGCTCTAGCACGTTATCAAGAATTATAAACAATAAAAATTCTTGCCCACCAGCGCCTAGCACATTACAAAAAATTGCTTCTGTTGCACACAATGGTGTCACTTATGCTGACCTTATGGCCGCTGCTGGTTATATAAATGATGGCGAAACACCTGTAGAAATTCCAGATGCAACTAATACTGTTTTATCTAAAAAAGATGAAAGAGACATTGCAAAAAGAATTGAAGCATTAAAAGAAGATTTACTAAATGGTGAAGGGCTTATGCTTTCAGGAAATCCTATGTCACCTGAAGCTATTGAAAGTTTAATAGAAGCCTTATCTTCTGGAATACGTCAAGCAAAGATTGCAAATAAAAAATATACACCTTTAAAAAAACGCAGCTATGCTGCAAATAAATTCATTTCACCTAATAAATATAAGAAATAGGAACTTTCATAAAACATAGATAAGAATGAGAACTTTTCATCTAAGATATTGGTTAAATTATAGATATTCCTATGCATATATAACTTTATAATTATTACAAAGCAGGTACAGAATGCATTTTAGGCCTTCTGTATTTGTACTACTTTACTATGGTAACTATTACGGGGGTGGCTTTTTTGCATTTTATCGAGGGATTATTTTCAAAATTAGTTAAAAAATATAACACTACAGATGTTTATGAATTATGTAAATTAGAAAAAATAACATATAGGGAACTAGATCTCCATCCTGAAATCAATGGAATTTATCAATATGTTATGAGAAATAGAATTATAACAATAAACCAAAATCTTAGTCCTGAGTGTAAGAGAATAACATGTGAGCACGAATTAGGACATGCTATCCTTCATAAAAAATATAACTGCACTTATCTAAAAACAAAGACCTTCTTCAATGTTAATAAATTTGAAAAAGAAGCTGATATATTTTCATCTTTATTTGAAATTCCATTTATATCTAAAGATATATTAATAGGAAAAACATTAGACGAAGTTGCTCGTGAGTTAAACGTTTCAAGGTATTTATTAGATCTTAGAATAGGCATCTGTAATTTTGATTAGTAATTTAAATGCATGTAATTTTCTTTATTATGCTCATATTATATAAGGTAGGTGTTTAGTTAATGATAGGAAGAATTCGTAAATCTTCTTCTGAACTCAATATTTTTGACTTATTTGATGATGAGTTATATATAAATAAAATCATACAACTCCTTAAAGAAAAGTATGAAATTAAATTATCAGATTTTTATGGAAATCCCATCTTTGAAGAATTTCAAGATATTATTATAAACAATACAAGAATAAATATTTCTTGGGATCACATGGCTGGCTGCTCAATCATGGCTTTAGATTTAGGTGGAAATGAACTTATCGAAGAAATAGCAGATTATTTAAATACTCATCATTAATAATATTATTTACAAGGAGATTGACATGGAAAATGCAGAAGAATATTGCAACCGAATTATTCAAGAAATGATTAAATCTTATGAAGATACTGGAAACAAAGATGGCGTTAGTACTCTGTGTAGAGAAGCATATTCTTTATACATGAATAATGAATTGCCTAGTGACTATTATGGCAAAATATATTATACAGCCATGGAAATAGGTCACTATAAATACTAATTTAAGCTTTTCCCTAACCAGTATAACTTCAAGACATCTACGATAAAAATGAGGTAATAAAATGAAAGTAGCTATTTAAGAATTCCAATGGAAGCAGATGTGAAAATTCAAATGGAACGGTAGATCAAATAGATAATCTCCTTAATAAAGCCCCTTTAGATCCAGATCTCGGAGATATCATTATTACTAAAATAAAAGAACTTAAAATCGAATTGGAACAACTAAATAATGATCTAAATGTTTATAATGATAAAATTAAACAAATAAATGTGGATTACCTTCTCAGTATATTGCATGTATAAATTTATTTTATATAAAAAGAAAATATATAAATGTTTCGTGGAATTTTCTTAATCCTCAAAAACATTTATATATTTTCAATTAAGTTTCTAAATTTAATTTGAATGCAATGATTCTAATATACCCTTGCTAAGTCCTTCTGCCAGTTTTTCTTGGTAACTGTCTTCATTCAAAAGCTGATCCTCTTTTTCATTAGACATAAACCCCATTTCAACTAGTACCACAGGAACTTTTGACCAATTAAATCCAGTTAAATCTGATCTCTCAACTACACCTCTATCAGGCATTCCTACGGTAGAAACTAAATCTTGCAGTATTGTTTTACCATATACTTTACTTATTGCACTAATATCTTTTGCATATCCTATTGGAGCTGGAATTAACATAGATGTTCCCCTAGCACTTTGAGAATCCGCAGAATCACAGTGTATTCTTATAGCTAAATCAGCATTGTTATTATTTCCAACCTCTGCCCTTTCAATATTGCCTGGGCTTTCAGAATCTTGTGTTTTTGTCATTATAACTGTAACATTGTGTTGTTCTAACAAAGTTTTTAATTTTTTAGATACACTCATAGCAACAATATATTCTGGCGTTTTTGTAGAAATTCCTTCCGCTCCACCTGGATCTTTTATTTTCATTACATCAGAATCTGGAGACTGTTTCTCCATTCCCTTATTTCCATTAGAAGAATGTCCTGGATCAATGACTACTATTTTTTTATTTACAACCGTTTGCTCTTCCACATTATTTGAGGAATCATTATCTTCTTTTGGTGCATCACTATTATCCACTGTTTTATTTTCAGTTTCTATAGCATCACTTTTTTCAACTTCTTGGGTATTATTAACTTCCTTTTTCTCTATATTTGAATTACATCCAGACAAAGTTATAAATATTAAAATTGATAAAACTCCTGATAAAATTTTATTCAT
Protein sequences of DBSCAN-SWA_6 >NZ_CP043998|3634003:3642401|3640658_3640946_+|WP_039773552.1|DBSCAN-SWA MIGRIRKSSSELNIFDLFDDELYINKIIQLLKEKYEIKLSDFYGNPIFEEFQDIIINNTRINISWDHMAGCSIMALDLGGNELIEEIADYLNTHH >NZ_CP043998|3634003:3642401|3635019_3635820_-|WP_154861642.1|DBSCAN-SWA MSIEAMERIVTQIKTNLQDSNQRNHEALLVSSEKKLKKASYKCDKCCDTGWVLIPQENRQPLAVSCECREIEKVKNEWKHSGINVEMTKHTFANFKVWNRASQRAKDTSAAYCTDFDEIRNSRRNSILLCGQVGSGKTHLSVAIGLNLLKQKIKVVYMPYRDVITKIKQNILDQEYYVKTISKYKLCEVLLIDDLFKGKINESDINIVFEIINYRYLNFLPIIVSSEFSIERLLNFDEAVGSRIYEMSKDYVVEIEKDIHNNYRLK >NZ_CP043998|3634003:3642401|3634003_3634246_-|WP_039773558.1|DBSCAN-SWA MKSSGIVRKLDPLGRIVIPKEIRKVLGINDGDSMEIIKVDNEVVVRKYSKGCIFCGNDKGISKFRDALVCSECKKALGQD >NZ_CP043998|3634003:3642401|3636939_3637710_-|WP_039773556.1|DBSCAN-SWA MATNSSLKNQLIEKEQSTVNVQETIFKNLINSDEIKSKFTEVLKDKAFEYINSIINLVKEIPVPNALGASDSHQSADLGSLLIECEPRSIIDACMIAASLDLSIDKNLEYVWIIPYKKKSNFQLGYKGYIQLLLRTGEYKAINVIEVYEGQLKSWNPLTEEFDIDVSAKKSDAVIGYAGYFEMVNGFRKYVYWSKDNMDAFRNNSFKGDPRWNNDYKAMAKRTVMRNMLSKWGRLSAEMQRAYLEDINTDKFINGN >NZ_CP043998|3634003:3642401|3641561_3642401_-|WP_039773550.1|DBSCAN-SWA MNKILSGVLSILIFITLSGCNSNIEKKEVNNTQEVEKSDAIETENKTVDNSDAPKEDNDSSNNVEEQTVVNKKIVVIDPGHSSNGNKGMEKQSPDSDVMKIKDPGGAEGISTKTPEYIVAMSVSKKLKTLLEQHNVTVIMTKTQDSESPGNIERAEVGNNNNADLAIRIHCDSADSQSARGTSMLIPAPIGYAKDISAISKVYGKTILQDLVSTVGMPDRGVVERSDLTGFNWSKVPVVLVEMGFMSNEKEDQLLNEDSYQEKLAEGLSKGILESLHSN >NZ_CP043998|3634003:3642401|3640152_3640596_+|WP_031275648.1|DBSCAN-SWA MHFIEGLFSKLVKKYNTTDVYELCKLEKITYRELDLHPEINGIYQYVMRNRIITINQNLSPECKRITCEHELGHAILHKKYNCTYLKTKTFFNVNKFEKEADIFSSLFEIPFISKDILIGKTLDEVARELNVSRYLLDLRIGICNFD >NZ_CP043998|3634003:3642401|3639463_3639976_+|WP_051144914.1|DBSCAN-SWA MFNAELLSSLIKEAQGDISLNNFASQCKISSSTLSRIINNKNSCPPAPSTLQKIASVAHNGVTYADLMAAAGYINDGETPVEIPDATNTVLSKKDERDIAKRIEALKEDLLNGEGLMLSGNPMSPEAIESLIEALSSGIRQAKIANKKYTPLKKRSYAANKFISPNKYKK >NZ_CP043998|3634003:3642401|3640971_3641166_+|WP_039773551.1|DBSCAN-SWA MENAEEYCNRIIQEMIKSYEDTGNKDGVSTLCREAYSLYMNNELPSDYYGKIYYTAMEIGHYKY >NZ_CP043998|3634003:3642401|3639033_3639246_-|WP_023973792.1|DBSCAN-SWA MNTTKESVKKFVDEQFDGNFNKCARNLDLAPSTIWRIANGNGKAGIKVITNIIKYCDDKKINYRKYIFLS >NZ_CP043998|3634003:3642401|3637769_3638684_-|WP_039773554.1|DBSCAN-SWA MDKLQWLKERQKGIGGSDVGAIMGVNRWKSPFEVYVDKTEEIREVKESGESSYFGNTLEEVVAREFSIRSGKKVRKDKRQLVHKTHEFMMGNIDRRIVGENSLLECTTVNAFRAKEWAGEEIPPSHILQCQHYMEVLGADTCYIAALIGGQRFVYKEIKRDEELISMIVEAEKDFWFNHVQKRIPPKLDGSEAASKYLSKTFKSIDKTLEVNLKEEYKDKINEYLNIKNQMKILDESLKVIENNLKNQLGNAEKGIVEKFQVIWKGVTSNRIDSKVLKEKYPEIYKEVCRQSMSRRFEIKEISS |
10 | Clostridium_phage(28.57%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_7 |
3843747 : 3856287
Sequences of DBSCAN-SWA_7
Nucleotide sequences of DBSCAN-SWA_7 >NZ_CP043998|3843747:3856287|DBSCAN-SWA TTTATCTTAAGATCTTGGTTTCAATTACAAAAAAGAAGAAGCTTATTAAAGCTCCTCCTATTGCAGTTATAAACCACTTCATCATATTGGTTAATGACTTAATGTTTTCACATAAATTCTTTAATTCTATCTTAAGTTCTCTTGAATCTTGCTCAAGCTTATCTAATCTCTCTCCATGATTATTGAGTCTTCTTTCATACGTTTCAATTTTATCCTTAATCAATTCTTCATTCATGTATTACTTCCTTTCTATTAAAAATAAGTGTTGGCTTCCTACCCTATTGAATATTAAAACTGGCTAATGTCATCAATATATCATAGGAAATAAAAAAAGATTATTTAGCTTAATAATAATCTTTTACCTATATTTTCATTTAATTTAGTACATTATTTTTTCCTATGATGCAGTACTTTCTGCATTAGTTGGAGCTATTAAATTTGTAAATTCTGCATATTGCTCTGTAGTAATCTTATCTCCAGCTAAAAATATATCTATAGTTTCTTGAATTGTAGTAAAATCTTTAGTTTCCTTTTTTAATTCTGCATTAATCCTATTTCTCAATATGTTTCCTAATAATGTTTGCATTGTGGTCATTTTACATCCGCCCTTCTAATATCTTATTTTTTTCTATTTCTAATATAGAATTTTCTAATGTTAATAATGTTACTTCATCTTGGATTTGTGCATACAAAATAATATTTTGAATTATATCATTTTTGTCAATCTGTTCTCCAGTAATTGTCACTTCTTTAGCTTTTAATTCATCCTCGGTATAATATACTACCTCAAGTCTATGTTTTTCTTGCTTTATATCAACCACACATGATTTGCTCTTTACTAATATGTTGAATAATTGTCCATATTCTAATTCTATTTTTCCTAACATATCATCTGATATACTCTTCAATACCGAATACTTTTGCTTATCGTCTTGTATTGTAGGTATCTTTATACCTGCAATATTAAATTGTTCATCTGTAAAGCACAATATATCTCCAGTAGATTTATTATAGTATACTCTACTATTTAGTTTAGTTTGTATCATATTACACCTCCAAATTAACCATAAAAATAATACATAATTACATAGCTATTTACAACTGAATCACCTGTTTCAGCGACAATTATATCCGTTAATCTTGATGCAGCACTACGATACCCACCATTAGAACTGTAATATTGACCAGCTACCAGTGAATCATATGAATTAACTGTAAAATAAAATTGTGTTTTCCCTGTTGCACCGTTAGCCCAATTATACACTATATCGCCTGTTATATACTTAACATTTGTTGCAGGAATTACTCCTAACGGTATACTATTCCTGGCATATTTTATTCCACCACTAACAGTCCCGCTTGCTATTAAATTCAAACCACCTAAACTAGTTGGAGTTGCAATACCAGCCAATCCAAATAATTCCTTCCCGCTAACAATATTTGCAGCTATAAAATTGGCATCTGTAATTGTTACATTATCATTTGCACCGTCTCTATAACCTTCACTAGCTTTTAGTTTTAAAGTTGTTCCACTAATACTACTAGATACGCATGCTGTATCACCTGATCTATCCACCATTGTACCCGTTACTTTTGCTCCGTTTTTATAAGCCGTTTCTCCTGCTAACATATTATTAGCAGCTACTGTTGCATCTGCTGTATCTACGACACTTGACTTTCCGGTAACACCATCTATAGTAATACCTGCTCTTATATTTCCAGAAATTAATAAAGATAAATCAAGTCCTCCAACTATACAATTATCAGTATCATTACTAAAAGTTTTATTTTTACGTACATCAGATGCTAGTGCAGTACCTTCTGCACTAGCTTTGATAAAAAAACACTCACTGGTTGAATTATACCAAACCGTATATGCCTTTCCTGATATCAAGTTTGGTGATGTTGTCGTTCCTGGTTTATATAATTTTTTACCATTTATAGTTGTTGCAGCTCCACCATTATTGATACTTGCTATAAAAGTTATTGGATATCCATTTACTAACGATCCTTTAATAGTAAGTGTTATTGCCGTAGCAGATCCGCCTGCTGTTTGATACACCATATCTGACAATGTTGAATCGACATTTGAATTCCCAAATTTTACAATTAACGCATCAGTATGTGGGTAATATATATTTCCTGTACTGTCTTGTATTTCTATATTTTTTGTTGCCATTTGTTTTCCCCCTTAAATAGTCTTTAGAAATAATTTAACTTGTGTTCCACTTGCATAATCATTACCAACTTTAATACTTGCTCCGTCTGCTCCTGCTGGCCCTTGTGGCCCAGTTGCACCAGTTGGTCCAGCAGCACCTGTTGCGCCTGTTGCTCCTTTTAAAGATATTGAATATACCCATTTTGCTGTGCTTGCATCTCCTGAAGCTGTACATACATATACATTTCCTGTACTTGTATTGAAATATTGATCATTTACTAAAGCTGAAGTTATACCACTTCCAGTAAAAACTGTTGCTGATGTGCTAATTCCTGTTATTGCAGTCCCACTATACCATTGAGATCCTCTAATTCCAGCTGCTCCTTGTGGGCCTTGTATACCTTGAATTCCTTGTGGTCCCTGCATGCCTGTTGCCCCACTAAGGTCTGTTATATATGTGTATGCTGTTGAACCCTTAACATATAATTTTGCATTATCAGCATCATTAACATTTCCAGTGTCTATTAACACAAAGCTCCCTATTTTTAATCCATCTGTGGCAAATCCTGTATTCATAGCTGAAACTGAACTATACACTTTTGCGATTGTAAAGGGCTCTCCAGCTGGTCCTTGCACACCTTGTATACCTTGAACTCCTTGAGGGCCTTTCAATAATCCTCCATCTAACTTTTGTTGAAATGTTTGTCCATCAGCAAATGTAACTGCATCTGCGCTTGTTAATACATTTACTTCCTTTAATACTGCACCTGTACTTTCATCTAATAATTGAATCCTTACTTTATCTAAATTTGCCATTATATAATCATCCTTTCTTATTGAACTATTTTAATACCCATATTGGGACTTACCTTCACATTGTCTGCAAAGCCATTGGTTATTTTATCTGTTATTTTAAAATACAAAGTATCACTTGTTCTGTCAGGTATAGCTGGCAGTGTCTCATTAATATACAATTGCATTTTCCCTGATAACTTAGCACTGACTTCTTGAAATTTTGACTGTAATATTTGTATATCTCCTTTAGTTGCAACTACTACATTTGGATCTATCTTAAAATCTATGCTGCTTGCATTGCTGACTTCTAATACAATTTTTATGAATAAATCTTTTGTGCTTCCTTCTGAAATTGCTGGTTTGTAGGTTTCTGATAATTTGGTGATGGCGATCATATCTCCAGCATCATCAAAAATACCAGCTTCTCTGATGAAAAACCCTCCATCAGCTGCTGGTATTACTGTTTCTACAACTATCCAGTTTTCATTTGATTCATCGACTGAAATTGCACTTATATTTCCTGACCAAACTTCTTTTACAATTGAGGTTTGATCTTCTGAAGGTTCATAATATGAGCCGTTTCCATCTCCAACTTTTAGGGTTTTAAAATTCACTTTACTGCCCGAAACTGCTGAAGCTGATAATTTTTTTCTTCCTAATTTTGTTAACATTGTATAAAATTTTTCTGCCAAATTAATTCATCTCCTTACTAGGATATATTGTTATGCTTTCTGAACCTGTACATTGGCTGATACCACTTTCCATTTTTTCGCTGAATTCAATATTTTTAGCTCTCCATGGATAAACTGTCATAGTCTCTCCCATAATTGATCCTAAGCCATAGTACATTTGTGATTGATTTACGGATATTAGTTTATATTTAACGCCTAAATGTGCTGGCTTAGCTATTCCTATTGAGTCGTACAAGCTATCTAAAGCATAAGGAAAGCCTGTATCACTTATTAACTTTACTTGGAAATAGTATTCTGGATTATTCTGAATTATTTCAGCTTCTGAAACAAAGCTCTTACAAATCTGCTTTATTACTTCAACTGTTGTTGTGCCTTTAGAGTTAAGCTTTGCTAATACCCTTGCTCTTCTTTCTTCAATTGATTTAGCATTATTTGTAGTTATACCAACTCTTTTTTCCCATAGTTTCAAGCCCCATTCAGTTGCAGTTTGGGGCAAAATTTGCAGGAATAAATCTGAAATATCCAAGCCTAATTTATCAAATCTACTTCCGTAAGCATTAAATATTTCCTGGAAAATATAACTATTTTTTATTTCATCAATAACATAGCTCTTTAAATTATCTACTGATTGGTTTCCACTGTTTTCACTTGAAGTACTTGCACTCTTAATATTTTTAAATGCTTCTAAATCAGCTATATTATTCATAAGTTATCCCTCGCAAAGATGCCTTATCTTCATCAGCTGTAATTATATTTTTAGTATCATTGTTTATTTTCACTGAAGATATATCATTAACTCCAGCTGTCATTACTACCTTTGCCTCAACAGTATTTATTTTTACAACTCCGCCTACTGGAATTGTTTTAAAATAATTATCAAGAGACTCTTTTATATTGTCTTTAACATCCTTTATATCAAATCCATCTAATGCAGTAAGACCAAGTATATTAACATCAATTTTTAATGGATTTACTGATACTACAGTTACTGTTGCCCCTATTGGTGCCTTTCCACTTCCTTCACCATCTGCTGGATCTATATATTGTTTAACTTTTTGTACTATAGTATCATCTAGCTGAATTCCATTATTTCCTGCAACTATTACCTTTACAGTTCCATTTCCATTCATTCCATTGCTTTTATCCCAAAGAGGTTTTACTTTCACATACTCAACACCAGATATTTGAAGTGCCCATTTTTCATAATCATATATATTCCCACTGCTGCTTTCTTCTCTCTCTTTAGATATGATTCTTTCCAATAAATTTTCACTAGTTTCAGTATCAGTTCCACTAGTAGTTGCACTTTCATTTTTCACATTAGTTATCCCATTTATTTTAATAGGTATTTCAACTATAGCATTAGCTGGAACATTATATTTGGAGCCTATTTCTATTGCTTTAATTCCTAGTGTGCATTTTCCATCTTTAATTTTTCCTTGAGATGTCACCTTATATTTTAAGCCTTCGACAGTTTGAACTATGCTGTTTTCATATATTATAGAATTTTCTAACCCTAAAAAAGTCACTTGCCCCACTGAATATAAGCCTTGCTTCCTCTCTAAGCCATGTCTTGCTGCATCTTTATCTATAAATTTATCATATTCCTCTTGAGGAACTTCTGGAGCTTCCTCTCCAAATACTAATTTCAAAATTGTATCTAGAGCTTTATAATAATCTGCTATAGTTTTAGCAGATGGAGCAATAGCATCATATACAAAATATCCTTCACTTTTAGATATTCCAGAATCAATACTATCTAACATTTGTGATCTTAAATTTTCTTCAGTATTATTTTCATACATTAATTGTCACCTCCCCACAATCAGTTATTGCTGTAAAAGTTATGGTTAGAATATCATTGTTTTTATCCACCTCAAAGTTTTTTACGCCTAATATGTGCTGATTTTCCTTTAAGCATTCTAAAGTTAACCTTTTAGCCTCACTATCAATTAAACTTTTACTGAACCCTTTACCAATTATTTTTTCAAATTCATTGCCATATGCATCGCTGTAAATTGGATACTTTCCTTTGCTGGTTTTAAGAGCTTTCCATATCCATATTTTCAATGCTTCTATTCCTTCTACAATTTGAAATTTTCCATCCTTAAGTTTGAAATCATTTTTCTCAAAATCCCAAGCATATTCTTTAGGAATATTTGCAGCTTTCTCTTCTTGTGAAAATGCCGCAAGTTTATTTGCCATGTTTAAATTTGTTTCGGGTAATATACTAGCCACTACACTTCACCACCTTACAAAGTATTATCCATGTTTGATTATCCTTAGTAGGCAATACTGCTAGCTCATCACCAATTTTAATTGTATCTAGAAAACTTACTGCAGTCCCATCAGTATTTGTTACTGACGCTTGTCTTGAATATCCCGATAATAAATAATCAGCTATATAAAGATCATCCTTATATAGCTGCAAATCATTTGTTTGAATTATTATTTCAGGAGGTGGAGAATTAACCTTAGCAATGCATATGGAAAGAGGATTACTTTCTGCACCTTTTCTTTTCATTAAATTTAACATTTTTACATATGGATCCATTAGCTATCAACCTCCTGTAAATCCATTTTGTTGCTTAAGCTTACTGTAAGCTTCATTGTATATTTTCCTGTTCCACATTCCCAGGTGTGAGTATCAGCATTAACATAAAGAGTTGCATCTTTCAATATGTCTAAATACCATATTTTTGCCTTAACAGCATACCCCGTTAAGCAGCTATAATTACCAATAGCTTCAATTTCTATTTCTTCACTGAAGCCATATAACTTATTTTGTGCTACTTCATATGTGTTGTTATCATCTTCCACTGTGTACGATGTCTGGAAAACACCATATCTTTTTACAAGCTCTGAATTTTCCACTTGATCTACGTAGTTATTGTTAACGTCAAAAATTTTCACTCTGTTTATCATATTTTCTAAAGAATCTTTGTAACTCATATCTATTATATTGTTATTGTACAAATCCGCATTAGCAGATTGAAGCAAATAATCTGATATTATTTGCCCCTTCTCAATTACATTAAACGTATCAGCTTTCATAATAGGAACATATTGTTTTCCATTTTGCTTGCTAACTTCACTATAGCACTGCATTATTATGCTATAATAACTCTTATCTGGACATAGCCTATCTATTGGAACGCCAGTTGCCACTACATCACCAACTTTGATGTTTAATTCTTCACAAGCTTTATATACAACGCTTTCTGGAGACATATTCTTAATATTCATGCTTGTTGATGAACTCATGATAAACCTCATATAATCATAGCAAGTAAAAGTTTCCTCCTGATTTGAACTTCCTAAAGTCCTATCTACAACTTCACCTCTAAAAATTTCTCCATAAGTTTCATCTACAATCTTTATTAATGTTCCTGGACATATTTGAACTCTAGGCTCATTTATATCTGATAAGGAATATAACATACTAAATGAACATTTTCTTGCAGGCTGATCTATTGATGCTGATAATTCAATACTTTTACAAACTGGAGTTATATCTGTTAAAAGCCAGCCTTCATATAAGCTGTATATTTTAATCATATATTACCACCCAATATATTATTTACATCAGTTAAACTAAAGCCTGCCCCCCACTGACCTACAATTTTTTCATTTAACTTCAATGCCTTATACTGCTTTAATGCTAGAGTAAAGTTTATATCTCCAGTTCCATCATTTTCTCCATACTCAAAAGTTTCTATAGAGAATAGATCATTGATATCTGTGTTTGTAAGTATCACTCTTATTGGCTTTTTACTTTTTCTCCAAGCTTCTATTTGTGCAACGCACTCAAATGGTTTAGGAATATCTGAATATGCACAAAATTTATATTTATGAGCAGGAAAAAAGCTCTCAAAAGATATTTCCGAAAGCTTTGAATCTCCTAATATATTTATTTCTCCAATTGATTCTACACTAACTACTGAATTGTTGTTAGCTAATTTAAGTGAATAACTAGAAGGTGGTACAGGAAGTTGTAACCATGTATCGTCTTGATTAAACCAAAATTCTATCATTTAAAAATACCTCCTAACTCATTCCAAGAGCTGTTTGACTCAATTTATTGGCTAGAGCTGTTGCAATTTTATCTATATCGCTTTCTTCTCTGATTATTATAGAATCTGCAAGCTTTGCTATTGTTATTGCAAATCCATTTTGTGTGCTATCATCTTTAGTTGATCCAGAAGCGCCTTTAAATCCTTGGCTGCCAGTTTTGTTTCCTGATGATAAGTTTTTATTTACACCAGTTTTTATTCCTACTGCAAGATCTTTAATTGGTTCAGTTACTAAATGAGTATTAACTTTAATACCACGACCCATGCCTTTTAGAAAGTCTGGCATCCATGTTTCATAATCTGTAAGGGGTCCTTTATCTGGTACTGAGAAATGAAGAAATGCTCTTATCCTATCTGCTACACCTGAAATAGCATCTTCAATGTAACCTACTGCTCCTCTTATACCATCTACAATTCCCATTATCATATCTTTACCCCAACTAATAGCAGTTTTAGCCACATCTTTAAATATTGAACCTATTGCATTTAATATATTTCTTATAATATCTATGGCACCATTAAATACTGTTCCTACAGTACTTTTTATAGTATTCCATGCGCCTGACCAATCTCCATTTATAACTTGCATTACAGTTTTAATCACTCCTGTTATTACGTTAAGTACAGTCATGATTACTGTTTTAATTATGTTAAATGCTGAAGACACTACTGTTTTTATAGTCTGCCCATGAACATTCCAAAAGGCCATTATCATATTTAAAGCAGTGCTTATAACAGTTTTAATGGCTGTCATAACAGTTGTAATAGTTTGTTTTATAAGTGGCCAGTTAGAAATTACAAAGCTTATTAATTTACTGAAAATTTGAATAGCAAATGTTAGTACTGGCTTTAATATAGAGTTCCAAACTGATTGGATTCCTTTAAATACATTTTGAATTATGCTTTGTATTTGTGGCATATGTGCCTTAATAAAGTCTATTACTGATTTAACTGTTGCAATTATAACTTTAATCGTACTTGTTACAATTGAACCTACTTTAGGCCCGAATAAACTAGAAAAAAATACTCCTATTCCTTCTGATGCACTTCCTGTTTTCTTAAATACATCAATTGCTGATTTTACAGCACTTGATATTTTGTTAAAAACAGATACAACAGAATCTCTTATCCCACCAAAATTAGTAGCAAATGCTGTTGCCAATAATGCGATTACGCCGATAACAATCATAATTGGAAGTGGAAATTTAGTAAACAAACCCATTACTCCTGAAAGAGGTTGAAAAAATGTCCCTATCATATTTTTAAACATGCCAAAGCCACCAATTAATGTGCCAAAGACAGCTGTAAGACCTAAAGCCTTTGCAATTATGTCCATTATTGGTTGTGGTATATTTTTTATTGATTGGGCAACACTCAAAAATACTTCTGCTACTTTTTTGGCATAAGGCAATAAAGCATCACCTATACTGCTTTTAATTCCACTTATAGTATTAGATAATTGTTGCAACTTACCAGCATAAGTATCTGCTGCCGCTGCTGCCTGCCCACCAAATTCTTTATTTAATTCGTTTAAAATTAGTTTCTGAGCCCCAGCCGTATCCCCAGTTTTTTGCATTGCTTCTACTTGTTTTTTTTGTTGATCTGTGAATGTAATGCCAATTCCGTTTAAATCTGCAAGTCCTCTAGTTGGATCATTAAGTGCTTTTCCTAATGCTTTGCTAGCTTCAACAGGATCAGTTCCCATTTTTTGTGCCATATCTACCATTGCTTGCGAGGCTGCTGGAAATACATCCTTCCCTATGTTAGTAAATGTGAGTAGCATGCTCTGACCTGTTTTAATCGCTCCAGCACCAAATGTAGATGCATTACTCAATTGCGAGGCCATTTTACTTACTTCTTCAGCTGTGAATCCTGCTGCTCCACCAGTAGATTTAATTGTTTGTGCTAAATCTTTATTAATTTTTTCTGATTTTGCGGCTCCATCGACACAATCCTTTAGAAAACCAGCCATTGAATTTCCAACTTCTCCAATAGCCTGCCTAGCTGAATTTAAACCACTAGCTATTTTATTACCGAATCCAGCTGATTTAACTGTTTCATTCACCTTCTGTGAAGTTTCTACAGCTTTTGCGCCTAAACTCTCAATAGATTCTTGAGCCTTTTGAACTCCGATAATAACGTTTTGCGTAAGATTTACTACTGTATTAATCTGAGTCATATTTATTTGGTTCATATTAACTGTATTCGCCATTAAACCTCACCCCCTTGTAGGGATTCTATTTGCTTATTTTTATCTTCAACTTCTTGTTCAATAAAAGCACTGATGATAATCTTTTCTCCAAATCCCCTATTAATTGTTTCTGCTGGCCACTTACCATGAAGTTTCCAGCAGTAATATAGAAGATTAACAGTTTCATCAGTGCTTATGAGTTTTTTATATCTTCTTTTTTGTTAGTAGATTCTACTCCTGAAATTTCAGTTACAGTATCTGCTAAAATATCAACTTCACCAGGTAAGAATATCTTATTCATAAGTTCCTTTGGTGTTGGCGCTTTGAAATGTTTCATAAGCTCTTCTGATCTAAGCTCTGGCACTCCTGCAAGAACAGTTTCTATTTTTGCCTGTGCTGTTGCAAATCCTTGAATATTTCCTTTCTTATCTACTTGAAGTACTCTTTCTTGAATTTCATTGTATCTCTCCATAGAAATAGCATTGCATTTAAATGTAATCTCCATATTTCCAAGTTTAGCAAGCTTAAGTTTTACCTCCTTAGAAGGCACCTCAATTTTACCAGCATCTATTTTTAATAATTGTTCAACTAAATTCATAACTTTCATCTCCATTTCAAATTTAATAAAACTATAGATAAACAATGTGTAATCTAAGCTTATTCAATAGCTAAGCAAAGTAAGTAACATATTGTATTCCAGTTTCTCTGTAGCAATTTTCTAAAATTCAATTAACGTTTTTCTTAGTTCCTCTAACTATGAGTCTAGTTATTAAATTGCATATCTATAATTCAGTAATTTTTTATTTCCTTGTCATTACTTTATTTTTACATACCTTAAGCAAATATCTACATTAGAAATCGAAAATATTTTTGTGTAGCAGGCATTTGAAAATAAGCTGATGAAGGTTCTTTGTGACAGGTTGTTGCGCTTTAGCTTGTCCATTCGAATTATTGGAGCATGCTAAAGTGAGTACAACCTGTCATTTAGAACCTTCCAGCGAAATTTTCATAGTCCTGCGTAACAAAAATATTTCCGATTTCGGCAGACTATTGCTTAACTATAGTTTTATTGTGGTTCTATTAAGTCTAAGAAATCATAGCCTGAGAATGTAAATGCAATTGTATCTTCAACATTCTTTTTAACTTCCCAGTCTGCCAATGTTAATTCATCAAAAGTAACATCTTTAAGTACTACTCTTTCAGCCCCTACTGAATCCGGATCAGCTAATTTAGAAATTATAGTACATACAGTTTGCTTTCCTTGTTTTATGTTATCTTTCATTAAAATTGCCATTCTTGATGATATATGATGCAATTTCAATGTTCCCTTTCCTTCTATACCTGTAACTTTACTTCTCTTCCATAAATCCCTTGTAAAATTAACATCTACCTTTGTTAAAGTGACCTTTGCTTGAAGAGCTGACACCTCTGAAACATATTCTCCGTTAATCCAGACTTCTCCCCAAGTCCCATTTATAATATCCTTTGCTTGTGGCATAATAATTACCTCCTAAATATATATTTGAAATTTAATATCTTCTATTGCATCTAAAATAACAACTTGTCCTTTAACAAAAACTTGTGAACCTGTGTTACTTTCTTTTATTTCTTGATCTTTCATAGTTGAAATATCTATACCTTGGCTCTTTAAGTACGCTTTTTGTGCATCTAAATCAATTTCTGCTCTATTTTGCCCTTCAATACTGCTATCAAGCAATCCATCAAGTTCTAAACCTTCAAAATAGCCATTAATAGCTGCAATGAGCAAGCACTTATGATCATAATCATTTGGATATTTTCCAATATAATTATCTTCAGCTGTTGATTTAATATCATCATGTATTAAATCCATAATATCTACTATCTTAATCTTTTTAAAATCCTCGCCTTTATTTTCAATAGTAGTTACAAAGCTATTTACAGCTCTATCAATTTTAACTTTCTTTCCATCGTTAATTAAAATTAATTTTCCTGAATCAATTGCCGCATCTCTTTCTTCTTTCTTTAGATGCGGAACATCTACTACTTCTGCAAGTGGTGCATAAGTAGCACTAATATTTAGCGAAGTTCCTGCTAGCATCCCTGCAATTCTTGAACAGTATTCTGCATCAGTATAAGTTCTGGCTGCTGTTTTTATGTCGTCTGTAGCAAAGTTAATTACTCCTTCACTATCAGCTGGACAATGTGGAAGTACTGCTTTAACTCTAATATCCTTAGCACTTCTTAATTGTTTAATCCATGTAGCAAAATCTGTTGCTCTTGAAGTAATATTTGCCTCTGTATCAGCCTTTCCATCTGTAGTCTGACCAATGCTTGGAACTACTACATAATCCCATTTAATAGTTTCTAAGTAATTTTGAGCTTCTGAATAATTAGCTGCATCTGGTGCTTCTATATAAGCAATCACTTGTTTTGGTGGATTTTGATATCCTATCATGGCAAGCTTTATTTGTTCCTTATTAAAATCTGATAAAGCTTCCGGAATTTCATCTATAGTATCCATTTTTATTGGATTACTATAATTTGCTGGCATTGTATCCTTTAATATAAGTACAACTATGCCTCTTGTTCCTCTCTTTGCTGCAGTTATTCCTGCTTCCTTAAAAATAATGTCTACTGATGGTTCTCCCAT
Protein sequences of DBSCAN-SWA_7 >NZ_CP043998|3843747:3856287|3846737_3847391_-|WP_039769242.1|tail|DBSCAN-SWA MAEKFYTMLTKLGRKKLSASAVSGSKVNFKTLKVGDGNGSYYEPSEDQTSIVKEVWSGNISAISVDESNENWIVVETVIPAADGGFFIREAGIFDDAGDMIAITKLSETYKPAISEGSTKDLFIKIVLEVSNASSIDFKIDPNVVVATKGDIQILQSKFQEVSAKLSGKMQLYINETLPAIPDRTSDTLYFKITDKITNGFADNVKVSPNMGIKIVQ >NZ_CP043998|3843747:3856287|3849188_3849629_-|WP_039769234.1|DBSCAN-SWA MASILPETNLNMANKLAAFSQEEKAANIPKEYAWDFEKNDFKLKDGKFQIVEGIEALKIWIWKALKTSKGKYPIYSDAYGNEFEKIIGKGFSKSLIDSEAKRLTLECLKENQHILGVKNFEVDKNNDILTITFTAITDCGEVTINV >NZ_CP043998|3843747:3856287|3853848_3854253_-|WP_039769227.1|DBSCAN-SWA MNLVEQLLKIDAGKIEVPSKEVKLKLAKLGNMEITFKCNAISMERYNEIQERVLQVDKKGNIQGFATAQAKIETVLAGVPELRSEELMKHFKAPTPKELMNKIFLPGEVDILADTVTEISGVESTNKKEDIKNS >NZ_CP043998|3843747:3856287|3849621_3849945_-|WP_012059569.1|DBSCAN-SWA MDPYVKMLNLMKRKGAESNPLSICIAKVNSPPPEIIIQTNDLQLYKDDLYIADYLLSGYSRQASVTNTDGTAVSFLDTIKIGDELAVLPTKDNQTWIILCKVVKCSG >NZ_CP043998|3843747:3856287|3849944_3850949_-|WP_039769231.1|DBSCAN-SWA MIKIYSLYEGWLLTDITPVCKSIELSASIDQPARKCSFSMLYSLSDINEPRVQICPGTLIKIVDETYGEIFRGEVVDRTLGSSNQEETFTCYDYMRFIMSSSTSMNIKNMSPESVVYKACEELNIKVGDVVATGVPIDRLCPDKSYYSIIMQCYSEVSKQNGKQYVPIMKADTFNVIEKGQIISDYLLQSANADLYNNNIIDMSYKDSLENMINRVKIFDVNNNYVDQVENSELVKRYGVFQTSYTVEDDNNTYEVAQNKLYGFSEEIEIEAIGNYSCLTGYAVKAKIWYLDILKDATLYVNADTHTWECGTGKYTMKLTVSLSNKMDLQEVDS >NZ_CP043998|3843747:3856287|3845937_3846720_-|WP_039769245.1|DBSCAN-SWA MANLDKVRIQLLDESTGAVLKEVNVLTSADAVTFADGQTFQQKLDGGLLKGPQGVQGIQGVQGPAGEPFTIAKVYSSVSAMNTGFATDGLKIGSFVLIDTGNVNDADNAKLYVKGSTAYTYITDLSGATGMQGPQGIQGIQGPQGAAGIRGSQWYSGTAITGISTSATVFTGSGITSALVNDQYFNTSTGNVYVCTASGDASTAKWVYSISLKGATGATGAAGPTGATGPQGPAGADGASIKVGNDYASGTQVKLFLKTI >NZ_CP043998|3843747:3856287|3844342_3844792_-|WP_039769249.1|DBSCAN-SWA MIQTKLNSRVYYNKSTGDILCFTDEQFNIAGIKIPTIQDDKQKYSVLKSISDDMLGKIELEYGQLFNILVKSKSCVVDIKQEKHRLEVVYYTEDELKAKEVTITGEQIDKNDIIQNIILYAQIQDEVTLLTLENSILEIEKNKILEGRM >NZ_CP043998|3843747:3856287|3848089_3849196_-|WP_039769237.1|plate|DBSCAN-SWA MYENNTEENLRSQMLDSIDSGISKSEGYFVYDAIAPSAKTIADYYKALDTILKLVFGEEAPEVPQEEYDKFIDKDAARHGLERKQGLYSVGQVTFLGLENSIIYENSIVQTVEGLKYKVTSQGKIKDGKCTLGIKAIEIGSKYNVPANAIVEIPIKINGITNVKNESATTSGTDTETSENLLERIISKEREESSSGNIYDYEKWALQISGVEYVKVKPLWDKSNGMNGNGTVKVIVAGNNGIQLDDTIVQKVKQYIDPADGEGSGKAPIGATVTVVSVNPLKIDVNILGLTALDGFDIKDVKDNIKESLDNYFKTIPVGGVVKINTVEAKVVMTAGVNDISSVKINNDTKNIITADEDKASLRGITYE >NZ_CP043998|3843747:3856287|3843747_3843981_-|WP_039769254.1|DBSCAN-SWA MNEELIKDKIETYERRLNNHGERLDKLEQDSRELKIELKNLCENIKSLTNMMKWFITAIGGALISFFFFVIETKILR >NZ_CP043998|3843747:3856287|3855165_3856287_-|WP_039769225.1|terminase|DBSCAN-SWA MGEPSVDIIFKEAGITAAKRGTRGIVVLILKDTMPANYSNPIKMDTIDEIPEALSDFNKEQIKLAMIGYQNPPKQVIAYIEAPDAANYSEAQNYLETIKWDYVVVPSIGQTTDGKADTEANITSRATDFATWIKQLRSAKDIRVKAVLPHCPADSEGVINFATDDIKTAARTYTDAEYCSRIAGMLAGTSLNISATYAPLAEVVDVPHLKKEERDAAIDSGKLILINDGKKVKIDRAVNSFVTTIENKGEDFKKIKIVDIMDLIHDDIKSTAEDNYIGKYPNDYDHKCLLIAAINGYFEGLELDGLLDSSIEGQNRAEIDLDAQKAYLKSQGIDISTMKDQEIKESNTGSQVFVKGQVVILDAIEDIKFQIYI >NZ_CP043998|3843747:3856287|3851438_3853643_-|WP_069187745.1|DBSCAN-SWA MTQINTVVNLTQNVIIGVQKAQESIESLGAKAVETSQKVNETVKSAGFGNKIASGLNSARQAIGEVGNSMAGFLKDCVDGAAKSEKINKDLAQTIKSTGGAAGFTAEEVSKMASQLSNASTFGAGAIKTGQSMLLTFTNIGKDVFPAASQAMVDMAQKMGTDPVEASKALGKALNDPTRGLADLNGIGITFTDQQKKQVEAMQKTGDTAGAQKLILNELNKEFGGQAAAAADTYAGKLQQLSNTISGIKSSIGDALLPYAKKVAEVFLSVAQSIKNIPQPIMDIIAKALGLTAVFGTLIGGFGMFKNMIGTFFQPLSGVMGLFTKFPLPIMIVIGVIALLATAFATNFGGIRDSVVSVFNKISSAVKSAIDVFKKTGSASEGIGVFFSSLFGPKVGSIVTSTIKVIIATVKSVIDFIKAHMPQIQSIIQNVFKGIQSVWNSILKPVLTFAIQIFSKLISFVISNWPLIKQTITTVMTAIKTVISTALNMIMAFWNVHGQTIKTVVSSAFNIIKTVIMTVLNVITGVIKTVMQVINGDWSGAWNTIKSTVGTVFNGAIDIIRNILNAIGSIFKDVAKTAISWGKDMIMGIVDGIRGAVGYIEDAISGVADRIRAFLHFSVPDKGPLTDYETWMPDFLKGMGRGIKVNTHLVTEPIKDLAVGIKTGVNKNLSSGNKTGSQGFKGASGSTKDDSTQNGFAITIAKLADSIIIREESDIDKIATALANKLSQTALGMS >NZ_CP043998|3843747:3856287|3847392_3848097_-|WP_039769239.1|DBSCAN-SWA MNNIADLEAFKNIKSASTSSENSGNQSVDNLKSYVIDEIKNSYIFQEIFNAYGSRFDKLGLDISDLFLQILPQTATEWGLKLWEKRVGITTNNAKSIEERRARVLAKLNSKGTTTVEVIKQICKSFVSEAEIIQNNPEYYFQVKLISDTGFPYALDSLYDSIGIAKPAHLGVKYKLISVNQSQMYYGLGSIMGETMTVYPWRAKNIEFSEKMESGISQCTGSESITIYPSKEMN >NZ_CP043998|3843747:3856287|3844143_3844341_-|WP_039769252.1|DBSCAN-SWA MTTMQTLLGNILRNRINAELKKETKDFTTIQETIDIFLAGDKITTEQYAEFTNLIAPTNAESTAS >NZ_CP043998|3843747:3856287|3854721_3855153_-|WP_012059574.1|tail|DBSCAN-SWA MPQAKDIINGTWGEVWINGEYVSEVSALQAKVTLTKVDVNFTRDLWKRSKVTGIEGKGTLKLHHISSRMAILMKDNIKQGKQTVCTIISKLADPDSVGAERVVLKDVTFDELTLADWEVKKNVEDTIAFTFSGYDFLDLIEPQ >NZ_CP043998|3843747:3856287|3850945_3851425_-|WP_039769229.1|DBSCAN-SWA MIEFWFNQDDTWLQLPVPPSSYSLKLANNNSVVSVESIGEINILGDSKLSEISFESFFPAHKYKFCAYSDIPKPFECVAQIEAWRKSKKPIRVILTNTDINDLFSIETFEYGENDGTGDINFTLALKQYKALKLNEKIVGQWGAGFSLTDVNNILGGNI |
15 | Clostridium_phage(81.82%) | terminase,plate,tail | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_8 |
4312655 : 4321845
Sequences of DBSCAN-SWA_8
Nucleotide sequences of DBSCAN-SWA_8 >NZ_CP043998|4312655:4321845|DBSCAN-SWA TATGTGTTTATTTGTTATAACAAGATTTGGAGGCTTTAGAGAAATATTTAGTAGGGACAATTATAGTAAAAGAGACTATTTAATTGCTTGTATAGTATTTTCTCTATTCGCCATAATAGCTAATTATACAGGACTTAATGTTGAAGGCTCTCTCGTAAATGTTCGGACAATAACTATAGTATCTGGAGGTATAATATTTGGACCAGTAGTTGGAATTGTAGCCGGAGTACTATCTGGTGTACATAGATATTTAATAGATGTAGGGGGTATAACTTCAATCCCATGTCTTATAAGCAGTATAACAGCAGGAATAATATCTGGATATATTAACAGAAAGATTCAACGAAACTATAGATGGATATCTGGAATAATAGCAGGGGTGTTTTCTGAAACCATTACAATGATTCTTATACTTTTATTAAGCAGACCTTTTTCTTTAGGCATTGATATAGTATCTAAAATAGCATTACCAATGATACTAGGTCAAATTAGTGTAGGCTTTATTGTTCAATTAATTCAAAGTATAGAGGACGATAAAGAGAAAATAGCTGCTAGACAAGCAAAACTGGCACTTGATATAGCTAATAAGACTCTCCCTTACTTTAGAAATATAAATAGTGATTCTCTAAATAAGATATGCACTGTCATAAGAGATGATATTGATGCTGACGCAGTATCAATAACTGATACAAAAAATATATTAGCTTATATCGGAGTTGGAAAAGAATATTACAACATTGGACACGAAATAATAACTGAAGTAACTAAAGAGGCAATAAATAGCGATAAAATAATTATAAGAAATAATGGACTGCAAGATAAAAGCTTAATGTTAAAGTCTGCAATTATAATACCTCTTAAAGTGAAGAACGAAGTTATAGGAGCCTTAAAAATATATTATAAAACCTCTCATAGAATAACTTATTCTCTACAAGCTCTTGCTGTTGGACTTTCTCAAATTATATCAACATTAATGGAAGTATCAAAGGTTGAACAAATGAAAACAATGGCTAATAAAGCAGAGCTTAAAGCTCTTCAGAGGCAGATAAACCCACACTTTTTATTTAATGCCCTAAACGCTATAACTTCCTTTATTAGAATAGATCCAAATAAAGCAAGAGAACTTATAATAAACCTAGCTAGTTATTTGAGATATAATTTAGAGATAAACAGTGAATTTATAGATATTAAGAAAGAATTAAAACAAGTTAAAGATTATATAGAAATTGAGAAGGCGAGATTTGGAAATAAATTAAATATAGTCTATGATGTAGATAATGTAGATATCGATATACCAAGTCTTACAATACAGCCTCTAGTAGAAAATGCTATAATTCATGGTATTTTAAAAGATAAGGGAGCGGGCACAGTAAAAATAATTGTAAAGGATAGAGGTGAAAAAGTAAAAATCTCTATAATAGATAGTGGTATTGGCATAAGTGAAGAGGCAATTAAAAATATATATAAAGATGCAGTGCCTGAAAATAAAATAGGACTTTACAATGTACATTTAAGAATTAAACTTATTTATGGGGAAGGACTTATTATAGAAAGATTAGAAAAGGGAACTAAAATAGAATTTTACATAAAGAGAAGGTGATCATATGAAAGCTATAATAGTTGAAGATGAGTTTTTAGCACGAGAAGAGCTTAAATATTTTATTACAAATTATAGCAATATAGAAATAATAGATGAATTTGAGGACGGAATAGATGTACTTAAATTTATCCAAAATAACGAAGTTGATGTTATATTCATGGATATAAATATCCCCTCATTGGATGGTGTGTTACTTGCTAAAAGTATAAGCAAGTTTTCTAAAAAACCATATATAGTTTTTATAACAGCCTACAAGGAACATGCGGCAGAAGCTTTCGAAATAGAAGCTTTTGACTATATACTAAAGCCTTATTCAGAATCCAGAATTGTATCTATGCTAAAAAAATTGGAGGACCTTAATAAATATAAAGAAAACAACTTAAATAAAGTTAACATACAAAATAAGATAAATTTATGGAAAAACGAAAAAATAATTGTAGTAAATATAGATGATATATATTACTGCGTTGCTGAAGAAAGAATAACCCATGTTTTTACGAAGAAAGACGAGTATTCAGTAAGCTTAGGTATAGCTGAATTTTATGACAGCCTGCCAAAAGATATTTTCTTTAGATGCCATAGATCTTATATTGTTAATATAAATAAAATAAGAGAAATAATACCTTGGTTTAATAATACTTATAATTTAAAACTTCAAGATATAGATTATCAAATACCTGTAAGCAGAAGTAACATAAAAGAGTTTAAACAGCTTATGAATATATAAATGTATTCTATGTAATTTTCTATGCATTTCGTTCAATAAAGAATAATTTTATATTACACCGATTTATAATGATGGTAATGAAACAGACAACATAAAAAGTTAAATTTCAATAGTGTTGTAAATACCTTCTAAAATCTACTTGTTAATATATTAATTAAGGAGCGATGAACGATATGAATGAAAAACATGAAAACCGTTGGTTAATAGTTTTAGGTACAGTAATTGCCCAATTGGGACTCGGAACAATTTATACTTGGAGTTTATTTAATCAGCCTCTAGTAGACAAATTTGGATGGCAGTTAAATAAAGTAACTATTACTTTCTCTATAACTAGTTTTGCTTTAGCATTCGCTACATTAGCTGGAGGTAAACTTCAAGAAAAACTAGGAATTAGAAAACTTATATCAATTTCAGGTTTAATCTTAGGGATTGGTCTAATATTAACATCTAAAGTAACTTCACTAACAATGTTATATGTTACAGCTGGCATAATAGTTGGAGCCGCAGATGGTATTGCATATCTTACATCACTTTCAAATTGTATTAAGTGGTTTCCAGAAAAAAAAGGACTTATCTCAGGAATATCAGTTGGAGCCTATGGAACTGGAAGTTTAATATTTAAATATATTAATGGAAGTTTAATATATAGTAATGGTGTTTCAGAAGCATTTTTATATTGGGGAATTATAGCTATGATATTGGTTGTTATTGGTGCCCAGTTATTAAAAGATGCTCCAATAGTAAGTTCTATTATTAATAACACTAATAATAATTCAAATGAAAAAGATTTTTCAGTAAAAGAAATGCTTAAGACTAAAGATGCGTACTTTTTATTTTTAATATTCTTCACATCTTGCATGAGCGGTCTTTATTTAATAGGAATTGTTAAAGATATCGGTGTTCAATTAGCTGGACTTACACCTGCTGTGGCAGCAAATGCAGTAGCTATGGTTGCAATCTTTAATACAGCTGGAAGAATTATATTAGGAGCTTTATCAGATAAACTTGGCAGATTAAACGTACTAATTTTTACCCTTACTGTTACAACTGCTTCAGTATTTGTTTTAAGCTTTGTACATTTAGATTTTATAATTTTCTTTATATGTGTTGCTTCAATTGCATTTTGCTTCGGCGGAAATATTACAGTATTTCCTACTATCGTAGGTGATTTCTTCGGTTCTAAAAATCAAACTAAAAACTATGGAATTATATATCAAGGATTTGGTTTTGGAGCTCTTTCGGGTTCGTTCATTGCAACATTAGCAGGAGGCTTTATACCTACCTTTATAATTGTTGGAGGTTTATGCATAGTATCGATAATTTTAACTTATATGATGAACCCAACAAAATTTAATACTTATTTTGAACGAACTCATAGATTAGTAGAAGAAATTTCATAAACATTGCCCAATTAACACATATATTGCATCTTCTCAACCATGAATAAATTTGCTAACAATTATTTCTTAAAAATTAAATATATTAGCGATATCTTGTAGGTATTTTTATTTTCTTTCTAATTTACTGCTTTCTATCAATTAAAATATTCTATGTTACTTATAGCGCGATTCACTATTAATAATTCTAAATATACAAAATAAAAGACCCACGAAAATCCAAATTTGATATGCTCCCTTTATAGTAAACAGTTAAAATAATAAAACTGTTTCTATAAAGGGAGTATTTTAATGTCAAGAAAAACGAAATGTTCTCTGGAAGAGAAATTGAAAGGAATTAAAGAATACCTATCAGGAGAAAAAGCAGTTATACAGATATGCGATGAGATGGGAATTCATAGTGCCACATTTTATGACTGGTTGAAAATATATAATGATGTTGGTGAAGCAAATTTAATAGTTTCTACAAAAAACAAATATTATTGCGATTCGCTTAAACTTAATGCAGTTAAAGATTATCTAGCTGGAAAAGGCTCTTTAAGAAATATATGCTGCACATATGAAATTTCATCTCCTCGTGTTCTCAGCGATTGGATTAAGAAGTATAATGGTCATAAAACAATTAAATCTCATAATAAGCAAGGGGATAGAATTATGACTAATGGAAGAAAGACTACTTATGAAGAAAGAATTGAGATTGTTGCATTCTGCATTTCGAATAATGATGATTATCAAGCTACTGCTGATAAATTTAATGTTTCTTATCAACAAGTTTATACCTGGGTAAGAAAATACAAAGCTAATGGATATGAAGAGCTAATAGACCGTCGCGGTAAGCGTAAAGATACTGATGAGATTACTGAGTCTGATAAATTATCCGCACAATTAAAACTTATTGAAGCAGAAAATAGACGTTTAAAGATGGAGATTGATTTCTTAAAAAAATTGAAAGAAGTAGAAAGAAGGCGATAAGCACTAAAAGACTCCAAGAATATAAATATATTTCTATAAAAGAATTACATGAAAAAAATGGCTATCAAATAGCTGATCTATGCAATTTAGCTGGGATTGCACGATCATCTTACTACAAATGGATTAACCGTTCAGAGACTGAATTAGATAAGGAAAATTCAATAATACTAAAAGAAATTGTTAAGCTTTATGAAGATGTAAATGGTATCTATGGATACCGTCGGATAACAATGAATATAAATAGACTCCTGGATAAACAGTATAATCATAAACGAATTTATAGATTAATGAAATCTATTAACATGAGATCAGTTATAAGAAAAAAGAGAAAGCATTATATTCAAAGTACTCCACAAATTACAGCAGAAAACAAATTAAATAGAGAATTTTATGCAAAGAAACCAAATGAAAAATGGTTAACAGATGTTACTGAATTTAAACTACTTAATGGTAAAAAGGCTTACCTTAGCGCAATATTTGATTTAGCAGTAAGTGCTAATCCGACTGCAAAGCCACTGTTTCATAGTGACAGAGGATTTCAGTATACTAATAGGACTTTCAAAGCTAAACTTGATAAAATCAAAGCAACTCAAAGCATGTCACGTGTCAGCAGATGTATCGACAACGGACCAATGGAAGGTTTTTGGGGAACTCTAAAATGTGAGATGTACTATTTGCAAAAATTTTATACATATGAAGAATTGAGACAAGCAATTGATGAATACATAGTTTTCTATAATACAAAAAGACTACAGAAAAACTTAAAAGGTCTGACTCCAATTGAATATCGAAATCAGACCTTGGTTTCATAATTTTTTGTTTTTTCATCTGTCTACTTGACAGGGGGCAGTTCAATTTTAGATTTTCGTGGGATTCATAATGTAGGCGAGGCATGGCCCTTAAAATCCAAAAAAGAATTATTTATTAACGCGAACTCAATCCATGTTTACATATAATGATTTAATCGATATTATTCTCATTAATTTTATACAGAAGGGCTCTCCGTGAAATCTGAAGGAGCTTTGCAGCCTGTGTGCGGTTTCCACCTGTTCGTTCTATAGCTTCGGATATATGACGCTTTTCAACTTCTAGCAATACTTCTCGCAAAGGTTTGAAAGAATCATCTCCCAGAATAATGGTACCATCCGCTTCTACATCTTCTACTTTTATGCTAAGTGGAAGATTTTCCGGCAAAATAACACGGGTGTTGCTCATAATAATAGCGTGTTCTACTGCATTTTCTAATTCCCTGATATTTCCTGGCCAAGAATAGTTACGAAAAATATCCAAAACCTCTGGAGCGAAAAACATACCATTCCGTCCTACTTCTACAGAAAAACGTTTTAAAAAGTAATCAGCTAGTAAAACAATATCTTCTCCCCTTTCGCAAAGTGGAGGTAAACATATTGAAACAACATTAAGTCGATAATATAGATCCTTCCGAAAAGACTTTTCAGATATCTCTTTATTCAGATCACGGTTTGTTGCTGCAATAATACGTACATTTGTATGAAATGTTTTTGTACCACCAACACGTTCAAACTCTTTTTCTTGCAACACCCTAAGAAGTTTTACCTGAAGATTTGGACTCATCTCCGCAATCTCATCTAAAAAAAGTGTCCCTCCTTCAGCCAGTTCAAATTTCCCTGGTTTTTGAAAAAATGCACTTGTAAATGCTCCCTTCTCATGTCCAAATATCTCACTCTCTAATAAACCTTCTGGAATCGAACCACAATTCACTTGAATGAATGGCTTTTCTCTCCTGTCACTCGCATAGTGAATAGCCTTAGCAACCATTCCTTTACCTGTCCCACTTTCGCCTGTTAGCAATACCGTAGCTTTTGAATTCGCTACTCGTCCAATTATTTTATATACTTCTTGGATTTTAGAGCTTTCCCCAACAATTTTACCTGGGGTCATTGCTGTCATTCCCATTTCTTGTACTTCCTGCGTAAGGTATACAACTTCTTTAGTCAATTGTTGCATGCGAATAGCTCTACTTACAATAATTTTAACTTCATCAAGGTTAAAAGGCTTTAATATATAGTCATAAGCACCGTGTTTCATAGCATTAACTGCAGTTTCCGAACTTCCAAATGCAGTCATAAGAATAATTGGCAAGCTAGGCTTAATTTTATGAATTTCATAAAATGCCTGCAACCCATCCACTTCTGGCATACGGATATCAAGGATAGCGACATCATAGTGATTTTCCTGCGCCATACAAAGTGCCTCTTTTCCATTTTTAACAGTATCTACTTCATATCCAGCCTTATTTAATGCTGTTTGAAGTACCATTCTCAAGCTTAGCTCATCATCAGCTACTAAAACACGAACACTTTCTGTCATATTGTAATCAGCCTTTCTTTTTATAAACATAATTATTAATCTACTTTAGTTATACAACATTTTACAGTATATATCAATATTCAACCAAATTCCATATTTAAATCAAATATGGAATTTAGTTGAATATAATAATAAACTTTTCACAAAAAACTTTTCATTTTTAAAAGAAAAGTATCTATAATTTAAATTTACTTATAGCTTCATGCAAGTCTTCAGATAGTTTTAGTAAGTTCTGGCTTGATCCAGCAATTTCATACATTGATGCAGATTGTTCTTCCGTTGTTGCAGTTACTGTTTGTGTTTTCTCTGCAGTGTCACCCCCAATTTTTTCTATCTTATGGATTGAAGTAACAATCTTATTACTGTTTGATGATATTTGTCCTACCGTCTCAGATACACTTCTTACTTGGGCTGCTACACACTCAACTGCCTGTGATATTTGACTAAATGCCTTACCTGTTGAATTTACAACATCAGTTCCATTTTTTACTTCTTGAGTTCCTTCTTTCATTACAATTATAACATCGTCAGTTTCTCTTTGAATATCGCCAATAAGTTTTGCTATCCGCATTGATGCTATACTAGACTCCTCAGAAAGTTTTCGTACTTCTTCTGCCACTACGGCAAATCCTTTTCCTGCTTCTCCTGCGCATGCTGCTTCTATTGCTGCATTTAGTGCCAAAAGATTTGTTTGTTTAGCTATAGTAGATATTGTATCTACTATCTGTCCTATTTCCTTTGAGCTTTCACCTAATATTTCAACTACATTTGCTGAGCTGTTAACAGCTTTTTCAATCTTAGCCATCTGGACAATTACTTCACTAACAGCTTTACTTCCTAATTGTGCAGCATTTGCAGTTTCTCCTACTGTTTCTATCATGCTGTCTGTGTTCTCTGCCATATTCTTTATTTTTTTATCCATCTCTTTAATTTCAGAAGAAGTTTCATTTACAACTTCCATTTGTTTATTAGCACCTTCTGATATATTCATAATAGTTGTTGCTATATGATTTGATGCATCCGAAGTTTGCTCAGAACTTTCAGTTAACAGCTTTGAGGCAGTTGCTACATTATCAGATGATATTGAAACTTGTTCAATTAATCCTCTCAAATTTATTATCATATTTTCAAAAGTTTTAGCGAGTCTGCCAAATTCATTTTTTGAATTAACTCTCACCTTTGCAACACTAAGATCACCATCTGAGATACATAACGCCATATCTTCTATAGCCTTTAATGGTTTTAGAATTTTATTTAACATAAATAGAAATAAAATTATTACTATTACTAAAGTGATTATTAAAGTTAAAGCTGATTTATAAATTTGTTGTGTAAGTGGTCCAGTAAATTCACTTTTAGACACTATCAGACTAACTGTCCAATTAATTCCTGAAACAGGCTTATATGATATATATTGCTTATTAAAGCCATAATATTCAACATTAGTTTCACCTTTGAACATATTTTCATATATTTCTTTTAGTTTTGGTTCAATTTTCTCATCTTTTAATGGATTATATTTAAGAATTAAATCTTTATTAGGATTTGCAATTACTGTTCCATCTGTTAAATTAAGTGAAGCATAACCATTTTGTTTTACTTTTATAGAAGATATGTATTGTACTAATTCATCAAGTTTTACATTACCACCCCAGATAGCTTTAATAGTACCATTAACCTTTATCGGAACAGCAACAACTACAGCCATTTTTCCATCTGCCTTACCAAGTAAAGGATCTGATATCACTGTTTTTCCTGTAGCTAGTAATTCTTTATAATAAGGTCTTTCGCTTATGCTCCCTGTTGTACCTGTAGCCGAATACCAATCTCCATTAGCATCTGAAAGCCAAAATGCACTATATAGAGGAAGACGACTTGTTTCAGAAGACATATAATCTATTATATCCTGCCTACTCCCATTCACAAAAACTGGGCAACTTGCAATACTTTCCATCTCCGACTTTCTAATATCAAGCCACAATCCAATTTCTTTAGCTGTTGATTGAGTGGTAGAAGTCATGCTTGTCTTCACTTCTGTTTCAACCATCTGTTTCGTTTCTATATAACTTGTAACCTCCAGTACGGTCATAGATAAACAAATAATAATTATACTAACAACCGTGAGTAAAGTCTTAATACTTTTCAT
Protein sequences of DBSCAN-SWA_8 >NZ_CP043998|4312655:4321845|4315154_4316381_+|WP_039773734.1|DBSCAN-SWA MNEKHENRWLIVLGTVIAQLGLGTIYTWSLFNQPLVDKFGWQLNKVTITFSITSFALAFATLAGGKLQEKLGIRKLISISGLILGIGLILTSKVTSLTMLYVTAGIIVGAADGIAYLTSLSNCIKWFPEKKGLISGISVGAYGTGSLIFKYINGSLIYSNGVSEAFLYWGIIAMILVVIGAQLLKDAPIVSSIINNTNNNSNEKDFSVKEMLKTKDAYFLFLIFFTSCMSGLYLIGIVKDIGVQLAGLTPAVAANAVAMVAIFNTAGRIILGALSDKLGRLNVLIFTLTVTTASVFVLSFVHLDFIIFFICVASIAFCFGGNITVFPTIVGDFFGSKNQTKNYGIIYQGFGFGALSGSFIATLAGGFIPTFIIVGGLCIVSIILTYMMNPTKFNTYFERTHRLVEEIS >NZ_CP043998|4312655:4321845|4318310_4319729_-|WP_039768479.1|DBSCAN-SWA MFIKRKADYNMTESVRVLVADDELSLRMVLQTALNKAGYEVDTVKNGKEALCMAQENHYDVAILDIRMPEVDGLQAFYEIHKIKPSLPIILMTAFGSSETAVNAMKHGAYDYILKPFNLDEVKIIVSRAIRMQQLTKEVVYLTQEVQEMGMTAMTPGKIVGESSKIQEVYKIIGRVANSKATVLLTGESGTGKGMVAKAIHYASDRREKPFIQVNCGSIPEGLLESEIFGHEKGAFTSAFFQKPGKFELAEGGTLFLDEIAEMSPNLQVKLLRVLQEKEFERVGGTKTFHTNVRIIAATNRDLNKEISEKSFRKDLYYRLNVVSICLPPLCERGEDIVLLADYFLKRFSVEVGRNGMFFAPEVLDIFRNYSWPGNIRELENAVEHAIIMSNTRVILPENLPLSIKVEDVEADGTIILGDDSFKPLREVLLEVEKRHISEAIERTGGNRTQAAKLLQISRRALLYKINENNID >NZ_CP043998|4312655:4321845|4316669_4317350_+|WP_011968065.1|DBSCAN-SWA MSRKTKCSLEEKLKGIKEYLSGEKAVIQICDEMGIHSATFYDWLKIYNDVGEANLIVSTKNKYYCDSLKLNAVKDYLAGKGSLRNICCTYEISSPRVLSDWIKKYNGHKTIKSHNKQGDRIMTNGRKTTYEERIEIVAFCISNNDDYQATADKFNVSYQQVYTWVRKYKANGYEELIDRRGKRKDTDEITESDKLSAQLKLIEAENRRLKMEIDFLKKLKEVERRR >NZ_CP043998|4312655:4321845|4314258_4314981_+|WP_039773735.1|DBSCAN-SWA MKAIIVEDEFLAREELKYFITNYSNIEIIDEFEDGIDVLKFIQNNEVDVIFMDINIPSLDGVLLAKSISKFSKKPYIVFITAYKEHAAEAFEIEAFDYILKPYSESRIVSMLKKLEDLNKYKENNLNKVNIQNKINLWKNEKIIVVNIDDIYYCVAEERITHVFTKKDEYSVSLGIAEFYDSLPKDIFFRCHRSYIVNINKIREIIPWFNNTYNLKLQDIDYQIPVSRSNIKEFKQLMNI >NZ_CP043998|4312655:4321845|4312655_4314254_+|WP_051144954.1|DBSCAN-SWA MCLFVITRFGGFREIFSRDNYSKRDYLIACIVFSLFAIIANYTGLNVEGSLVNVRTITIVSGGIIFGPVVGIVAGVLSGVHRYLIDVGGITSIPCLISSITAGIISGYINRKIQRNYRWISGIIAGVFSETITMILILLLSRPFSLGIDIVSKIALPMILGQISVGFIVQLIQSIEDDKEKIAARQAKLALDIANKTLPYFRNINSDSLNKICTVIRDDIDADAVSITDTKNILAYIGVGKEYYNIGHEIITEVTKEAINSDKIIIRNNGLQDKSLMLKSAIIIPLKVKNEVIGALKIYYKTSHRITYSLQALAVGLSQIISTLMEVSKVEQMKTMANKAELKALQRQINPHFLFNALNAITSFIRIDPNKARELIINLASYLRYNLEINSEFIDIKKELKQVKDYIEIEKARFGNKLNIVYDVDNVDIDIPSLTIQPLVENAIIHGILKDKGAGTVKIIVKDRGEKVKISIIDSGIGISEEAIKNIYKDAVPENKIGLYNVHLRIKLIYGEGLIIERLEKGTKIEFYIKRR >NZ_CP043998|4312655:4321845|4319874_4321845_-|WP_031276040.1|DBSCAN-SWA MKSIKTLLTVVSIIIICLSMTVLEVTSYIETKQMVETEVKTSMTSTTQSTAKEIGLWLDIRKSEMESIASCPVFVNGSRQDIIDYMSSETSRLPLYSAFWLSDANGDWYSATGTTGSISERPYYKELLATGKTVISDPLLGKADGKMAVVVAVPIKVNGTIKAIWGGNVKLDELVQYISSIKVKQNGYASLNLTDGTVIANPNKDLILKYNPLKDEKIEPKLKEIYENMFKGETNVEYYGFNKQYISYKPVSGINWTVSLIVSKSEFTGPLTQQIYKSALTLIITLVIVIILFLFMLNKILKPLKAIEDMALCISDGDLSVAKVRVNSKNEFGRLAKTFENMIINLRGLIEQVSISSDNVATASKLLTESSEQTSDASNHIATTIMNISEGANKQMEVVNETSSEIKEMDKKIKNMAENTDSMIETVGETANAAQLGSKAVSEVIVQMAKIEKAVNSSANVVEILGESSKEIGQIVDTISTIAKQTNLLALNAAIEAACAGEAGKGFAVVAEEVRKLSEESSIASMRIAKLIGDIQRETDDVIIVMKEGTQEVKNGTDVVNSTGKAFSQISQAVECVAAQVRSVSETVGQISSNSNKIVTSIHKIEKIGGDTAEKTQTVTATTEEQSASMYEIAGSSQNLLKLSEDLHEAISKFKL >NZ_CP043998|4312655:4321845|4317652_4318162_+|WP_167514426.1|transposase|DBSCAN-SWA MRSVIRKKRKHYIQSTPQITAENKLNREFYAKKPNEKWLTDVTEFKLLNGKKAYLSAIFDLAVSANPTAKPLFHSDRGFQYTNRTFKAKLDKIKATQSMSRVSRCIDNGPMEGFWGTLKCEMYYLQKFYTYEELRQAIDEYIVFYNTKRLQKNLKGLTPIEYRNQTLVS |
7 | Paenibacillus_phage(33.33%) | transposase | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_9 |
5638421 : 5647906
Sequences of DBSCAN-SWA_9
Nucleotide sequences of DBSCAN-SWA_9 >NZ_CP043998|5638421:5647906|DBSCAN-SWA TTTATTTAGGATTATTTATCTTACTTACATTCTTATAATAAAAAGCTGTTTGTTTTCCATCCCATTTCACATTCACGGTTTCTCCATTATTATATATCCTAACTACCTTTCCAACGGTCTTTATGCCCTGATATTCAATATTAACCTCATCGTCAATCTTAAATTCTATATCATTCGTTTCAACCTCTATTTCATTCTTTTTATCATCCATCTCATCAATTTCAAGATTAAATTCCGTATTAATGAGTTCATTTGAATGATAACTTGGCTTTTGATTATACTCTAATATCCATCCCTTAGGATTTATCACTACAGTTTTTTCTCCAGGTATTATTAAATTAGCATCACCTTTTCTTTTTATATATTGCTTAGGCTTAAGAGCTTCTAACTTTTGTTTTTGTTTTTCATTTATTTTCTTATCACTATTCACAATAAGTATTTCTTCTCCAGGCATGATTCCCACATCTTTAGGTAGACTAAACTCATTTATGCCACTTGCATTAAAATACAAAGTTTTATCGTCTAATTCAACTAACAATGCGCCACTCAGTGTCTTAACTATTCCGCTACAACTTTGTGAATATAATTTAGTGATTGCATAAAACTTATCCACTTCTTTAGTTTCTTCTTTAATAATAATTTTCTTAGGTTTTATAACTTCTATATTAGGTAAATCAAATATACTAATTTGTCCTTCGATGAAACATTCACTTTTCATATTCATCCTTTCAATATTTTTAATCTGTTTTAGTTCTTTTGTTCATAAAAAACAAATAAATTTTATCTATTTATGTAATGTTAAGCATTTATCCATATATCATTTATGAAAACAAAATGAAGGAGGTTAAAACTATGGCTGTAACTAAAACTATCGACTCAGTTTCTCTTAGTATCGAGGTTCAAAAAGCTCTAGATAAAGCTGGCGACCCAATTTATACCAAAAAAACTTTCTCAGGTATAAAAACAGATGCTACACCTGATAATGTATATGCTGTTGCAGATGCAATTAAAGGTGTTATGGAAGCTAACACTAGAGATTACTTTATCAACGAATCTTCTAGTTTAGCAAATGCTTAGGATCTTATTTTTAGGTAAATTTTAAAGATTGGAGGTAAATTAAATGGAATATTCTTTATCTATGACTTTTTTAACTGTAGCTGGTGAAAAAAGTACTTTAAGTGTTTCTGGAGTTAAACCTACTCTTACCAAAGATGAGGTTAACGCACTTATGGATACTGTGATTGCTAAAAATGTTTTCAAAACTAATTCTGGTGATTTAGTTAAGAAATCTGGTGCTCAAGTTACTCAACGACAAGTTACTAAATTTGATGTAGCTTAGTTTTGAGTAACATTATAGAAGCTTGTCTTTATATGATAAGCTTCTATTTTTTTGTATTTTCTTCATTAAGTAATTTGATTCATGGCTCTCTAATCTTTCTTCCTATGAAATCTATACCCTTCTGAAATACCATGGTTTTTATATTAATTTTAGTTTCTCCACTAGGTACAGTATACTTTTGTTCCAATATGCGAAAATAACCAGAATCTACAAACTGTTGATAAGGAATATTATTTTTATCCAAGACTTTCTTTTCTCTTAATAATGAAAATAGTCTATTTCTTCCCATCCCCTTAATTCCAAGAACCTTTGCAACATATCCCATTTCGATACTGTCTTTGGAGCCTGCAACATCATCATAAAATTGTCCTTTAGGCTCTAATAACTTTACTTTATTTTCGGCTTCAACCCTTGCTTTTTTCTCTTCCTTTAATTTTGTAGCTGCAGCAATAAGTAAATCTGGATTATCTAATAGTTCATCTGTAGCATACATTCCAGTTTTTCGTATGCTAGGCAATACCTCATCAAAAATCCATGCTTCAAACCTTTCTGCTCCAGGTAATTCAGATTTAGCGGCTAAGCGATATATATCTCCTTCAGGAATTACACTCATTTCTACATTTTGGATAGAATCAGTTCCGTCTCTTCTCTTTCCGGTAACTACCCCTACTCCGTGTTTCACGGACCCCCTACAATGTCTTGAAATTGCATCATTAGGCTTTTTATACCCTAAAGCTTTTGCTATATCAATCCCAACGGCATAATCTTTATTATTAATTTTTAACCATCTTATTTCTCCAAATCTTTCATCTTTGAAAATTAGTAAACCTCCCATTTTACTTATCCCCTTTCCTAAGAATTTTATCTTTTTAATACTTCAATAATATAAAATATTCATTCCATATTAACTTATTTTATAATCTTTAGATTTGGCTTATTAGCTTCTTTTTTATAATCTTCACTGAACTCATTAATAAAATAATCAAAATTGCATTTGACATACAATAAACCCTTTCTTTCATTCCAGCTTAAAGCATATATCTTATTTATTCTGATTTTTGTATCTTGATTATATATTGTCCATCCATCTCTCCACATACCAACTGGTGGAATATCACTATATAAATTGAAAGGTATATTTTGATCTAAATTTCTTATACAACCTTTTTCATTCATACTAAAATAAAGACATCCATCTTCATTTCTGTTCGTGCTTTTTCCCTGACATTCTCCACCATGCTTATAATTCCTCTTGCAATATGCGCATTCCAAGCGGTTAGGTAACTCTTTCGGCCTGTTCATTCTAATTCTGTCCTAAAGTCTTTCTGCAGCCACTACAAACAAGTACATTATTAAATTCACTTACATCTTTATCACTTCCACAAAATATACATCCCTTACTGTATTTCCTCAAAACTATATCATTATTAACCTTAGTTATTTCGATTGGATCCCCTTCATTAATACCTAACACTTTTCTTATTTCCTTTGGTATTACAACCCTTCCCAAGTTATCAAGATTTCTTACTATCCCCGATGCTTTCATTTAAACAACTTCCCTTCATAATTTAGCTTTGTTTAATTCTCAAAAAATTCATTTTCATGCGAAATTTACTCTGTAATTGTTTATTGTGAATTGTGCAGTGTGCATTGTAAATTTACTTAAGCCTATAATTATTCCTAATATCCTTCTCAATTTCTACCACATAATCTTTTGACATTTCATATATTCTTGAAGAAACCCCCTCATCAAAAGCTAATAATCTATCAATAGAAAATTCGCTGCTGACTATAATAGGTAGGAAATTAAGATACCTATAATTAATGATTTCAAACATAATATTCACGTCGGTTTCATTGACCTTTCCTTTAAAGAGGTCGTCAATCAAAAGGACCTCGCATAATTGATACTTTGAAATTGTCCTAGTATAATATTCTTCATCAATCATGTTTTGTTTTATCTTTGTGATCACATCACGATAAGGCATGTACACTACTTTAATCCTTTGTTTTAAAAAGTTTAATGCAACAGCAATACTGCAGTGCGTTTTACCGCTACCAACCTGACCGCATAATAAAATGCTATTGCGCCTATTGTTTCTAATTTCATCAAAATCAGTACAATAAGCTGCAGCAGTATCCTTCATCCTTTGGGACGCCTGATTCCACACTACAAAACTAGAAAAAGTAAGTTTACTTTGTTCAACATTGATTCCTGAATACTTCCACTCACTTTTTAGCTTTTCTATTTTCCTGCATTCACAAGCTACAGCAAGAGGCTGCATGTGTTCCTGCTTAATAAGTATCCATCCGGTATCGCAGCATTTGTTACACCTATATGAGGTTTGCTTCAATCCTCTTTCTTTCAGCTTCTGTAAGTTTTCGTGGTTCCTTTGGCTTGAATCCTGCAAATTCATTTTTATCTGCTGTGTTACTCTTTCCAGTACTTCTAAACCCATTTTTCTTTACCTCCATATGATCTTCTGGATACCCATCTCTCCTCCAGTTTTTTAGCACTCCAATTGCATACTTTATGTCAGGACAATTTTTCTCAAAACCAACATCCATAGCCATCTTAACCAACTTTTCTCCATGGATATCAATAGCTGATCTAAGTGCAACATAATCGCACCCTCCTGGTTTTCCTGTTATTTTTTCATGATACTGCATAAGCTCAATTGCTTTAAGATTTATATCATCCTCTGCTACAGATTCACTTTTAGTATTATTATGTTGCTCAAAGAGACTTGACTGACTTACATCTTCATCACAAGTATTCTTTTTACTCTCTATATTTTTATCTTTATCTATCTCTTTTTTCTTATTCTTTTTCTTATTCTCTATCTCTTTCTTATTCTGTTGCGTTACTGTAACGTTACTTTTATTTTGCGTAACGTTACTAGTATTTTTAGTAACAATACAGTTATTATCAGCAGTTTCTATAATGCTATTGCTGATATCTTCATTATTATTAGCAATTTCCGAACTTATATCACTAGCTGCTTCATCAGTATCAGTATTTGCATAAGCTTCTTCCCTCGTTTCTAAATTCTCTAATGGTTCATTTTTATCAAGAGCTTTATTCTCTTCTGAGATATCATTATCTTTTGAATTTTTCTTTTCTTTTAAATCTCTAGCTTCTTCTAATTCCTCATTTTCATTTAGATCTATGCTTTCTTCTGAAGCTTCACTTTCATAACTTTCTTGAACATCACTTTTACTAACCTTCTTCTCCCATTTTTTCTTTTCTCTATGATTCTCAGCTCTTTTTCTATTTTGTTCACGAACTTTTTCCATTCCTTCTATATTTTGATACTTGTCCCAGTTTACAATTCTAATTACTTTATCAGGAGCTATTTCAATCATTCCAAATTTAGATAGAACTCTTAATGCAAGTTTAATGGCATCTATTGGTCTGGAAAATAATATAGCTAACATATTTGCAGTAAGAGGCTTTCCCTCTGATAAAAATATTTCACCATTAGCATTAAGCTTTCCACCTAGTAAAAGTATTCTTATCCACACATAATGGATTGTATCCCTTTCTTTCATTGCATCTATTAATTTCATTTTTTCATCATCAGGCATACAAGTAGCTAATTTAATCCATTTAATATCTGCCATTATTTTTCACGCTCCCATAAATAAAATTTTCTAAATCTTTCAAGTCCATCCCAGGATGGATTTATTCCAATTGAATTACAAACATATACGTAACATTTTAAGATTTTAAAATTCACCCTTCTTCCCTCATTTAGTAATACCTTATTTTATTAGAATTCCCTTATGTGCCTTTCCCCTTTTCCCCTTTTCAAAGTCATAATAAATACACTCTTCAAGTTGCTTAGCCGGAAAGCTTTCTCCTAGCATTTGGATGCATACTTTTGTATCCCTTTGATAATTCTTTAATATTTCTATTAAGTCATTAGCTGTTAATCCTTCAAATTTTCTAATCAATCTAAATCCCCTCTTTCTAAAATCGTTAACTATATCCATAAAAACGAATTTATTCTGTTATTCATTTCTATCAAAAGTTAATTCTTTAATATCTTCTAAGTTAGATAAATCCTTTCCATTGCTCTCTTCTAGAAACTTCATTAATTCTGTTCTGGTTATCTTTAGACTTCCAAGCTTTAATCCTCGTATCACATTATTCCTTAATAGATCATACACAGAATTTCTATTAACTTTTAATAACTCTGCTGCTTCAGACACAGTATATAAAACTGGCTCCATCCTTATCCCCCTATTCTCATCTCAATAATTCATCCCTCACAAATTTACTTCACATTACAAGTGCTATTTCACTCCCACTTAACAAAAAGATCGTATCTATAATTTTCTACTTAATATTAAGCGTTTCTATCAGTTTTCATATTGTTAAATTCATCAATAATAAATAGTTCTTCTATTGTTTTCCCAAAAAATTTCGAAATAAATTTAGCCTCTGTTACACTAAAATCAGATTTACCATTTATTTTGTAATTTAAAGCACTTCCAGTTATTTTAAGTTTTTCAGCTAATTCCTGTTGAGTAATTCTTTTTTCTACCATAAGGCCTTTTAATTTACTATACATACCTCATTCTCCTTTTTAATTATTTAATCTTAATTGGCTATCGATTAAATTTTCATTATGATAATTATTTTCCACCGATTATCATTTAGATAATTTAGTTACATTATAAATTAGCATTTAGATAATTTCAACATGTTTTACTTAATTTAATAAAATTTATTTTTTCTTTTAGTTAATTTGATGTTTATTAATTAGCAAATAGTTTATAATATAGGTTAGTGAATTGCATATAGTGTATAGGGGGGTGATAATATGAGTAAATTTCCTATTAGGCTTAAAGAACTTCGTGAAGAGAAAGGGTTATTAGGTAAAGACTTTGCTAAAATTATGAGCGTGGAACCTGCAACAGTAACTAATTGGGAAAAGGGAAATAGATTTCCTAAGGATGATGTATTAATTAAAATTGCTGACTATTTTGACTGCAGCACTGATTATCTTCTAGGCCGAACTGATGATAAACTTTCAAAAGTATACTCTGGGACATTGCATAATCAAACTATAGAAATTGAAATCGATAAAGGATTTCCTCATGAACTAACTGCTGAAGAGGTTCAAAACATAATTAAGCAGTTAGATGCCGTGGGTTTAGATGTGAACAAACTAATTGAAAACTCTAAAAAGAAATAAAGTACAAAGAAAAACTGTAGAAACTATCTATAGTTTTTTATTTGTTTTTTATACTATTTTTGAGTTTAATATATTAAATATTTATGCCTTCTCCTAAAAAACCAAAAAAATATTCCAAAATATTGAAATTAATTTTACATAATGTTATAATTTTCCTTAGAACAAGGGTTCGCTTTATGTTAGGGGGAGATTTTAATGTTGTGGAAATATATTTTGAAGATAAAACTCAATAATGAAATCGTTTATAAAAGGGATATAGGCGAAAATGAGAATTTCATACATAAGAATGATGAAGAGTTATCAAGTATAAATAATGCAAATTGCGAAACAATAGCTAACGTGGAGGTGTTAAAACATGGAAGGAAGCGTTAGAAAGAAAGGTAACAAATGGTACTATAGTTTTGAAGTAGGAAAGGAGAATGGAAAAAGAAAAAAGATTGAACGTGCAGGAGGATCTACAAAAAAAGAAGCACTAGAATCGCTAAGAAAGGCAATCATTGAATTTGAAAATGCAGGCAGTTATATAGATGAAAGTAATATTAGCGTTAGTGACTATTTTGACTATTGGTTTAAAGAGTATGTTTTGCTTAATTGTAAACCTAATACTCAAAAAGGTTATAAAAGATTAATTAATAATCATATAAAACCTCAAATAGGAATATATCAATTAAAAAAAATTACTCCTGCAAAACTACAAGAATTAATCAATCTAAAATATAGAAATGGTTTTAGTAAAAACTACTTAAGTAATTTATATGGAGTACTAAGTGGAGCTTTTAAAAGTGCAGTATATCCATATCAATTAATAAAAGAAAATCCTATGTTGTTTGTTAAAACACCTAAATATAATAAATTAAATAACAAGCAGGACGATCTAAAAATAATAACACTTGAGCAATTCAATACTATATTAAAAAGATTTCCTTATGGTAACAACATGCATATCCCTCTTCAAATAGGATTTCATACTGGAATGAGGGTTGGAGAGGTTATGTCTCTAACTTGGGATTGCATAGATCTTGAAGCTAAAACTATTAAAGTTGAAAAAGTATTATACTTGAATGAATTTAATAAATGGGTGTTCGGTACACCTAAAACCTATAGCAGTTATAGGACCATCAAAATCGGTGATACTTTAACTTCTCTTTTAAAAAGATTTCATATAGATCAAAAGACAAATAGGTTACGCTATGGCGAATATTACACTAAACATGATTATGATTTTGTTTGTTTAAAAGAAAATGGTGATCTATTAACTACAAACAGCATTAAATATTTAAGTAGAGTTGTAAATTATGAATTAAATATCCAATTTAAATTCCACTCATTAAGACATACTCATGCGACTATGCTATTAGAAGCTGGCGCAAATATAAAAGATATTCAGGAAAGACTTGGTCATAGCACCTCTTCAATTACAATGGATGTCTATTCTCATGTTACTAACAAAATGTCAAATAACAGCGTTAATATTTTTGAAAATATAATAAGCATGCAACTTCCGACCAACTAAATCTCCCGTCGGAAGAATGTCGGAAGTCGGAAGTCTTTGAGCTTATATTATTTTAAAGAATGGCTCTATCTCTTAGTTAGTAACGCGACAGTTTCCACATGTTTAGTATTTGGAAACATGTCTACAGGCTGTACTTCTATTGTTTTAAATCCCAACCCTTCTAAATGTTTTAAATCTCTTGCTAAAGTGCTAGGATCACATGATACATACACTACTCTTTTAGGCTTAGCTTCTCCTATCGCATTTAGCAAATTGATATCACATCCCTTTCTTGGGGGATCCACAACTATTATGTCAGGTTTGATTCCATTTTTTATTAACTCTGGAATCACTTCTTCAGATTTTCCCACATAAAATTTCGAGTTGTCTATTCCATTTATTTCTGCATTATCTACTGCATTATCTATCGCCTGTTTTACTATTTCAACTCCATAGACTTTTCTTGCATTCTGAGATAAGAATAATGTTATTGTACCAGCACCGCAATATGCATCAAAAACAATCTCGTTTCCGCTTAAATCTGCATATTCCAAAGCTTTATTATAAAGTACTTCTGTTTGAATAGGATTTATTTGAAAGAAAGATAATGGCGAAATATTAAATTTATATTTACCTATATAATCAGATATATAATCCTGCCCCCACAAAGTTATACACTTGTCACCGAGAACTAAACTATTATTTTTAGTATTTATATTCTGAATTATTCCCTTTAAATTTTTAACCTCTAACCTAATATCCTTTATCAGTTCTTCTTTCTTAGGAATTTCCTTATCGGTAGTAATCAAAATTACCATAACCTCATTAGTTTTAAAACCCTTTCTCACCATTACATTTCTAATTAGTCCTTCACTAAAAAACAAATTATCTTTCCTAGCAGGTAATATAGAATACTTTTTCATCCAATTTCTTATTATTTTTATGATTTTATCAGTTTCTTCATCTTGAATTAGACACTTATCCATATCAACTACTTCATGTGTTTTTTCACTAAAAAAGCCCATTGAAAGTTCATTGTCTGTCAATGCAATTGAATATATTCCTTTATTTCTATATCTGTAAGGAAATTTCATCCCTATAGTACTTTTAACTATATCCCCCGATAATCCACCAATTCTTTCTATGCAATCCTTAACTCTATTGTATTTAAATTTTAATTGTGAATCGTAATTAGAATGCATTAGAGTACAACCGCCGCATTTTTCATAATACCCACATTGAGGCACAATTCTTTCGTCACATTTCTCTACTATATCTATAAGCTTTCCATAAGAATAATTCTTTTTATTCTTGATTATTTCTGTCTTTACAGTTTCCCCTATTAAAGCTCCTGGTATAAATATTGGATATCCATCTATCTTTGCAACACCCTCACCTTCATATCCTAAGGAATCTATTTTTACAATATACTCTTTATTTCTCTCTAACAC
Protein sequences of DBSCAN-SWA_9 >NZ_CP043998|5638421:5647906|5639540_5639759_+|WP_009168791.1|DBSCAN-SWA MEYSLSMTFLTVAGEKSTLSVSGVKPTLTKDEVNALMDTVIAKNVFKTNSGDLVKKSGAQVTQRQVTKFDVA >NZ_CP043998|5638421:5647906|5645318_5646476_+|WP_039773065.1|integrase|DBSCAN-SWA MEGSVRKKGNKWYYSFEVGKENGKRKKIERAGGSTKKEALESLRKAIIEFENAGSYIDESNISVSDYFDYWFKEYVLLNCKPNTQKGYKRLINNHIKPQIGIYQLKKITPAKLQELINLKYRNGFSKNYLSNLYGVLSGAFKSAVYPYQLIKENPMLFVKTPKYNKLNNKQDDLKIITLEQFNTILKRFPYGNNMHIPLQIGFHTGMRVGEVMSLTWDCIDLEAKTIKVEKVLYLNEFNKWVFGTPKTYSSYRTIKIGDTLTSLLKRFHIDQKTNRLRYGEYYTKHDYDFVCLKENGDLLTTNSIKYLSRVVNYELNIQFKFHSLRHTHATMLLEAGANIKDIQERLGHSTSSITMDVYSHVTNKMSNNSVNIFENIISMQLPTN >NZ_CP043998|5638421:5647906|5646541_5647906_-|WP_039773066.1|DBSCAN-SWA MLERNKEYIVKIDSLGYEGEGVAKIDGYPIFIPGALIGETVKTEIIKNKKNYSYGKLIDIVEKCDERIVPQCGYYEKCGGCTLMHSNYDSQLKFKYNRVKDCIERIGGLSGDIVKSTIGMKFPYRYRNKGIYSIALTDNELSMGFFSEKTHEVVDMDKCLIQDEETDKIIKIIRNWMKKYSILPARKDNLFFSEGLIRNVMVRKGFKTNEVMVILITTDKEIPKKEELIKDIRLEVKNLKGIIQNINTKNNSLVLGDKCITLWGQDYISDYIGKYKFNISPLSFFQINPIQTEVLYNKALEYADLSGNEIVFDAYCGAGTITLFLSQNARKVYGVEIVKQAIDNAVDNAEINGIDNSKFYVGKSEEVIPELIKNGIKPDIIVVDPPRKGCDINLLNAIGEAKPKRVVYVSCDPSTLARDLKHLEGLGFKTIEVQPVDMFPNTKHVETVALLTKR >NZ_CP043998|5638421:5647906|5642093_5643383_-|WP_039773057.1|DBSCAN-SWA MADIKWIKLATCMPDDEKMKLIDAMKERDTIHYVWIRILLLGGKLNANGEIFLSEGKPLTANMLAILFSRPIDAIKLALRVLSKFGMIEIAPDKVIRIVNWDKYQNIEGMEKVREQNRKRAENHREKKKWEKKVSKSDVQESYESEASEESIDLNENEELEEARDLKEKKNSKDNDISEENKALDKNEPLENLETREEAYANTDTDEAASDISSEIANNNEDISNSIIETADNNCIVTKNTSNVTQNKSNVTVTQQNKKEIENKKKNKKKEIDKDKNIESKKNTCDEDVSQSSLFEQHNNTKSESVAEDDINLKAIELMQYHEKITGKPGGCDYVALRSAIDIHGEKLVKMAMDVGFEKNCPDIKYAIGVLKNWRRDGYPEDHMEVKKNGFRSTGKSNTADKNEFAGFKPKEPRKLTEAERKRIEANLI >NZ_CP043998|5638421:5647906|5643524_5643755_-|WP_051144884.1|DBSCAN-SWA MDIVNDFRKRGFRLIRKFEGLTANDLIEILKNYQRDTKVCIQMLGESFPAKQLEECIYYDFEKGKRGKAHKGILIK >NZ_CP043998|5638421:5647906|5645158_5645335_+|WP_023975313.1|DBSCAN-SWA MLWKYILKIKLNNEIVYKRDIGENENFIHKNDEELSSINNANCETIANVEVLKHGRKR >NZ_CP043998|5638421:5647906|5643773_5643995_-|WP_008423918.1|DBSCAN-SWA MEPVLYTVSEAAELLKVNRNSVYDLLRNNVIRGLKLGSLKITRTELMKFLEESNGKDLSNLEDIKELTFDRNE >NZ_CP043998|5638421:5647906|5639272_5639497_+|WP_009168792.1|DBSCAN-SWA MAVTKTIDSVSLSIEVQKALDKAGDPIYTKKTFSGIKTDATPDNVYAVADAIKGVMEANTRDYFINESSSLANA >NZ_CP043998|5638421:5647906|5640668_5641061_-|WP_039773051.1|DBSCAN-SWA MNRPKELPNRLECAYCKRNYKHGGECQGKSTNRNEDGCLYFSMNEKGCIRNLDQNIPFNLYSDIPPVGMWRDGWTIYNQDTKIRINKIYALSWNERKGLLYVKCNFDYFINEFSEDYKKEANKPNLKIIK >NZ_CP043998|5638421:5647906|5644111_5644336_-|WP_039773062.1|DBSCAN-SWA MYSKLKGLMVEKRITQQELAEKLKITGSALNYKINGKSDFSVTEAKFISKFFGKTIEELFIIDEFNNMKTDRNA >NZ_CP043998|5638421:5647906|5641062_5641305_-|WP_039773053.1|DBSCAN-SWA MKASGIVRNLDNLGRVVIPKEIRKVLGINEGDPIEITKVNNDIVLRKYSKGCIFCGSDKDVSEFNNVLVCSGCRKTLGQN >NZ_CP043998|5638421:5647906|5641417_5642044_-|WP_039773055.1|DBSCAN-SWA MQPLAVACECRKIEKLKSEWKYSGINVEQSKLTFSSFVVWNQASQRMKDTAAAYCTDFDEIRNNRRNSILLCGQVGSGKTHCSIAVALNFLKQRIKVVYMPYRDVITKIKQNMIDEEYYTRTISKYQLCEVLLIDDLFKGKVNETDVNIMFEIINYRYLNFLPIIVSSEFSIDRLLAFDEGVSSRIYEMSKDYVVEIEKDIRNNYRLK >NZ_CP043998|5638421:5647906|5644588_5644963_+|WP_039773064.1|DBSCAN-SWA MSKFPIRLKELREEKGLLGKDFAKIMSVEPATVTNWEKGNRFPKDDVLIKIADYFDCSTDYLLGRTDDKLSKVYSGTLHNQTIEIEIDKGFPHELTAEEVQNIIKQLDAVGLDVNKLIENSKKK >NZ_CP043998|5638421:5647906|5638421_5639138_-|WP_084670569.1|DBSCAN-SWA MKSECFIEGQISIFDLPNIEVIKPKKIIIKEETKEVDKFYAITKLYSQSCSGIVKTLSGALLVELDDKTLYFNASGINEFSLPKDVGIMPGEEILIVNSDKKINEKQKQKLEALKPKQYIKRKGDANLIIPGEKTVVINPKGWILEYNQKPSYHSNELINTEFNLEIDEMDDKKNEIEVETNDIEFKIDDEVNIEYQGIKTVGKVVRIYNNGETVNVKWDGKQTAFYYKNVSKINNPK |
14 | Clostridium_phage(37.5%) | integrase | attL 5639017:5639032|attR 5655959:5655974 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|