Contig_ID | Contig_def | CRISPR array number | Contig Signature genes | Self targeting spacer number | Target MGE spacer number | Prophage number | Anti-CRISPR protein number |
---|---|---|---|---|---|---|---|
NC_000907 | Haemophilus influenzae Rd KW20, complete sequence | 2 crisprs | DEDDh,DinG,cas3 | 0 | 0 | 3 | 0 |
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_000907_1 | 1633449-1633543 | Orphan |
NA
Consensus repeat of NC_000907_1
|
1 spacers
spacers of NC_000907_1
>1.1|1633482|29|NC_000907|CRISPRCasFinder AGCCCACCAAAATATCTCTCGATTGTTTT |
CRISPR arrays and Neighbor proteins around NC_000907_1
The CRISPR arrays of NC_000907_1 >merge|NC_000907|1|1633449-1633543|CRISPRCasFinder TTGGTGGGCTGAAGCCCACCCTACAACTACTAAAGCCCACCAAAATATCTCTCGATTGTTTTTTGGTGGGCTAAAGCCCACCCTACAACTACTAA >NC_000907|1|1|1633449-1633543|CRISPRCasFinder TTGGTGGGCTGAAGCCCACCCTACAACTACTAA AGCCCACCAAAATATCTCTCGATTGTTTT TTGGTGGGCTAAAGCCCACCCTACAACTACTAA
>NC_000907.1|WP_005688502.1|1633126_1633279_-|hypothetical-protein MEKTGLPLSLESFQQLLPQIFMRAKGRSIRLIGLHVNLPEENKQEQMSLW >NC_000907.1|WP_005688501.1|1632557_1633094_-|elongation-factor-P-hydroxylase MEHKLEDIIAIFNQCFEEEYNTRLVKGGDEPIYLPANDEVPYNAIYFARGFYSSALHEIAHWLVAGKERRKLEDFGYWYEPDGRSEERQRDFEKVEVKPQALEWILATAAGFRYFASADNLNGNPGDTQPFKQAVYEQVKIYAEKGLPKRAETLRKALVAFYSTEDDINLAKFDVTCI >NC_000907.1|WP_005688500.1|1632146_1632359_-|hypothetical-protein MPKQPDLQEKIEAIKEELVLSKDPKVLIKLGELEKDKSKAKKYFGDACDLRSQEGCDKYRELNQKQDTNK >NC_000907.1|WP_032803489.1|1630954_1632037_-|peptide-chain-release-factor-1 MKDSIIAKLESLKERYEELEALLGDVSVISDQDKFRAYSKEYSQLEEVVKCFNRWTQLNQNIEEAEILLDDPEMKEMAQMEIEESKAEIEEVEQQLQILLLPKDPNDEYNCYLEIRAGTGGDEAGIFAGDLFRMYSRYAESKRWRVEMLSANESEQGGYKEVIVKVTGEGVYGQLKFESGGHRVQRVPKTESQGRIHTSACTVAVMPELPESEMPEINPADLRIDTYRSSGAGGQHVNTTDSAVRITHIPTGIVVECQDERSQHKNKAKAMSVLASRIVQAEQERQAAEQTDMRRNLLGSGDRSDKIRTYNYPQGRVTDHRINLTIYRLDEVMNGKIDELIQPIITEYQADQLAALSEQN >NC_000907.1|WP_005688499.1|1630461_1630902_-|RDD-family-protein MIIENQKDAEFSSAFKPSQLAQASRFKRWLASMINGLVLWVMAGLGFALGDFAGVVGMIVYAGFQLYFMKTYGQTMAKRWLGLRVFNYHTNQPVEFGKYIGREIIDILLAWTSFLLIISGIVALVRDDRRSLTDLVAGTIVLKDEK >NC_000907.1|WP_005693587.1|1629583_1630462_-|peptide-chain-release-factor-N(5)-glutamine-methyltransferase MNYKEWLAQAIADLAKKNPTENSKIDALVLLQHATGKSRTQILAFDDTEIDEKVRLKLTALLDRRLKGEPIAYILGEKEFWSLPLNVSKGTLIPRPDTEILVEKALQIALEKLEENPPHFRILDLGTGTGAIALALASELAPICQKRHIPLEIIGVDLMSDVVALAQSNAERNQLNVEFLQSRWFDNITGKFDLIVSNPPYIDAQDEHLHQGDVRFEPLSALVANDEGYADLRHIIELASSYLNSNGVLLLEHGWQQGEKVRSIFQENHWEMVETVRDYSDNERVTLGFWKK >NC_000907.1|WP_005654786.1|1628780_1629584_-|tetratricopeptide-repeat-protein MKYYRRALYDKFVHFYLVISDDGSSEAQLRGKMGGLVRKARKKISPDWPKEEQIHQLLQLFYGDWGFHCDPEDYFYARNLYLPYVFEHRQGMPVTLGAMVFYLAEALDLPIYPVNFPTQLILRAEVRDEVAFIDPWDGTYISQEKLQQLYEGAFGFGAKIQPEELDRADLSLLYSRFEQLAKNALIREEHNDMAYHYIKNLMITDAENPYHIRDRGLVLAQMGAYPSALKDLEFFVEHCPKDPTAAFIRTQLLELKGEINKDTFPLH >NC_000907.1|WP_005693586.1|1627911_1628766_-|3-deoxy-8-phosphooctulonate-synthase MQNKIVKIGNIDVANDKPFVLFGGMNVLESRDMAMQVCEAYVKVTEKLGVPYVFKASFDKANRSSIHSYRGPGMEEGLKIFQELKDTFGVKIITDVHEIYQCQPVADVVDIIQLPAFLARQTDLVEAMAKTGAVINVKKPQFLSPSQMGNIVEKIEECGNDKIILCDRGTNFGYDNLIVDMLGFSVMKKASKGSPVIFDVTHSLQCRDPFGAASSGRRAQVTELARSGLAVGIAGLFLEAHPNPNQAKCDGPSALPLSALEGFVSQMKAIDDLVKSFPELDTSI >NC_000907.1|WP_005693583.1|1626904_1627852_-|2-hydroxyacid-dehydrogenase MKIVFLDSTAIPKHISIPRPSFEHTWTEYEHTSAEQTIERVKDADIVITSKVIFDRETLQQLPKLKLIAITATGTNNVDLVAAEEMGIAVRNVTGYSSTTVPEHVIGLIFSLKHSLAGWLRDQTEAKWAESKQFCYFDYPITDVRGSTLGVFGKGCLGTEVGRLANAVGMKVLYAEHKDATVCREGYTPFDEVLKQADIVTLHCPLTETTKDLINAETLSKMKKGAFLINTGRGPLIDELALVDALKTGHLGGAALDVMVKEPPEKDNPLILAAKTMPNLIITPHIAWASDSAVTTLVGKVMQNIEEFVQQLHQK >NC_000907.1|WP_005654778.1|1625723_1626905_-|lipoprotein-releasing-ABC-transporter-permease-subunit MNFPISLYIALRYWRAKSADRFGRLVTNLASLGIVLGVMALIIVLSVMNGLEGYQKQQVLSSIPHAIVSEEQPISTEKTLENLPHFVQKAVPINTTNVIYQTAKGVSAGQIIGIQSFSDDPLVESFDQTKFNEILPRGEFKLVIGDQLAQKLGVNIGDKIRLMITENSQYTPFGRVPMQRLFTVSDIYYGYGEASGYEAFANITDIGRLMRIQPQQAQGYRLFLNDPFQITELPQHFPTQKITDWRVQKGEFFQAVRMEKNMMGLLISLIIVVAISNIVTSLSLMVVDKQGEIAILQTQGLTKSQVRSVFIYQGLLVGFVGTLLGAILGVLATLNLTDIVSAVNPQGVFLPTELSFVQMIFVIGFSLLLSLLSTLYPAYRAAKVEPAAALRYE >NC_000907.1|WP_005693592.1|1636790_1637207_-|phage-virion-morphogenesis-protein MIEIEINNAQEITSALERLAQATAHRAPLMRSIAGTMESAVAQNFEVGGRPAWKKLKIRQGTPLVDTENLMASITSEYNNNEAIVGTNEPYAAIHQFGGKAGRGRKVAIPARPFLILTPQDEADILEDIQDYFQLLIK >NC_000907.1|WP_100066292.1|1638048_1638282_-|DUF935-family-protein MRHLAQIITQQIILPYLQINVDPNIAPHRIPYFEFDTKEYEDLSVFADAIPKLTGIGVQISESWVWDKLGIPEPQEG >NC_000907.1|WP_010869247.1|1640231_1641668_+|pyruvate-kinase MSRRLRRTKIVCTMGPSTDRDNNLEKIIAAGANVVRMNFSHGTPDDHIGRAERVRSIAKKLGKTVAILGDLQGPKIRVSTFKDGKIFLNVGDKFILDAELPKGEGTQESVGLDYKTLPQDVVPGDILLLDDGRVQLKVLSTDGAKVFTEVTVGGPLSNNKGINKLGGGLSADALTEKDKADIITAARIGVDFLAVSFPRSSADLNYARELAQQAGLNAKIVAKVERAETVANDEAMDDIILASDVIMVARGDLGVEIGDPELVGVQKKLIRRSRQLNRAVITATQMMESMISNPMPTRAEVMDVANAVLDGTDAVMLSAETAAGQYPSETVAAMASVCLGAEKMPSINVSRHRMDKEFETIEESVAMSAMYAANHMKGVAAIVTLSSTGRTPLLMSRISSGLPIFALSRNQETLNLCALYRGVTPIYHGEESRTEAGAKAAPQSLKEKGYLSTGDLVLVTQGGQGATQTNVCRTLIVE >NC_000907.1|WP_032828363.1|1641809_1643216_+|replicative-DNA-helicase MASQPQIKSSDKKTAQVSIPPHSTEAEQAVLGGIMLSNQHWDGIAERVIADDFYTFQHRLIFTEMEHLMRNQSPIDLITLDQALRSRGVSDEVGGFAYLAELSNNTPNAINILAYADIVREKAILRELISVGNRIAENSYSPKGQDIKLILDEAEREVFAIAEKRTTSSEGPQNVINVLESTIEKIDILSKLENHSGVTGVTTGFTDLDKKTAGLQPSDLIIVAARPSMGKTTFAMNLCENAAMASEKPVLVFSLEMPAEQIMMRMIASLARVDQTKIRTGQNLDEIEWNKIASVVGMFKQKNNLFIDDSSGLTPTDVRSRARRVYRENGGLSMIMVDYLQLMRAPAFSDNRTLEIAEISRSLKALAKELQVPVVALSQLNRTLEQRGDKRPVNSDLRESGSIEQDADLIMFIYRDEVYNDNSEDKGVAEIIIGKQRNGPIGRVRLKFNGQFSRFDNLAEQREYRDDY >NC_000907.1|WP_005693598.1|1643225_1644308_+|alanine-racemase MNVKPATAKISSHALKQNLEIIKQKAPNSKIIAVVKANAYGHGVVFVASTLEQNVDCFGVARLEEALALRSNGITKPILLLEGFFNEQDLPILAVNNIETVVHNHEQLDALKRANLPSPIKVWLKIDTGMHRLGVALDEVDYFYQELKKLPQIQPHLGFVSHFSRADELESDYTQLQINRFLSVTKDKQGERTIAASGGILFWPKSHLECIRPGIIMYGISPTDTIGKEFGLTPVMNLTSSLIAVRHHKQGDPVGYGGIWTSPRDTKIGVVAMGYGDGYPRDVPEGTPVYLNGRLVPIVGRVSMDMLTVDLGADSQDLVGDEVILWGKELPIETVAKFTGILSYELITKLTPRVITEYVD >NC_000907.1|WP_010869249.1|1644404_1646054_+|glucose-6-phosphate-isomerase MKNINPTHTHAWKSLEAHKAELSNITIQDLFKQEKNRFDDYSLTFNNQILIDFSKNNINQTTLSHLRQLAQECALDSAKEAMFTGEKINRTENRAVLHTALRNRTNTPVLVDGKDVMPEVNAVLAKMKDFCQRIISGEWKGYTGKAITDVVNIGIGGSDLGPYMVTEALRPYKNHLNMHFVSNVDGTHIAETLKKVNPETTLFLVASKTFTTQETMTNAQSARDWLLKAAKDESAVAKHFAALSTNAKDVEKFGIDTNNMFEFWDWVGGRYSLWSAIGLSIALSIGFENFEALLNGAHEMDKHFLSTPIEQNIPTTLALVGLWNTNFLGAQTEAILPYDQYLHRFAAYFQQGNMESNGKYVDRDGNVIKNYQTGPIIWGEPGTNGQHAFYQLIHQGTTLIPCDFIAPAQRHNPLADHHNKLLSNFFAQTEALAFGKTKEEVEAEFVKAGKSLDDVKNIVPFKVFTGNKPTNSILVQKITPFTLGALIAMYEHKIFVQGVIFNIFSFDQWGVELGKQLANRILPELTDSEKVASHDSSTNGLINQFKAWR >NC_000907.1|WP_005693601.1|1646701_1647673_+|glycosyltransferase-family-2-protein MENCPLVSVIVCAYNAEQYIDESISSIINQTYENLEIIVINDGSTDLTLSHLEEISKLDKRIKIISNKYNLGFINSLNIGLGCFSGKYFARMDADDIAKPSWIEKIVTYLEKNDHITAMGSYLEIIVEKECGIIGSQYKTGDIWKNPLLHNDICEAMLFYNPIHNNTMIMRANVYREHKLIFNKDYPYAEDYKFWSEVSRLGCLANYPEALVKYRLHGNQTSSVYNHEQNETAKKIKRENITYYLNKIGIDIKVINSVSLLEIYHVDKSNKVLKSILYEMYMSLDKYTITSLLHFIKYHLELFDLKQNLKIIKKFIRKINVIF >NC_000907.1|WP_010869250.1|1647855_1648323_-|glycine-zipper-2TM-domain-containing-protein MKKTNMALALLVAFSVTGCANTDIFSGDVYSASQAKEARSITYGTIVSVRPVKIQADNQGVVGTLGGGALGGIAGSTIGGGRGQAIAAVVGAIGGAIAGSKIEEKMSQVNGAELVIKKDDGQEIVVVQKADSSFCSLVAEFVFVGGGSSLNVSVL >NC_000907.1|WP_005693602.1|1649296_1651030_+|arginine--tRNA-ligase MNIQSILSDKIKQAMILAGADQSCDALIRQSGKPQFGDYQANGIMAAAKKLGLNPREFAQKVLDNLQLSDIAEKLEIAGPGFINIFLNPTWLTTEISAALSHKNLGIQATNKQTVVIDYSSPNVAKEMHVGHLRSTIIGDAVARTLEFLGHNVIRANHVGDWGTQFGMLIAYLEKMQNEHASEMELQDLEAFYREAKKHYDEDEVFAEKARNYVVKLQSGDEYCRTMWKRLVDITMQQNQHNYARLNVTLTEKDVMGESLYNPMLPSIVKDLKKQGLAVENDGALVVYLDEFKNKDGDPMGVIVQKKDGGFLYTTTDIAAAKYRYETLKANRALVFSDTRQSQHMQQAWLITRKAGYVPDSFSLEHKNFGMMLGKDGKPFKTRTGGTVKLADLLDEAIERATVLINEKNTNLSNDEKEAVIEAVGIGAVKYADLSKNRTTDYVFDWDNMLSFEGNTAPYMQYAYTRIRSIFNKTDINSTALLAAPLTIKDDKERTLAIKLLQFEEAVQTVGKEGTPHVLCAYLYELAGIFSSFYEHCPILNAEDESIKLSRLKLALLTEKTLKQGLTLLGIKTVEKM >NC_000907.1|WP_005647229.1|1651322_1651814_-|acetolactate-synthase-small-subunit MRRILSVLLENESGALSRVVGLFSQRAFNIESLTVAPTDDPTLSRMTIEAVGDAQALEQIEKQLHKLVDVFKVVNLSEQEHIEREIVLAKVRAVGSSRDEIKRLADIFRGQIVDVTPKSYTIQLSGTNDKVDAFISALKEETTLLEIVRSGLISVSRGEKNIL |
You can click texts colored in the table to view more detailed information
CRISPR_ID | CRISPR_location | CRISPR_type | Repeat_type | Spacer_info | Cas_protein_info | CRISPR-Cas_info | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NC_000907_2 | 1759111-1759203 | Orphan |
NA
Consensus repeat of NC_000907_2
|
1 spacers
spacers of NC_000907_2
>2.1|1759141|33|NC_000907|CRISPRCasFinder GGTATCACAAAGTGACAAAAAGAGGCTCAAAGA |
CRISPR arrays and Neighbor proteins around NC_000907_2
The CRISPR arrays of NC_000907_2 >merge|NC_000907|2|1759111-1759203|CRISPRCasFinder AAATCTTGCCTTCCCCTGCTTGCGGGGGAAGGTATCACAAAGTGACAAAAAGAGGCTCAAAGAAAATCTTGCCTTCCCCTGCTTGCGGGGGAA >NC_000907|2|2|1759111-1759203|CRISPRCasFinder AAATCTTGCCTTCCCCTGCTTGCGGGGGAA GGTATCACAAAGTGACAAAAAGAGGCTCAAAGA AAATCTTGCCTTCCCCTGCTTGCGGGGGAA
>NC_000907.1|WP_005658208.1|1758395_1759103_+|electron-transport-complex-subunit-E MTDLTEKNTALEEEKIESAVENQQKSIWKEIFAQGIWKNNPAVVQLLGLCPLLAVSSTATNALGLGLATMLVLTCTNTVISLFRQYIPKEIRIPIYVMIIATTVTAVQLLMNAYTYTLYQSLGIFIPLIVTNCIIIGRAEAFASKNSLLHSIWDGFSMGLGMALSLTILGALREIIGQGTIFEGIENLFGEQAKFLTHHIYHTDSSFLLFILPPGAFIGLGLLLAIKNRIDNIKK >NC_000907.1|WP_005694178.1|1757770_1758394_+|electron-transport-complex-subunit-RsxG MGTVKITSRYGILLGFIALLCTIISAGIFFLTKDKIDAVIAAQQRELLLQVIPQDYFNNNLLESAVIPQDKNFVGIQKIYFAKKDGNVSAYAYETTAPDGYSGDIRLLVGLDPKGEVLGVRVIEHHETPGLGDKIERRISNWILGFTNQSINEHNLSEWAVKKDGGKFDQFSGATITPRAVVNQTKRSALIMLNNQALLQQLSTQVK >NC_000907.1|WP_005694177.1|1756694_1757771_+|electron-transport-complex-subunit-RsxD MFKMVSSPHTHSGKLTAHIMLWAILAMMPAFFTQIYYFGFGVVLQSALAIGTAIIAEFIAIKLRGKKPLNYLSDFSVALTALILAMAIPPYAPYWIIIIGTLCAVLLGKQVYGGLGQNPFNPAMIGYVILLISFPLQMTTWMPPINLLQEPPTFSDAFSLIFSGLTTDGFTLSQLTHNIDGITQATPLDSAKIFYKSHTQLNDFYELIKLPIFMGNGTDFAQGWWQINVAFLAGGIFLILKRVIHWQIPVAMLVTFFCLATATAFTGFTHLSAISQLVSGAMMFGAFFIATDPVTASITPRGKIIFGALVGLFVYLIRYHGNYPDGVAFAILLSNICVPLIDHYTRPRVSGYPTKGRK >NC_000907.1|WP_010869271.1|1754230_1756690_+|electron-transport-complex-subunit-RsxC MADVLSRFNSGKLWDFKGGIHPPEMKSQSNSQPLRHLPLGTDFYIPLKQHLGTTGNLLIKEGDYVLKGQALTKGDGLRMLPVHAPTSGTIKSIKPYVATHPSGLDEPTIHLQADGLDQWIERNPIDDFSTLSSEQLIHKIYQAGIAGLGGAVFPTAAKIQSAEQKVKLLIINGAECEPYITCDDRLMRERADEIIKGIRILRYILHPEKVVIAIEDNKPEAISAIRNALQGANDISIRVIPTKYPSGATKQLIYLLTGIEVPSGERSSSIGVLMQNVGTMFAIKRAIINDEPLIERVVTLTGNKIAEKGNYWVRLGTPISQILSDAGYQFDKHFPIFAGGPMMGLELPNLNAPVTKLVNCLLAPDYLEYAEPEAEQACIRCSSCSDACPVNLMPQQLYWFARSEDHKKSEEYALKDCIECGICAYVCPSHIPLIQYFRQEKAKIWQIKEKQKKSDEAKIRFEAKQARMEREEQERKARSQRAAQARREELAQTKGEDPVKAALERLKAKKANETESTQIKTLTSEKGEVLPDNTDLMAQRKARRLARQQAASQVENQEQQTQPTNAKKAAVAAALARAKAKKLAQANSTSEAISNSQTAENQVEKTKSAVEKTQENSTALDPKKAAVAAAIARAKAKKLAQTNSTSEAISNSQTAENEVEKTKSAVEKTEENSTALDAKKAAIAAAIARAKAKKLAQANSASEAISNSQTAENEVEKTKSAVEKTQQNSTALDPKKAAVAAAIARAKAKKLAQANSTSEAISNSQTAENEVEKTKSAVEKTQENSTALDPKKAAVAAAIARAKAKKLAKTQATLENNQE >NC_000907.1|WP_005650033.1|1753648_1754230_+|electron-transport-complex-subunit-RsxB MTFLFIVITLLALIFGAILGFASIKLKVEADPVVEKIDAILPQSQCGQCGYPGCKPYAEAICNGDEITKCIPGGQTTIVKIAEILGVDVPTMEGIEEPIEKVAFIDENMCIGCTKCIQACPVDAIIGTNKAMHTIIPDLCTGCELCVAPCPTDCILMIPVKKNIDNWDWKFDAKLVIPVMNVDGSEKKLVVGE >NC_000907.1|WP_005694403.1|1752982_1753561_+|electron-transport-complex-subunit-RsxA MTHYILLIIGTALINNFVLVKFLGLCPFMGVSKKIETAVGMGLATMFVLTVASLCAYLVDHYILIPLNATFLRTLVFILVIAVVVQFTEMAINKTSPTLYRLLGIFLPLITTNCAVLGVALLNVNLAHNLTESVVYGFGASLGFSLVLVLFAALRERLVAADIPATFRGSSIALITAGLMSLAFMGFTGLVK >NC_000907.1|WP_005694402.1|1751639_1752701_+|protease-SohB MLNDILTGYGIFILEILTILLLILAVVGLIISYRQHNKSKVGELEIKDLSEEFNEQVRLLRDFNLSEEEQKQRTKAEKKAEKQNAKKRKEKLKKGETLEDEKKACVYVLDFCGDISASETTALREEISAILNVAKSEDEVLLRLESPGGIVHNYGFAASQLSRLKQKGIKLTVAVDKVAASGGYMMACVADKIVSAPFAVIGSIGVVAQIPNVHRLLKKHDVDVDVMTAGEFKRTVTVLGENTEKGKQKFQQELEETHKLFKQFVSQNRPCLDIDKIATGEHWFGQQAIALQLVDEISTSDDLILEKMKEKQVLNVKYRLKKSLIKKFGRQAEESAINIIHRYSTKQSRDFMY >NC_000907.1|WP_005654151.1|1750776_1751442_-|DUF2057-domain-containing-protein MKLRAVVLGLATLCTSTATFAGMVSTSSNLEFLAIDGQKASKSLGKAKTFTVDDTQNHQVVVRLNEIVGSGSNQSLFESNPVIVTFQGNAEDLVISAPVIRNLDSGDKFNQMPNITVKTKSGNAISAKVDVLKQEGLFPSGNVLNDLAEYNASGAAASVSKFAATTVASSVAVAPAGNAKANKGKVVVQGENVAEQQLQYWFQQADKETQTRFLNWAKSHK >NC_000907.1|WP_005665016.1|1748552_1750709_-|TIGR01666-family-membrane-protein MNIRLNAKVISTIPVFIAVNIAAVGIWFFDISSQSMPLILGIIAGGLVDLDNRLTGRLKNVFFTLIAFSISSFIVQLHIGKPIQYIVLMTVLTFIFTMIGAVGQRYSTIAFGSLVVALYTTLTYIPEVNVWFINPVMILCGTLLYSVVTLIVYLFFPNRPVQESVAKAFCALGEYLDTKSCFFDPDEVAEIEKKHLNFAMKNANVVTAFNIVRTALFYRIRGQHRHPLTQRMLRYYFAAQDIHERANSTHFDYQQITEKLKNTDLIFRIQRLLELQAQSCKEITASLRENKPYHFNKRVERALLGTLHSFDLYRAQHLNDQDELIDIQTLLDNLQSINWQLRQLAQDTTVTEQLAQIHTEQITGLKNISAVIFSHFTFESPLFRHAVRLSIVVFLCCAIVEFFQFNLGYWILLTTVFVCQPNYSATKVRLRQRIIGTILGVVVGSLLPYLNPTLELKLGLVVLTSTLFFFFRSNNYSFSTFFITLQVLLSFDVMGFDTAAALMPRLLDTLLGAAISWFAVSYLWPDWKYLQLDKVSHQALRSDAVYLLHIISQLQFGKSDDLKYRIARRNAHQYAAALSTTLSNMNNEPVKYKAYLQKGFDLLKLNYSLLSYISALGAYRDRMKNLQQTAQFLSGFYPVAKKIIYTLEHIEEIPEAIFNQQQESIETHLKELEKQEMTAEERAVFSLPYQQLNLITQLLPQFYGYFKKEINCQSAGAL >NC_000907.1|WP_005665007.1|1747912_1748455_+|HAD-family-hydrolase MQQKLENIKFVITDVDGVLTDGQLHYDANGEAIKSFHVRDGLGIKMLMDADIQVAVLSGRDSPILRRRIADLGIKLFFLGKLEKETACFDLMKQAGVTAEQTAYIGDDSVDLPAFAACGTSFAVADAPIYVKNAVDHVLSTHGGKGAFREMSDMILQAQGKSSVFDTAQGFLKSVKSMGQ >NC_000907.1|WP_005654382.1|1759287_1759923_+|endonuclease-III MNKTKRIEILTRLREQNPHPTTELQYNSPFELLIAVILSAQATDKGVNKATEKLFPVANTPQAILDLGLDGLKSYIKTIGLFNSKAENIIKTCRDLIEKHNGEVPENREALEALAGVGRKTANVVLNTAFGHPTIAVDTHIFRVCNRTNFAAGKDVVKVEEKLLKVVPNEFKVDVHHWLILHGRYTCIARKPRCGSCIIEDLCEYKEKVEF >NC_000907.1|WP_005694179.1|1759980_1761354_+|sodium-dependent-transporter MTTNNKQRQTWSSRLTYVMTVAGATVGFGATWRFPYLVGENGGGAYVLLFCIAMIVIGIPMILVENVIGRRLRVNSIDAFGDKILDKGKGISKYWKILGYMGLLGAFGIMAYYMVLGGWVISYIISLISGTLDISTPITKDIAKNFYDLHIGNSPYEIIFYTLLFVIVNYIILAKGIIGGIERSVKYLMPLLFIFLIGMVIRNVTLPGAMEGITFYLKPDFSKITPQLFIFVLGQVFFALSLGFGVLITLSSYLNKEENLIHTAVITGFTNTIIAVLAGFMIFPSLFTFGIEPNAGPTLVFQSLPIVFSHLWAGKFFAIIFFGLLLIAALTTSITIYEVIITALQEKLRMCRGKAIVLTLSGIFLLGNIPAILGDNLWKNVTIFGKSIFDFYDYASGNILFMLTALGCAIFVGFVLKDEAKKELSSTKYSTFIKIWFNYVKFVVPLIILVIFISNLF >NC_000907.1|WP_005694180.1|1761377_1762433_-|molybdenum-ABC-transporter-ATP-binding-protein-ModC MLQINVKKQLGQLALQANIQVPDQGVTAIFGLSGSGKTSLINLVSGLIQPDEGFICLNDRTLVDMESQESLPTHLRKIGYVFQDARLFPHYTVKGNLRYGMKNVSQDDFNYIVDLLGITHLLKRYPLTLSGGEKQRVAIGRALLTDPDILLMDEPLSALDVPRKRELMQYLERLSKEINIPILYVTHSLDELLRLADRVVLMENGIVKAYDRVEKIWNSPIFAPWKGESEQSSVLALPVHLHNPPYKMTALSLGEQVLWIHQVPANVGERVRVCIYSSDVSITLQKPEQTSIRNILRGKITQIEIQDSRVDLAVLVEGHKIWASISKWAQNELRFAIGQDVYVQIKAVSVM >NC_000907.1|WP_005654374.1|1762419_1763148_-|molybdate-ABC-transporter-permease-subunit MLTQFFSFFNLTPMEISAINLSLSVAVSSMLWSLPLAIFVAWLLARKNFYGKSLITGVIHLPLVLPPVVIGYLLLVAMGRNGFIGKYLYQWFGLSFGFSWKGAVLSSAVVAFPLVVRAIRLSLENIDIKLEQAAQTLGASAWRVFFTITLPLSLPGVLAGLVLGFARSLGEFGATITFVSNIAGETQTIPLAMYSFIQTPGAEEQTARLCLFAIILSLISLLLSEWLSKRMQKKLGQGNVAD >NC_000907.1|WP_005694182.1|1763282_1764047_-|molybdate-ABC-transporter-substrate-binding-protein MKKLTKISTALLIAGLGFSFAASAKVTVFAAASMTDALQQVAKDYAKQNPKNEVVFSFASSSTLAKQVEEGAPADIFVSASNKWMKYLSEKDLTVKETEKVLVGNDLVLIAPAKSAVNSVDIAKGEWINALKDSYLSVGDPAHVPAGQYAEEALTKLNLWDKVKDRLARGKDVRGALALVERAEAPYGIVYSTDAKVSQQVKTVAVFPADSHKPVVYPVSIVKGHDNADSRDFLKYLESDAAKKVLVGYGFSAK >NC_000907.1|WP_005694183.1|1764184_1764952_+|TOBE-domain-containing-protein MKNTEILLTIKLQQALFIDPKRVRLLKEIQQCGSINQAAKNAKVSYKSAWDHLEAMNKISPRPLLERNTGGKNGGGTALTTYAERLLQLYDLLERTQEHAFHILQDESVPLDSLLTATARFSLQSSARNQFFGRVAQQRIIDSRCVVDVNVQGLPTPLQVSITTKSSARLKLITEKEVMLMFKAPWVKISEQPLANQPNQFPVNIKSLNEEEAILQFAESNIEFCATVHQPNQWQIEQQVWIHIDQEQIILATLG >NC_000907.1|WP_164927871.1|1765060_1765864_-|glycosyltransferase MKFSVLMSLYIKENPQFLRECFESLVAQTRQADEIVLVFDGVVTPDLEFVVTEFETKLPLKLVKLPQNRGLGKALNEGLLHCDYDWVFRMDTDDICVPDRFEKQVAFIEQHPESIIFGGQIAEFGKNVNDIVAYRNVPTSAQEIIKFTQKRCPFNHMTVAYQKSAVINCGGYEDLQEDYYLWIKLVAQGLYMANLPDILVYARVGNGMVSRRRGVNQAKAEWRLFKLKYRLGIQGLLSGLFTFALRFGSRLLPTSLLKKLYQTFLRK >NC_000907.1|WP_005694185.1|1765865_1766750_-|glycosyltransferase-family-2-protein MLSIIVPSYNRKAEVPALLESLTQQTSSNFEVIIVDDCSKERVVVEQSYSFPVTVIRNETNQGAAESRNVGARTSKGDWLLFLDDDDCFMPEKCEKVLQVIEQNPNINFIYHPAKCEMVNEGFTYVTQPIEPQEISTERILLANKIGGMPMIAIKKEMFLKIGGLSTALRSLEDYDFLLKLLQEPSFTPYKINEPLTYCTFHTKRSSVSTDTTNTQKAIDYIREHYVKTVEQARNFDINASYILAYPHIMNLSRKAAKYYFDIFKKTKSIKQFIITLVILISPKLAINLKRLGK >NC_000907.1|WP_005694186.1|1766761_1767535_-|glycosyltransferase-family-25-protein MLKKYLISLDKDIQRRELFFSQKNTEDFQVFSAINTMQKDWDELAAIFNIEQFKAHYFRNVTKGEIGCTLSHLSVYQKIVEDNDIAEDSYALVCEDDALFHSDFQQNLTALLSEKLEAEIILLGQSKINDFNDFDLEINYPTTFSFLCKKTGDVNYAFPYKSYFAGTVGYLIKKSAARRFIQQISQNKPFWLADDFLLFEQNFNIRNKVVRPLIVIENPVLISNLESVRGSLSNNLLKKLMKYPLKKIFAIKKNLAN >NC_000907.1|WP_005694187.1|1767546_1768608_-|glycosyltransferase-family-4-protein MKKIGFFIMNIGSAGGTERVSINVANALAKQGYDVSFISIGGNKPFFQVDEKINIYAMNKLPYSLKKDYFSITKKLRELVKELQLDTLIVVDGAIMLFSALALVNLNIKHILWEHYSFNFTGNRLVRTLGKYLAVTTCDKIVTLTEAEKTLWQEKFKTNNIISIANPNTLLPKNKLAKLENKTILSVGHLFSYKGFDYLLKVWQVLAKKYPDWNLKIVGSGEEEENLKNLAKALDIEDSVNFIPRTNDVSFYYESSSIYCLPSQTEGLPLVVIEAMAFGLPIVAFNCSPGVKQLVEHKENGFLCEQNNIEEMVKGLDLLINNPELYLQMSDKSRLMSEDYGIEKIIEEWKGIL |
You can click texts colored in the table to view more detailed information
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_ID | Protospacer_location | Mismatch | Identity |
---|
CRISPR_ID | Spacer_Info | Spacer_region | Spacer_length | Hit_phage_ID | Hit_phage_def | Protospacer_location | Mismatch | Identity |
---|
Region | Region Position | Protein_number | Hit_taxonomy | Key_proteins | Att_site | Prophage annotation | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
DBSCAN-SWA_1 |
1105411 : 1117497
Sequences of DBSCAN-SWA_1
Nucleotide sequences of DBSCAN-SWA_1 >NC_000907|1105411:1117497|DBSCAN-SWA GATGAAGTGTGTAGACTTATTTTCAGGATGTGGAGGTTTATCTCTTGGTTTTGAATTAGCTGGATTTGAGATCTGTGCAGCTTTTGAAAATTGGGAGAAAGCTATTGAGATTTATAAAAATAACTTTTCACACCCTATATATAATATTGATTTGAGAAATGAGAAGGAAGCAGTCGAAAAGATTAAAAAATACAGTCCGGATTTAATAATGGGAGGTCCTCCATGTCAAGATTTTTCAAGTGCGGGGAAGCGAGATATATCTTTGGGAAGAGCAGATTTAACATATAGTTTTGCAAATATAGTGTGTAACATTCGTCCAAAATGGTTTGTAATGGAGAATGTAGAACAAATTAAAAAAAGTCATATATTGCAAGATATTATTAATCAATTTATTGATTTTGGTTATGGGTTGACTTCAGCTATATTAGATGCCTCTTACTGTGGTGTTCCACAATCTAGAACAAGATTTTCCTTAATTGGAAAATTAAATAGTGAACATAATTTTCTGATTCCAACATTGTCTAGAAAATTATCAGATAAGCCTATGACAGTTAGAGATTATTTGGGAAATTCATTAAATCTAGAGTTTTATTATCGCCATCCAAGAAATTATAATAGAAGGGGAATTTTTTCAATCGATGAGCCAAGTCCAACGATTAGAGGTGTAAATAGACCCATTCCTAAAGGATATAATATAAACAGTTGTGATCCTAAAGGAGTTGAGTTAGCAAAAGTTAGACCATTAACAACAATTGAACGCAGTTATATTCAAACATTTCCTAAGTCGTTTTTATTTTCGGGAACAAAAACTGATTTAGAGCAAATGATAGGTAATGCGGTACCAGTAAATTTAGCTAAATTTGTAGCTAGTGCAATTATAAACTTTGAAAAAGAACCAATAAGATCTATGGGATAAATTGATTTATTTGAAAATAAAGTATCTCCTTTTATTTTATCAGAGAAAGTGCTGCATAAGATAAAAGAACAGTATATATATCAATGATCTTTTATATTAAAGACCCCAAATTATTTACCCAATTTGGGGTCTTTATTTTACATTTCTACTTCATCGCTACACCCAACCATTTCATCATCTCTCTCTCATCCCAACCTTTACGTTTGGCATAATCTTGAGCTTGGTCTTCATCAATGCGACCAAGTGTGAAATAGTTGCTAGCGGGGTGAGTGAAGTACCAGCCGCAGACAGAAGCGGCAGGCCACATGGCGTAGCTTTCAGTGAGTTTCATGCCGATGCGTTGTTCGACTTCTAATAAATCCCAAATTAAGGCTTTTTCCGTGTGTTCCGGCCAGCTTGGATAACCCGGTGCAGGGCGGATGCCGACATAGTTTTCGTTGATTAAACCTTGATTGTCAAATTCTTCTTGCGTGTAGCCCCAAATGCGGGTGCGAAGCTCAAAGTGCAGGTATTCTGCCATGGCTTCAGCGAGGCGATCGCCCACAGCTTGTAGCAAGATGGCGTTGTAGTCATCGCCTGCGGCTTTGTAGCCTTCCACTAGCTCCATTTCTTCAACGCCGACACACACGGCAAACATGCCGAACCAGTTTTTTTTGCCACTTTGGCGATCGGCGATAAAGTCGCTTAAGCAGAAGTTAAATGGGCTTTTGCTGTTTTTGCCACGTTCCGTTTGTTGGCGTAAGCCGTAAGCGGTGCCAATGGTTTGTGTGCGTTCTTCATCAGAGAATAGCACCACATCATCGCCCACGCGTTCCGCAGGGAAAATGCCTAAAATGCCGCTTGGGTTGAGTTTGTGGTTTTGTTCTAATTCATCTAAAACCACTTGTGCATCGTTCCACACTTTGCGTGCTTCTTCGCCACCTTCAGGATAATCAAAGGCATCCGGATAGCAGCCCATCAAGCCCCAAATACGGAAGAATGGCGACCAGTCGATAAATTTACGCAGTTCGGCAATCGGTACGTTTTTAAATTCCACAATGCCCGTTTGTTTTGGCGTTGGTGGCACGTAATCTGCCCATTCACCACTAAAGCCATCACGTGCTTCTTCAATGCTAAGCTGTTTACGTAGCGGTTTACTATTTGCAAAAGATTGTTGGATTTTCTCGTAATCCTTTTTGAACTGTTCCCACAATGCTGCACGCCCTTCAGGGTTCATTAAGGTGGCACATACTGTTACCGCACGGGAAGCGTTAGAGGTATAGAACACACAGTGTTGTTTGTATTTTGGATAAAGTTTAATGGCGGTATGTTCTTTGGAGGTGGTTGCACCGCCAATCATCACAGGCAGGTTTAAGCCTAAACGAGTCATTTCACCCAAGAAGTATTCCATCTCATCTAGAGAAGGGGTAATTAAACCACTTAACGCGATGATGTCCGTTTTTTGATTAATAGCGGTTTGAATAATTTTGTCCGCTGGCACCATGACGCCTAAGTCGATCACTTCAAAGTTATTACATTGCATCACCACACTCACGATGTTTTTACCGATGTCGTGCACGTCGCCTTTTACGGTTGCAATCACCACTTTACCGTTGCTTGAACCTTTTTGTTTGGTTGCATTATAAATGGTTCTAAATACGCCACAGATTGTTTCATCACGCGTGCGGATTTTACCACTTGCGGCAGGAACATTTTACCATCGCCGAATAAATCGCCGACTACGTCCATGCCAGCCATCAACGGGCCTTCAATCACATCTAATGGGCTTGGTAATGTTTGGCAAGTGGTAATCCCTTTCACAAGGGCGTGTTTTAAAAGTTCTCCCACTGGCCAAGTGCACCATTCTGCGACAGAATCGACCGCACTTTTCTTAAACTTCTCACCTCTAAAATCGTCTTCTGTCAGTTTATATTTTTGGATCATCGTCCCCATCGCACCGTCTAAAATGAGAATACGATTTTCTAGAGCTTGTTTAAGTTGAGCGGTTTTATTCACCATAATTATTTTGTTCTGTAAATCTTAAATAAATAACTACGGAATAATAGGTGTAAGGGCTAGGGGTGTCAAATGTTAGAAGGAAAGTGCGGTGGAAAATTAAGGTTTTTTATTTAAGTGTAATGGCTGCGACAAAACAGGTAATTTTACATTCTCCGCACCCATTGCAACGTTCATTATCAATCTCTAAAGTGCTGGAGATTGCTTGTAGTGGGCAAGCGGTTTGGCAGTCTGGACAGGTTTGATTTTGTAGGATTAAACAGGCTGAGGAAAATTGTGGACGAAGTAATGTATCTCCTGGAAAATTAGGATGTAGTGCATTTGTCGGACAAACTTCTGCGCATTTACCACACAAATCACAAGGTGCGTAGTCAATTTCAAGGGTGGCTTGTTGCTGTTTTAGTTGAATTAAACCATTAGGACAAGCTGAAGCGCATTCCCCACAACCATTGCAGACGGCGGAAAATAAATCTTCTCGTGCTGAAAAGGGAGGACGAGACTGCGTTTTTTCTATTGTTGATTTTGTAGCTGGAAATACATGACGCAATAGTCCTCTACGAGAAATGTGATGGTGGCTTAAATAAGCCTGATAATAGGCTTCGTTTTTCATTATCGATAAAATCTTACTGTCGGTACATTAATATGTAAATCTACTTGCCATTGTTGTAAAGTTTTTATGGTAAGTAATGCAAGAGCTTGATAAAAATCAGAATTTTCTATTTTGCTTAGTTGTTCAAGGAAATGATACGCCCAAGTTAAGAAGTGTTCACGTAGAAATTTGGTTAATAAGTGCGGTCGATTTTCTGCTAAATATGCAGCAAGCATTAGCATTAAGCCAATATGATCTTCTGGTTCATCTTGTTGTGTTTGAAATGCGATTTGATGTTGTTGTAAGAAATCGCGTAATGCTAAGAGAGAATTACCAAAAATAACACATTCAGGATCAAGATATACGGATCCCCAAGGTGGCGTAGGTAATTCATTTGGACCAATAAATAAATACTGATATTGTTCAGTGATATTTTGTTGCAGCCCTTTTTCAATAAGTGCGGTGATTTTTTTATGTGTTTTTACATCAAATGAAATTTCCCATTCTTGCATCCAATTTGGTTGGCGAAAGAATGTCAAAATATCAGTAAGTCGTGCATCATTAGGCTCATAGTAAAATACTGCACCGAGTAAACGCCCATAAATAGAAATTTGTTGAAGAGTATTTTGCATAGTATCTCCGAAAACAATTTGTCATTAGTGAATGGGGATATGAGGGGTAGTTAAATATTACTAATTAACGTTTCTAAAAATTGAGGCGTATGCTATACGCCTCAACATAATTTAACCACCAATCGTCATACCGTAAGTCATATGTAATCCATAAAATAATACGCGACCGATGCCTTCAGCTACTAACGTTAATAGAACGGAAATACCTAATAGTCCTATGTTTTTCACTCGGAATAAGAGGAAAGCTACAATGGAAAGTAAACATAAGCGAGTTACGGTCATTATGGCATAATTTGGTACGAGGTCAGCGGCATTTTGAATAGCACTGTGAATATTGTGTAAATTGAAGCCTTGATATATGGCTACTATTGCGACCAATGATACCCCAATGGCGAATAAACTTGGCAGATGCTGAAGCTGATATTCACGTTGTTTATTAGGGATTAATAACGCATAGCTCAATGTTAATCCACCTAATACAACGGTAAGGTAGAATGACCAAGAGGTTAATGCATTATTCCAAGTTGGTATGCTTGTAATATGGTAAACCTGATTCATTACATACATAAATAGTATGCCGATAAGGGCGGTCACAATTCGCCATACATTTCCAAGTGAAACTGGCATTTTACCTAAAATTGCAATCAGCCAGTAGAAACCTGCTAATGTGAAAAATATTGCACCAGCGGCAATTTCATTACTCATCATTGATGAGCCGACTCGATTAAGTGAATTAAATGCACGTATAGGTAAGCCAAGATGCATAATGGAAGCAATAAATCCAATACCTAGTAAAGCCAAAATCACAAACATTACTTTATGAATATAAGTGCGACTTTTTGTATTTTTCTCATTTAATAGTACAAATGTGAAAACAAGCCAAGCACCGACCGCACTTTGTGCCAAAACTGTAAAAAATACTAATGGCAGTTCATATAATCCTGTATTCATCTTACACCTCTCTTGGGTTTCCTAAGAACCCACTTGTATCGCCACTTAAACGAGCGTATTTATTGGGTTTTACCACTAAATTTGGTTGAGTGATATCAGTCGGTGGTAGTGGTGCGATGGAGGCTTGTGTGCCATATTTTGTTCGAAGTTCATCAATAGGAGCGAAATCCAATGCTCGTAGTGGGCAGGCATCAACACAAATCGGTTTTTGACCTGATTTTACGCGAGAATAACATCCATCACATTTTGTCATATGACCTTTTTGTGCATCATATTGCGGTGCATCATAAGGACACGCCATATGACAATAACGACAACCGATACAAATTTCTTCATTGACGATCACGAAACCATCTGCATTTTTGTGCATTGCACCAGTTGGGCAAACTTTTGTACAAGCAGGATCTGCACAATGATTACAAGAAATAGACATATAATAGGCAAATATATTTTGATGCCAGCATCCATCTGCTTGTTGATTCCACTGACCACCTGTATATTCATAAATACGACGAAAATTGACTTCTGTGCCAAGATCTTTGTAATCCTTACAGGCTAATTCACAAGTTTTACAGCCTGTGCAACGTTCAGAATCAAAATAAAAACCATATTGTTCCATAATTCTCCCCCTACAAACGTTCCACTTGAACTAAATTAGAATGTTGCGGATTACCTTTCGCAAGCGGTGATGGGCGTTGTGTCGTAAGTACATTAATGCAACCTGAATGATCGATACGATCTTTATCTGGTGCATACCAAGCCCCCTCGCTTAATGCCACAACCCCTGGAATAATACGGGGTGTAATTTTTACATTAATATGTACTTCGCCTCGATCATTAAAGATACGAATCATATCGCCATTTTTAATATTACGAGGTTCTGCATCAATAGGATTCATCCAAACTTCTTGTGGATTAGCTGCTTTTAATACATCCACATTGCCATAAGTTGAATGGGTTCTCGCTTTATAGTGAAAACCACTTAGTTGTAACGGATATTTTTCCATTAATGGATCACCGTAATGCTCAAAACTTTGGGCGTGAATAGGTAAGGGATGAATTACGTCATCTTCTGCTAATTTCCAAGTTTTTGCTATTTCAGCTAGACGAGAAGAATAAATTTCAATTTTGCCAGATGGCGTTTTAAGTGGATGGGCTTCTGGATTATCACGGAAATCTTTGTATGCAACTTTAAAGCCATTAGGATCAACTTTTTTAAAAATACCTTGTTGTCTAAATTCTTCAAAAGTAGGTAATTCAGGTAATTTTTCTCGAGATTGCTCATAAATATGGCGTAACCATTCTTCTTGTGTTCGTCCTTCAGTAAATTTTTCCTTTACGCCCATTTTCTCAGCCAAATCACTCAACATATCGTAAATAGGTCTACATTCAAAAGATGGTTTAATCACTTGATCTGCAAAAATGACATATGCCATATTGGATACAAAGGCATCTAAAGCGAAATCCATTTGTTCTGAAGTTGTACAATCTGGTAATAAAATATCACTGTATTTGGCAGTAGATGTCATATGATTATCAATAGTAATGATCATTTCACATTGCGTATCATCTTGTAAAATATCGTGAGTACGATTGATTTGTGCGTGTTGATTAATCAAACAGTTACTTGCGTAATTCCAAATTACTTTAATTGGGGACGATAATTTATCAACACCACGAATACCATCTGTAAGTGCGGTCATTTCTGTGCCACGAATAATTGCATCTGTCCATAAAAACATTGGAATGCTTGCTTTCACAGGATTTTTTAGCGTTGGCATCCGTACAAATGGAATGCTATACGCACTTTCACGTGCACCAGTGTTACCGCCGTGAATTCCAACATTACCTGTTAAGATTGGCAACATCGCAATGGCACGAGAGATTAATTCTCCATTACTACGACGTTGAGGCCCCCAACCTTGGGAAATAAAGGCAGGTTTTGTACTACCAATTTCACGTGCGAGTTTAATAATTCTCTCCGCCGGAATACCCGTGATTTTAGCCGCCCATTCTGGGGTTTTAGCGATACCATCATTACCATAACCTAAAATATAGGCTTTATAATGACCATTTTTAGGGGCATCCGTAGGTAATGTTTTTTCATCATAACCAACACAATATTTATCTAAGAAAGGTTGATCCACGAGATTTTCTTGAATCATTACATAAGCAAGGGCAGCAACAAGGGCTGCATCAGTACCTGGACGAATTGGGATCCACTCATCTTCACGCCCTGCACCAGTATCATTATAACGAGGATCGATAATAATCATTTTGGCATTGGAACGAGCTTTGGCTTGTTCAATACAATAAGTTAAACCACCTCCACTCATACGAGTTTCTGCAGGATTATTACCGAATAACACTATTAATTTGGTGTTTTCAATGTCAGCCATTCCATTTCCCAATGCCCAACCACCACCATAGGTATAATCTAAACCGACAGCAATTTGTGCGGTGCTGTAATCACCATAATGGTTTAAATATCCACCAATACAATTCATAAAACGAGCGATCATAGTGGATGCAGGTGGCCAAGATTTAGCCATTGTGCCACCGAGTGTTCCCGTACCATAGTTTAAATAAATTGATTCATTGCCATATTTTTTTATATTGCGTTTCAATGCGTCTGCAATTTCAGTTAAAGCCTCATCCCAACTGATTCGTTTGAATTTGCCTTCTCCGCGTTTACCTATACGTTTCATTGGATATTTTAAACGGTCTGGGTTATATACTCGACGACGCATAGAACGTCCACGTAGACAAGCACGAACCTGATGATCAAGATTATATGTTTCTGTCCCCGTATTATCGGTTTCCACATAAGTGATTCGGTTATCTTTTACGTGCATTCGTAATGGACAACGGCTACCACAGTTTACTGTACAAGCACTCCAAACAATACGTTCTTGATTATTTTCATTGAGGCGTTGTGTCTCTTTAGCCATTACATTGAAAGGTAAAGTAAGATTTGAAACTGCCAGTGCAGCTCCCGCAGATGACGCCTTGACAAAATCTCGGCGACTTATTTGATTAAAGTTACTCATTATATCGTTCCCCCACAGTCAGATTGAAAAATAACTAAAACGAGTTAATTATAATCTTTGTATAGAAGTTTTACTTGAGCCAAATCAATTAATCATTAATAGGTATATTATTTATAGGGTATTTTAGTAGATTGATGTTTTAATAAACTTTGGAATAACAAATTGACTATGGATTTAAAAATCCGTTAGCATAGTGGCGTGTTAGTTTATCTAATATGTTAAGTTTAACTATTATTAACTAGAGGATCTTTTCATGAAGAAACTTATCGCAGTTGCGGTGCTTTCTGCATGTGGCTCGTTAGCTCATGCAAACACTAATATTCCAAACTACAATACAGACGCCCATCTTTACGAATTCACGCAAACCTATGATTTAGTTGTGCCAAAAGGCTCGCAAGGACAAACCAATTTATGGGTTCCATTACCATTTAATGGGGAATACCAACAAGTGAAATCGATTCACTTTGAAGGTAATTACATGAATGCCTATGTAACAGAAAACAATAAATACGGAGCGAAAACCTTATTTGCCACTTGGAATAAAGATGCACAAAAGCGTGATTTAAAAGTCATGATGGTCATTGAAACAAAAGACCGTGAACCGATGGTGAAAGGTGCTTTAGAGAATTATACTCCGCCAAAAGATATTCAGTATTCCGTGGATGTACAAGAATACTTAAAAGCTACTCCACATATTAAAACTGATGGCATTGTGAAAGAATTTCCTGACAAAATCCTAGGTAAAGAAACTAATCCATTGAAAAAAGCAGAACTTATTCACCACTGGTTCGTAAAAAATATGGAACGTGATAATTCTGTATTAGGTTGTGGTGACGGCGATGTAGAAAAAATTCTTACCACTGGCGTGTTAAAAGGTAAATGTACCGATATTAACTCTGTATTTGTGGCACTTGCTCGTGCTGCAGGCATCCCTGCTCGTGAAATTTTTGGTATTCGCTTAGGTGCGGCAGAGAAAATGGGCAAATATTCAAAAGGTGCCTTCGGTAGTGCAAATGAACAAGGCATCGCAAACGTAAGTGGTGGCCAACACTGCCGCGCTGAATTCTACCTTGCAGGGTTTGGATGGGTACCAGTTGATTCCGCAGACGTTGCCAAAATGCGTTTAGCAGAGAAAAAATCTGTTGAAGATAAAGATACACAAGCCGTAGCAAAATATTTGTTTGGTAACTGGGAAGCAAACTGGGTGGGATTTAATCATGCCCGTGACTTTGATTTATATCCACAACCAGAACTGGCTCCAATCAATAACTTCGGCTATCCATATGCAGAAGTAGGTGGCGATCCGTTAAATTCCTTTGATCCAAAAGAATTTAAATATGACTACGTCTCTAAAAAACTCTAATAAATCCTTTTGGGTTGCCATAGCGCCGACTAAGTGCTGCGGTGGCATCAACCTTGTGCTGCATCGCACCATTAATTTATTTAGTATTTGGTGTGTCGTCCACTTGGTTGATTGGCTTAGGCGAATATGATTATTTGCGTATTCCCATGCTTATTATTTCATTATGCGCCTTTGCCTATGGATTTTGGCTGTTGATGTTTTCCAAAAAAATCATTTGTAGCAAATATATTTCCCGTAAAAAACTCATCGTTTTATATTGGATTGTATTTATTGTGATGATTTTTTTCTTAACCTATCCAACAATTTTGCCTTGGATTTTAGAATTAGCTAATTAGGAATAAAAATGAAGAAATTATGTACCGCACTTTTGCTTTCGCTGTTTGCAATCTCTTTCGCTCATGCGAATGAAACCAAACAAATTGTGCTAAAAGTAAAGGAAATGAATTGTCAGCTTTGTGCTTACTTAGTCAATAAAGAACTGCGTAATATCAATGGCGTTATTTCAACAAAAGCATCTATTAAAGATGGTTTAGTGACGGTTGTGGAAGATCCAAATGTCACAAACCAACAATTATTCGATGCAATTCACAAGCTGAAATATACTGCTGAAGTCGTGAATTAAACGCTAAATATCTAGCAAAAAAGTGCGGTAAAAATTCACCGCACTTTTCTTTAGCTATTAAATTAGACTAATTTTTTAATTAGTTTGATTACAGTACAATTAATTAAATATGATAAATGCAATATTATTCAGCACTTTCGCTTAAAAATCCGCCACTTTGATGATTCCAAAGTTTAGCGTACAGACCATTGAGCTCTAGTAATTCGGCGTGCGTACCTTGTTCGACAATTTGTCCTTTATCAAGCACAATCAGGCGATCCATCGCTGCGATGGTGGATAAACGATGGGCAATGGCAATCACAGTTTTATTTTCCATCATCTTATCTAGACTTTCTTGTATTGCCACTTCCACTTCTGAATCCAATGCACTTGTGGCTTCATCTAACAATAGAATTGGTGCGTCTTTTAACATTACACGAGCAATGGCAATTCTCTGACGCTGACCACCAGAAAGTTTTACCCCTCGTTCTCCCACATGGGCATCATAGCCTTTTCTACCTTGAGAATCACTGAGAAATGGGATGAAATCAGCGGCTTCCGCTCGTTCAGCAGCTAAAACCATTTCTTCATCAGTAGCATTCGGGCGACCATAAATAATATTGTCACGTACAGAACGATGTAGCAAGGAAGTGTCTTGAGTGACTAAACCGATTTGGCGACGTAAGCTTTCTTGTTGCACATTGAGTACATTTTGTCCATCAATGGTAATTTCGCCTTGTTGTGCTTCATAAAAGCGAAGCAATAAGTTCACAATCGTAGATTTTCCTGCACCAGAACGACCGATTAACCCAACCTTTTCCCCTGGTTTGATAGTGAGATTGAAATGATTGAGTAATGGTTTTGTCGGATCGTAAGCAAAGGTAATATCGTTAAACTTAATTTCCCCTTGTTTCACTTGTAACGGTGACGCTTGTGGTTTATCCACAATAGTGTGAGGTTTGGTTAAAGTATTCATTCCGTCGTTTACGGTTCCGATATTCTCAAACAAACGGGCAGATTCCCACATAATCCAGCGAGAAAGCCCATTTACGCGTAATGCCATTGCCGTTGCCGTTGCTATTGCACCCACGCCAACTTGACCATTTTTCCATAAAATAATACCAAGTATTGCAGTACTTAACGTAAGTAGAATATTTGTAGCGTAAGTGAGTGTATCTAGTGATGTTGCTAAGCGCATTTGGGCGTGTACTGTTACCATAAAATCTTGCATAGAACGCTTGGCATAAGTAGCTTCGCGTGAGCCGTGAGAAAATAATTTTACTGTAGCAATATTAGAATAAGCATCTGTAATGCGTCCTGTCATTAAAGAACGAGCATCAGCTTGTCGTTGTGCGGTTTTTGATAGTTTAGGAATTAGGGTTCGTAGGATCAAACCGAAGAGTATAATCCAAGTAATAAATGGTAATAAGAACCAAGAATCTAATGCCACTAGCACTACGCCAGAGGTAATAAAATATACCAATACATAAACGAACATATTTGCAAGTGTAAGTACTGTGTCACGTACTGCAAGGGCGGTTTGCATTACTTTTGCGGATACTCTACCTGCAAATTCGTCTTGATAAAAACTTAAACTTTGTCCAAGCATTAAACGATGGAAATTCCAACGTAATCGCATTGGAAATACGCCTTGTAAGGTTTGTAAATGCACGGCCGAAGCTAAAAATCCCCACACAATACTAATAAGTAATAGAGCAGCCATTCCAATTAATAAATGACTTTTTTCTTGCCATAATCTTTCAGGTGTAAATGTGCCTAACCAATCTACAAGCGTTCCCATAAATTGGAATAATACAGCTTCCATTACACCTGTACCTACGGTTAAAATTGCGAGCAAAAAAATCCAGCCTTTCATTCCTGTAATACTAGACCAAATAAAACGGAACAAACCTTTTTTAGGTGTTGTTGGATTGCTTTCTGGATAGGGATTTAAACGATTTTCAAACCACGAAAAAATTTTGTTAAACAT
Protein sequences of DBSCAN-SWA_1 >NC_000907|1105411:1117497|1107904_1108153_-|WP_032828348.1|DBSCAN-SWA MGELLKHALVKGITTCQTLPSPLDVIEGPLMAGMDVVGDLFGDGKMFLPQVVKSARVMKQSVAYLEPFIMQPNKKVQATVKW >NC_000907|1105411:1117497|1105411_1106326_+|WP_010869113.1|DBSCAN-SWA MKCVDLFSGCGGLSLGFELAGFEICAAFENWEKAIEIYKNNFSHPIYNIDLRNEKEAVEKIKKYSPDLIMGGPPCQDFSSAGKRDISLGRADLTYSFANIVCNIRPKWFVMENVEQIKKSHILQDIINQFIDFGYGLTSAILDASYCGVPQSRTRFSLIGKLNSEHNFLIPTLSRKLSDKPMTVRDYLGNSLNLEFYYRHPRNYNRRGIFSIDEPSPTIRGVNRPIPKGYNINSCDPKGVELAKVRPLTTIERSYIQTFPKSFLFSGTKTDLEQMIGNAVPVNLAKFVASAIINFEKEPIRSMG >NC_000907|1105411:1117497|1111122_1113543_-|WP_005693382.1|DBSCAN-SWA MSNFNQISRRDFVKASSAGAALAVSNLTLPFNVMAKETQRLNENNQERIVWSACTVNCGSRCPLRMHVKDNRITYVETDNTGTETYNLDHQVRACLRGRSMRRRVYNPDRLKYPMKRIGKRGEGKFKRISWDEALTEIADALKRNIKKYGNESIYLNYGTGTLGGTMAKSWPPASTMIARFMNCIGGYLNHYGDYSTAQIAVGLDYTYGGGWALGNGMADIENTKLIVLFGNNPAETRMSGGGLTYCIEQAKARSNAKMIIIDPRYNDTGAGREDEWIPIRPGTDAALVAALAYVMIQENLVDQPFLDKYCVGYDEKTLPTDAPKNGHYKAYILGYGNDGIAKTPEWAAKITGIPAERIIKLAREIGSTKPAFISQGWGPQRRSNGELISRAIAMLPILTGNVGIHGGNTGARESAYSIPFVRMPTLKNPVKASIPMFLWTDAIIRGTEMTALTDGIRGVDKLSSPIKVIWNYASNCLINQHAQINRTHDILQDDTQCEMIITIDNHMTSTAKYSDILLPDCTTSEQMDFALDAFVSNMAYVIFADQVIKPSFECRPIYDMLSDLAEKMGVKEKFTEGRTQEEWLRHIYEQSREKLPELPTFEEFRQQGIFKKVDPNGFKVAYKDFRDNPEAHPLKTPSGKIEIYSSRLAEIAKTWKLAEDDVIHPLPIHAQSFEHYGDPLMEKYPLQLSGFHYKARTHSTYGNVDVLKAANPQEVWMNPIDAEPRNIKNGDMIRIFNDRGEVHINVKITPRIIPGVVALSEGAWYAPDKDRIDHSGCINVLTTQRPSPLAKGNPQHSNLVQVERL >NC_000907|1105411:1117497|1110494_1111112_-|WP_005656008.1|DBSCAN-SWA MEQYGFYFDSERCTGCKTCELACKDYKDLGTEVNFRRIYEYTGGQWNQQADGCWHQNIFAYYMSISCNHCADPACTKVCPTGAMHKNADGFVIVNEEICIGCRYCHMACPYDAPQYDAQKGHMTKCDGCYSRVKSGQKPICVDACPLRALDFAPIDELRTKYGTQASIAPLPPTDITQPNLVVKPNKYARLSGDTSGFLGNPREV >NC_000907|1105411:1117497|1114947_1115241_+|WP_010869116.1|DBSCAN-SWA MASTLCCIAPLIYLVFGVSSTWLIGLGEYDYLRIPMLIISLCAFAYGFWLLMFSKKIICSKYISRKKLIVLYWIVFIVMIFFLTYPTILPWILELAN >NC_000907|1105411:1117497|1115652_1117497_-|WP_005686318.1|DBSCAN-SWA MFNKIFSWFENRLNPYPESNPTTPKKGLFRFIWSSITGMKGWIFLLAILTVGTGVMEAVLFQFMGTLVDWLGTFTPERLWQEKSHLLIGMAALLLISIVWGFLASAVHLQTLQGVFPMRLRWNFHRLMLGQSLSFYQDEFAGRVSAKVMQTALAVRDTVLTLANMFVYVLVYFITSGVVLVALDSWFLLPFITWIILFGLILRTLIPKLSKTAQRQADARSLMTGRITDAYSNIATVKLFSHGSREATYAKRSMQDFMVTVHAQMRLATSLDTLTYATNILLTLSTAILGIILWKNGQVGVGAIATATAMALRVNGLSRWIMWESARLFENIGTVNDGMNTLTKPHTIVDKPQASPLQVKQGEIKFNDITFAYDPTKPLLNHFNLTIKPGEKVGLIGRSGAGKSTIVNLLLRFYEAQQGEITIDGQNVLNVQQESLRRQIGLVTQDTSLLHRSVRDNIIYGRPNATDEEMVLAAERAEAADFIPFLSDSQGRKGYDAHVGERGVKLSGGQRQRIAIARVMLKDAPILLLDEATSALDSEVEVAIQESLDKMMENKTVIAIAHRLSTIAAMDRLIVLDKGQIVEQGTHAELLELNGLYAKLWNHQSGGFLSESAE >NC_000907|1105411:1117497|1109653_1110493_-|WP_005693381.1|DBSCAN-SWA MNTGLYELPLVFFTVLAQSAVGAWLVFTFVLLNEKNTKSRTYIHKVMFVILALLGIGFIASIMHLGLPIRAFNSLNRVGSSMMSNEIAAGAIFFTLAGFYWLIAILGKMPVSLGNVWRIVTALIGILFMYVMNQVYHITSIPTWNNALTSWSFYLTVVLGGLTLSYALLIPNKQREYQLQHLPSLFAIGVSLVAIVAIYQGFNLHNIHSAIQNAADLVPNYAIMTVTRLCLLSIVAFLLFRVKNIGLLGISVLLTLVAEGIGRVLFYGLHMTYGMTIGG >NC_000907|1105411:1117497|1108430_1108931_-|WP_010869114.1|DBSCAN-SWA MKNEAYYQAYLSHHHISRRGLLRHVFPATKSTIEKTQSRPPFSAREDLFSAVCNGCGECASACPNGLIQLKQQQATLEIDYAPCDLCGKCAEVCPTNALHPNFPGDTLLRPQFSSACLILQNQTCPDCQTACPLQAISSTLEIDNERCNGCGECKITCFVAAITLK >NC_000907|1105411:1117497|1108930_1109542_-|WP_005693380.1|DBSCAN-SWA MQNTLQQISIYGRLLGAVFYYEPNDARLTDILTFFRQPNWMQEWEISFDVKTHKKITALIEKGLQQNITEQYQYLFIGPNELPTPPWGSVYLDPECVIFGNSLLALRDFLQQHQIAFQTQQDEPEDHIGLMLMLAAYLAENRPHLLTKFLREHFLTWAYHFLEQLSKIENSDFYQALALLTIKTLQQWQVDLHINVPTVRFYR >NC_000907|1105411:1117497|1115249_1115528_+|WP_005662887.1|DBSCAN-SWA MKKLCTALLLSLFAISFAHANETKQIVLKVKEMNCQLCAYLVNKELRNINGVISTKASIKDGLVTVVEDPNVTNQQLFDAIHKLKYTAEVVN >NC_000907|1105411:1117497|1113796_1114906_+|WP_010869115.1|DBSCAN-SWA MKKLIAVAVLSACGSLAHANTNIPNYNTDAHLYEFTQTYDLVVPKGSQGQTNLWVPLPFNGEYQQVKSIHFEGNYMNAYVTENNKYGAKTLFATWNKDAQKRDLKVMMVIETKDREPMVKGALENYTPPKDIQYSVDVQEYLKATPHIKTDGIVKEFPDKILGKETNPLKKAELIHHWFVKNMERDNSVLGCGDGDVEKILTTGVLKGKCTDINSVFVALARAAGIPAREIFGIRLGAAEKMGKYSKGAFGSANEQGIANVSGGQHCRAEFYLAGFGWVPVDSADVAKMRLAEKKSVEDKDTQAVAKYLFGNWEANWVGFNHARDFDLYPQPELAPINNFGYPYAEVGGDPLNSFDPKEFKYDYVSKKL >NC_000907|1105411:1117497|1106471_1107911_-|WP_080003770.1|DBSCAN-SWA MVIATVKGDVHDIGKNIVSVVMQCNNFEVIDLGVMVPADKIIQTAINQKTDIIALSGLITPSLDEMEYFLGEMTRLGLNLPVMIGGATTSKEHTAIKLYPKYKQHCVFYTSNASRAVTVCATLMNPEGRAALWEQFKKDYEKIQQSFANSKPLRKQLSIEEARDGFSGEWADYVPPTPKQTGIVEFKNVPIAELRKFIDWSPFFRIWGLMGCYPDAFDYPEGGEEARKVWNDAQVVLDELEQNHKLNPSGILGIFPAERVGDDVVLFSDEERTQTIGTAYGLRQQTERGKNSKSPFNFCLSDFIADRQSGKKNWFGMFAVCVGVEEMELVEGYKAAGDDYNAILLQAVGDRLAEAMAEYLHFELRTRIWGYTQEEFDNQGLINENYVGIRPAPGYPSWPEHTEKALIWDLLEVEQRIGMKLTESYAMWPAASVCGWYFTHPASNYFTLGRIDEDQAQDYAKRKGWDEREMMKWLGVAMK |
12 | Escherichia_phage(71.43%) | NA | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_2 |
1500121 : 1513073
Sequences of DBSCAN-SWA_2
Nucleotide sequences of DBSCAN-SWA_2 >NC_000907|1500121:1513073|DBSCAN-SWA CCTAACTGTTGTAAGTTTTGTTGAAATCTATTTTTGGTGCAGCTTTAGGCTCCGCATCACCAAGCAAAATATTACCGAGTGATTTACGTTCATCCGCTAATTTCGCCACAACCACTTTTGCTGTTTGATATGCACCCGAAATTTCCTCATCGGATAATTTGGCTGCCTCATCTTTAGTAAAAATGCCCTGCGCAACTACCGCACTTTCTTGGATTTCACGCACAGTCGCGTTATCCGCAAAATTGACTTCTTTAAATGCAGTTTTAGCATCAGCCAACACGGCAGCTTGTTTTACTTCTGCGTCACGTTTTGCTTGTGCATCTTTTAGCTGTTGAATTTCTTCATCTTTAGCTTTAAGGCTTTTTTCAAGCTCTTCTTTTTCCACGTCATCTTCCTTTTTATTTTCAGGTTCAGATTTTTTTTCTTTTGGTTTGGTTGGTTGTTCGCCTTTTGGCTCTTTACCTTCTTCACTACCAGACTTTTCTTCGTCCTCAATTTGTTTTTTCTGTTCGTCCGACAACTTGATGCCGAACGCACCTAAAAACGCATCGAGAATTTTTGCGGTTTTCCCCATAATGGTTTTATCCTCATCGGCAAGTTTTACACTTCCACCGCAGCGACCCTTTGCCACAATCGCTACGTGGTTGCCGATCATCGGCGACATCTCAAAATCTGCATCTTGTACCGTGGATGGCTTAATATCGCAGTCATATCCGCAAGATAATTGTTCCACACCGTGCTCCTGTACGGTTTTAATGGCTTGTTCATCATAAATCCAAGCCTCGGCTGTGAGTTCATCGCCCACTCGCTTAACATTACGCACGACACCGACAGAAAGCTGTTTCCAGTTTTTCGCATTCACCCCATCTTTAAGATGACCAACGGTTAATGTTGCATTTTCAAAACTCTTAATCGTTTCATCGCTAAACAAAGATTTCTCGGTGCGAGCAACTTTTTTAATACCGTCTTCTTTTAGCCCAAGTTCTGTAGCGAGGTAATCAAATACCCCAACTTTAGAAATGGTTGCGGGCACAACTAAAAAACCATCTTTAGTGATGGTTCTTTGTGTGTCTGCTTGAGTAGTTTTGTCTGTAAATTTCATTTATTTACCCCAATAAAAAACCCGACCATTTCTGATCGGGTTATTTGTTTTTTTGCAATATCACGCCAACATTTGGCTAATTATTGTTTGTGCTACTTGTTTTATCGCATCAAGTGATAAATCAAGGCTTTTGCTTTTTATCGTAGTTTTTAAGCTATTCCAGACAGTATCGTTGCGGATTTTGTCTAAGAGTTCATGACCTTGCCAAGTCAGCAACCGAGCGATAAGACTCATCTCATTTAGAGAAGAATAATCTATCGCTTCAATCAGCCCTGCACTTTGCAATAACTTAAAATGATAAGATACAGTTTCTGAATCGAAACCAGTAAATCCATCAGGTAATAAACTCCCTCTAGCCTCTGACTGACTTTCCAATTTAAGCAATATAGAGCGAATTAAATCCCAATTACGTTTCATTCTTTGTTATCTCTTGGCCAAAGCATATCCACAATCTCATCATAAGATGATGTTTAGGCTGTTTAACATTTGAACTAATAGTGGTAAAATAAGCTAAACCGTAGATTGAGCTTGGGAACGTTTTGGACGTATGCGGATGCGAGTTAATAAACTAGGAATTACGCACCAAACTATTCTGCGGTTATTTTTTTGATTTCCGCCTATAAACAACCCAATCGAAATGATTGGGTTGTTTGAATGGCTGAATTTAATTTAGAGCCATCATTTGATGGTAAGCATTACGCTTGCTTTCTCGCAAGGATTGTATTTCTGACTTCGTCAGGTGTCTTACGTGAATTAATGATGAATCTTGCTTCCCATTCTGTAAACCGCGAGAAGTCGTAGCCAAATTCTTTTTTCCACCAACTTTCAAGTTCGCCATATTTACTCCGTAATTCTGCTAATGTGTGTTTAGATAGCCTTAATTGTACAGAATATTGTTTGCCGGTTAAAGCATAAGATGCAATAACTTTTCCTTTATTATATAGCCTTTTAGACTAGCCAATGTACCGCCTTGTGTTTGTGTGTCATCTAAAATAATAGCATATTTATCTTTTGGAACTATGCCATCAAAAGCTGGAGAATAAACCAATCGATGCCATCCATCTCCCCCAGTTCTAGATACTTTTGTTGCTTGAACAATTGATAAATCAACAGGAATATGGAGTTTTTTAGATAATACAGTAGCAATAGCTACAGGAATCATATTTTGACCAACGGCTTCTTCTGCATGAACAGGAATTAGAATTGCATTTTTATTGCCAACCAATTGCTTCAATTTATTTACCGCATCATCTGTAACTAAATCTTTAGCAAGTTGATAAGCATCTTCAATACTACCCTTTTTAGCATTTTCATATAGCGGATGTGATGTTGCATCTCCTAATTTCCTATCAATGATAGTATCAGGGAAATCATCAGACCATTCTGAGCGCATTTGTTGTTTTTCCTGTTGGCTAACTATTGGGCTATTTTTCACTATCTGCTCGTTATTATCAAGCACTGGAATCTGAACACACCGACAATTAAAATCATGACCAGGATGATCAGTATCAGCAGGCGGATTGGCATATTCAAATATCTGCCCATCTTTTTCCGCATGGCTTTCGCGTACACGCTCATCAAGCGATGCTGACCACATATATTTTTTTATGCCAACCTCTTCATGTCTCGCTTGCGTTAAGGCGGCATTTAATTTTGAGGACTGGTCTCGCGCAATAAACATTGCTCGTTTTTCGGTTGTTTTACCCAAGTCTTTTATTTGTGCTGCAAGGTCTTTATTTAAAGAACCTCGAACCATTGCTTGCATGACGGCATTTTGCACTTTATCAAGATATTGTGAGCGAATAGACTTAATTAACTGGATATTACCAGCGGTCAATGCATTCACTTTCTCAGTAATATTTGGACTATTGCGTAAATAGGCGGATAAATCGATGCCAGTTTGATTTTTTAGATTGGTTGATACTTCAGCATGGTTTTGCGCATCACCACGACTAACAAAGCCATTGGCGATATTTTCGGCCTGTGAAGTGCGGTCTGATTTTTCGTACTTTTCTAATACTTTCATCAGTGCTTTCGCACTAATCGCTTGAAATCCTTTTGCATCATCCATAAAAAAAGAGCCTTGCGGTTGTTGCAGGGCTCTTTCTACATCATTGGTCATCATTTTGACGAACTGCTTAAGCTGTTGTCTATACCAAAGCTCCGTTCTCTTACTCATCTTCACTGGCTTGAACTTGCGTGCTCTCGCCTTCTGGTTCTTCAAAATTTCTGGCAAGTTCATTAGCATTTTTCATTTCCTCAATGTCATCAGCAGAGATATTGGCAAATAAACCACTTTCTCGGAGTTCGTTTGCTACTTGATATTCATTTACTACGCCATTTTGAATTAACGTATTTGCCGCTGTAGCAAAGGTATTAAGCATATTGACTTGTTGTTCTTGTTTAACCACCGTCAATGGTAAAAACTCAAACCACCAGTCATCAGGTTGCCCACCAAATAATTCATTGCATAGCAGTGTATCAAGCACTTCAAGCACAGGACGCAATCTTGTTTCTTGCAATCGATGAATGGATTCGTGGTAGTTTTGAATATCCTCATCTCCACTTGCCAATCCCGAAACAGATTGCCCAAACAAAATGGTGACTGGCATATCTGCCGCACCTGCCACCGCATTGCGAAACTCTGTCAATAAATCTTTTAACCCACCAAAAGATAATTCTTTTCGGTCGTACTCATTTTCCGCATCAAGCAACAGACTATTGGTTGCTGATTTAATCGACTGCACCGCTGAAATAACGTGAGCCACATCATTTTCTAAGCCAGCTGAAATCTTGTCAGATAACCCTGCAATTTTGAAAATATCGATTTTACTTTCAAAAATAAGGTCGCCGACATTCGCTGAGGCACTATCAAAGCGTTTAAGTACATCAATAATCTTTTCAAGGTCTGATACACCCCAAATATCGTTATCAGATAATGGCGCATCATTGGCATTGATGATTAATAAGCGTGAATGATGCACTGAAACAGATTGTGTGCCGCCAGTAATGGTATATTCACTGTATCGACCAAAGTTTGGCGAAAATACATCGTCATCTCGTTGTCCTGTCGGTGAGATTTTCCATTTAGGTAAGATAATTAATCGTTTTAATCGTTCTGTAGGCTGCAATGGCGAAGTGATGTTAATTGTGTCAGTGACAACCAATAAACCCACCGCCCCATACAAACTAGACCATTGCAACGCTTTAGTTAATGTCTCACGCAGTTTTAATCTACGTTCAAGCTTAGTGAACTCGTCTAGCTGTTCAGATTTCAAGTCATTCGAGAAAATATCACGCCAATTACGCACCATATCTTCCGAACGTTTAATACAAACCTTATTTGCAATCCAGTTATCACGCCATAATGCTTCGATTTGCATTAAGTCATCGGTTAAACTAAGCCCACGAGCATAATATGTCTGGTCTTGTTTGCTACCTAACTTTAGCGCAAGTGATTTGATGCCATCTAAAATATTCATCTTATAAATCCAGTAGTGATTTAGGTTTTGTCGGGGCGTAGCACATAACTAAAGCATCCGCCATATTTGGAGAAGGTATGCCACGTTTTTTCATATCCTTTTTGCTTTCAACCTTTACCCGCCCGTTATTGTCATAATCAACACGAGGACGTGATAATTCTGCTTTCAAATACTCAAGCTCTTTGATTTTGCTCGATAGGCTTATCAGTTCATCGTCAGGATAAACATCCCCATACTTTACTGCTCGATAGGTTTTATAGAATCTATCTCTCAACGCCCACCAAGATTGGGCTTTAATGTTCGAAAACATATCTTGATTCTTTTTTCCTTTGATATATTCACGCTCGGGATAAGCAACTGCACCACCAGCATTAAATCCTTCCACTTGTAAAGATTTTGGCAAGCGTTTAAAGTGAGCTTTTACTCCCGCCCCCACGCCAATACTATCGAATATAATCAAATCAGCTTTAAATTTGACCGCACTTTGATTTGTTCGGTTGGCGGAATCAATCACATCGCCATTTTTCCAAACTTCAATGTCAAGCACCACAGAACCGTGAACAAATGCATTAGCGTTACTATCCGCACCCTCATCAGCCACATCAAAGCCAACTTTCTTCATTCCTTTAGCGGTAAAACCGAGCTTGAGATGCGCATCTACCGCATATTCAATCCATACAGGCTTAATAATCGCCAAATCACTGTCTGCAACAGGCTCGCCCTCATAAACGTGACGATAAAGCTCGTAATCACGCTCACGCATCTGCTCCATATCTTCCATTAATTCTTTCGGAAAATATGGGTTGTCTTGCCAATTCACTAAGACCGATTTACACCGCTCAGGCGGATGAATCACAAAACGTTGATAGGTGTCATCAAGAATATTCTTCGGGTTAAAGCTCACAATAATCTGCGAACCGTCTTCACGAATGGTTGGAATCAATATATCCCAACTTTCTTTTGAAACATTCTCGCCTTCTTCTACCCAAACTACATCAATGCCTGTCATCGACTTAATCGAAGTAATGTTAGTTTTCAGCCCCGCAAACGTGAAGCGTGAACCGTTTTGCCCGATAATTTGCGTTTTCTGAACATCAAAAAAGGCTTGCAAGCTAAGCATTTCAATCTGATCTGCCAACATCTGAATCACAGAATCAGAAATCGATTTCTGAATTTCACGGAACACAAAACTCGAACAGGCGATTGATAGGCTCGCAATACTAATGCTCTAGCGATACTAAAACTTTTACCTGAACCTCGCCCACCGTAGAAAATAATAAACCGCCAAATAGATTCAAAGAGCGGTTTGAATTTTGTCGGAAATTGAATATTAAGCTGGCTCATCGCTAAATGTCACATTAATCACAGTAGGTAAGGGCTTGCCATCAGTTGTTACATCAACTTTATTGGTAAACATCCCTAAATGCTTCCCAAGCAATTCAAGGGCTTTATTTGCACCTGTCGGTTCAAAAACGAAACATTCGGTATTAACGCTTTGTGCCGTTCCTTCTTGAGCATTTTTTACCACAGTGGTAATAGTAAGTGGCTTTCTTCCCATACAAATATCACGATACTCTTGCAAGTCCGCAATGATATTATCTAGGGTAAGATTATGGCGTTGTTGATGGGCTTGTCTTAGTTCTTCAACCCTTACCGTAATCTTACCGTTCTTATTAAGTAACTCACTTGCCTTAACATTGATAACTTCAGTTGTCATTTTTGAGCAATCATAACTCTGCCGATATGCTTCACTGGCATTCCCCAGCTCAATATAAAGCTGGCAAAATTTTTCTTGTTTAGGTGTTAATCCACGACCAGACGTAGATTTTCCTTTCACGTCTGACATAGGAAATCCTTACTTAATAGGCAGTTCAATCTGCATCTTATCTTCAAAAAGTTTTAAAGTTGCTTCTAGCACAGGCTTATCGCCCTTCCATTCCCTCAACCCTTTACCACATAAACTCGCAAATGCTTTCTTCGCTTTATGCTCAATGCACAATTCGTTATATTTATGCATCAAGCTATAACCTTCTTGCTGTAATTTCTCACGCATAAAATCAAAGGCTTTAATAAACTCTACTTTGAATTTCATTGCTTTTTGGGTTCTATATCCCATTACCAAAAGCAAAAATCCATTTTTAGTCATTTGATACATGGGTTGTTTTCTGCCCCATTCATCGAAATATGAGGTCTCCTCAAAATTGAGGAGAGCAAACTCACCGCAATCTTGTTCAATAACTAATGCTTTGATATCACGGATGATGTTATCGTGACGTTTACCAAACACCGTGGCAATATGCCGAGAATTTGTCACAATACGTTGCTTGTCATTTACCTTTAAGAATTGTTCAAAGTTTTCAATTGTTTGTAGGTTCATTTTGGACTTCCATTAAATTTTAGATAATAAAAAACCCGACCATTTCTGATCGGGTTATTTAGTCCTAACAAAACTACCTAGAAGGCTTGGTTTCTACCAATTTAAAGATGTTAGACATTAGTCGTGGTTATTTACCGCCTTTTGCTTGATTAATCCACTTATTAAGATGATCTACTTGGCTTGCGCACTTATCTCGCTCTGCGGTTACCTTAACTAACTGTATGACTACATCGCCGTATGTTTCCCCAGTAAATGCTGTTTTGACACAAGGTGCAGTATAGGCTTGAGGCGGATAAATATATTCTGGTTTAGTCGTGATTTTATTCGTGCAAGCGGTCAAGAACAGACTGAGGCAAACGAGTGTGAGCACAAGGTTGAGTCTTAATGATTGTTTTAACTGATTCAGCATTTTCTGTTGCTATCCTTTCTATTTCATCATTACGCTCTTGTTGTAACGCAAGACTTAATGATTTGTTAGTATCTTCTTGTTGCTTTGTCGTTATTTCCAACTCATCTATAACGCTAGATTGGTAACGCAATGCACCAAACAAAACCACGACAACACCCACTAACGCTATGTAAATGTACTTAGTCATTATCCGTTACCATTAATGCTCGATAGAGCTTGCAACGCTCATCAATGCCATTTAGTCCACCATTAATTCTTCGCGTGACTTTTTCGACAGAATTAAGCTCAGCCAACTCATAGCACTTCCAATACCACACTGCAGTTTTAACAGATAAATCTAAATTCCCTGCCACATCTTCTGGCTCAATATCTCTACCTAACCATTTTCTAAATGCGGCATAATTATCCTTACCTGTAATCTGAATCAGTCCACGACCACGATACTTCCAACCATCTCCACTTTTCTCATCGCCATTACCCAAACGATTAGCATAAATACGATTGGCTATTAGCTCAGGTTTGCGCTCATATTTCTTCGCTGTAAGAGGGTCTGGGAAATATTTACGGAAAGTTTGAGAAAGCCCAAGCCAAGAATAATTTAAATTTTCTTTAAATCTTATAAATCCGCCACTTTCATGTCCACATTGAGCCAAAAACATCGCTTGCTGCATCTTATTCACACAACCTGCTTTTTCTATCTGCGCCGAAATAGCTTGATAAACACCTTTAACTGCGTGTGGAAAAATTTTATTAAATGTCACTTCGGAAATCATCATTGTCATCTTTTTCAATTCTCCGATTAATGAATTTAAATAAAAACTCGCGAATTTTTTCAGTACCAACAAAACCAATCATCGTACCGAGAAATGAAGAATATTCTGTATGCCCAAATAAATGCGTACAAATTGGCACCGCAACACCCGCAATAGAGGCACACATAGCCGCATCAATTAAAACATAACGAATAGCTGGCTTTTTACGCATAAACCCAAATCTTAAAAGAGAAATAAATAACGCCCAAAAAGCACTCTGTGCTGAGCTAGAACTAAGATTTGTTTGCAACCAAGACCATATTAACGCCCACACATCAGGCTCTTTAATTGGCATATATTTTCTCCCGCCTGTTCTTTAGGCAATAAAAAAGCCCCGACCGTTTCCGATCAGGGCTGTAAAATTCTTTCTTGCGTTTGCTATGCGCTAAAACCGCAATATAGTACATATAATACACTTTTAGTGTGCACTGTCAAGCGGTTTATGAAGTGCGCTAATTAGTGATGACGTGTCGCAAATATACCCATCGCAATCTTGGTTTAAATTGAGTTCGTATGCTGCCCATAACAACGCCACCGCAAAGAGAATTCTGAACATAATTTATCCTTTTTCGTGAATTTGAGGTGTAAAAATCCGCCACACGGTAAAGTGCGGTCGGATTTTCCGTTGTTTTTAGAAGTCGATTTTGACTGCTTTTGGATTAAAGCCTCGCAAGTGTTTTAATACACGCCAATTTGTCATTGGGTCGATGTTAAACTCTTGTGTAATACGGTTTAAGATTTGGTTTGTTGAGCGTAGACGCTTAAATATTCGTAAGCCTGTCCATATATATCTCCGCTCATATTTGAGCCTAGCGCCTTAAAGGCTTTTTCGATATGTTGGAATGTGACGATGCCACGCATGAAAGCGAACCACAACCAAACAAGCTGTTGAAGTTCATACTCGGTAAATTCAAAACTGAATTTCTTTTCGGGTTCTGGCAAGGCGAGCTGTTGCGGTTGAAGTTGATATTTTCCTGTTTTACGAATTTGCGGGAGAACTTCTTCAAATACCCACGCCTCGAATGGTTCGGCTTCTGGTTTACGGGATTTGATGATCAGACGGTAAAGATTTGGTTCGTTGATGAATGTCATTTCCTGATCTGCACTTTTTGTAGGGGTGTAACGTTTCGTTACGCCCCCTTGTTTGCAATGATCTTGTAATGCTTTTCTTGAATTTGTATATCCGAGAATGTGGCAAACATCCGTACCACAAAACCAAAATTCACCTTTTGGATCTAAAATCACGCGAACAGGAAGATCTTTAAAATTAAATGTTGAGAATTGAATTTGATTTTTCATTGTGTATTTCCTTTTTGAGAGGATTGATAATTTACCCATAATTGGGCGACCAACGGCTCAAAACCAGTACACAATCTGGCGGAGTTATTCCCTTTCGGTATTGTATTCCTCGCACCGTCGGTCATTGATTCTTTGAGAATTTTATAATGGCGGTAAAACTCTCAAATTTTAGATACAAAAAAATCACGCTGACGGGGTGAATGAATTCCGTTGTGTAAAAGGTTTTTGAGACCTTGAATAAAATAGTAGAGGAAAATTTGGAGAATGTAAAGCATGAAAATTATATTTTATTGTGAACCATACTTGACACCCTGCGAAAATTATCTAAAATAACGTCAAAGCAATCGATAAGGATTAATAATGACAATCCAAATCAAAACCACTCTGACATTTGATTCTTGGTTAAGCAAACTAAAAAACTTGCGTGCCAAAGCGAAAATAAACGCACGAATTAAACGCTTACAGTTCGGCAACTTTGGTGATATCAAAAGCGTGAATGATGGGATTTTTGAATTACGGATTGATGAAGGTCAAGGTTATCGAGTTTATCTTAAAAACCAGAATGGCGTATTAGTGATTTTACTTTGTGGCGGAGATAAATCCACACAAGATAAAGATATTAAACAAGCAAAACTTCTCGCACAGGAGCTAGGATTATGACTGAACAATTAAAAGACTTTGATGTGGCAGAACACCTCACTTCTGAAGAAGAAATTCAACTTTACCTTAATGAAATTCTACAAGAAGATAATATTGAGCTTATTTTATCCGCCCTTGGCGACATAGCCCGTGCGCGTAACATGAGCCAAATCGCACGTGATGCAGGAATAAGCCGAGAAGGTCTTTATAAAGCCTTATCTGGCACGGGCAATCCTACTTTTGCTACTGTAATGAAAGTAATGAAAGCCTTAAATTTACAATTCCAAGTGCAACAATCTCGATTCGCCTAAAAGAAATGCGGTCAAAATCGACCGCACTTTTCAGGCAATAAATAAATATTGCTTGCCTTCTGTTGATAATAGCAATAAAAGTGATGTTTTTACCGTTTTCAATCGATTGAAATATTCACGCCGTGAAATATGTAAATATCGCCAAATTCCTTGTTTTTCCCATCTCTTGATATAAGTCAGAACGAATACATCATAAAGTTCTGGTGTGACTTTTCTAATTACACCAAGGTAGCCATCAATTTCCATGCCTAATTCATCGCTTATAGGACGCATACGATATTTTTCAGCATAACGAGCATCACATTTCATCTCTGCAAACCCTGCGGCTACACGTGGAAATTCAGTCTCGAAAGATCCGCCGTTTTGCTCTAAGTACGGTACTGCGAATCCTATTCAGTTCATCACCAACTATTCGCAGTGGTTCGTGATGAGTTTTAAAACTTAACTTAGAATACATCACAATGACACACTTAAACTTAATTCCTGTTTTTAATGGCTTAATCCAAAATCAACCCGTTCAACTTTGCAACGCTCGTGAACTTCACGCATTCGTAGAAAGCAAACAGCAATACACTGATTGGATCAAAAACCGCATCAACGAATATGGCTTCATCCAAGATGAAGACTACCTCGTCATTACCGAACGCACCAACGGACGCCCACGCAAGGAATATCACATCACCCTCGATATGGGCAAAGAACTCGGTATGGTCGAAAGAAACGAACGAGGCAGACAAATCCGCCAATATTTCATCCGTTGCGAAAGAACATTAAAAGCCTTGCAACAACCGCAACAACTTGCCTTGCCAGAACCTGAGAAATTCACGCACGAATTCACCGAATTTGAAATAGAAACGCTCGTTTGGCTCCTTATCGGACATCACCAAATGAACACCCTACTCGGACAACTCGAAAAGCCACTTGACGCCATCGGCAGCAATCTACACCCCGCTGTGTACAGCTACTGGAAAGAATATGGCCGCCAATACAAAGATGCACTCCCAACCATTAAACGCTTAATGGCACCCTTCAAATAATCAAACCGTTTGAATTGGGCACGTGCACAACACCTTATAAACCAATAAAACACCACAAAATCCGACCGCACTTTTTTTACTGCGGCGGATTATCACACTTAAAATCCGATAAAAGGAACAGAAAATGAACAAATTAATCATTACGCTCGTGTGTGCATTTGTAGTGTATATGGTGCACGCCCTAAATCTTAATCAAGACTGTGACGGCAAAATCTGTCACACCGAACAGACACAACAATATTAACAAACCACCGCTCTTATGGGCGGTTTTTTATTGGAGGAAATATGGAATCAATTAAACTTTCGCAGAAAGCCGAAGAAGAAATTGTGAATGCGGCAAGAATGGCAGCGTTATCCAATTTGACTGAAAAAAGCCAAAATTTAATTACGCTTGAGGATATCGCAATATATTTTGGGCGACACTATCAAACCGTTGCCAAGATTATTTCAAAACTGCCTAATTTCCCAAAACCCGTTACACCCGTTACAGTCGATCAACAAAATTCTCGCCCACGCTATATCGCAGGCGAAGTTGTTCGTTGGGGGCGGATCAATGCTAAACCGTATTAGCTAATCAAGTAATTCCGCCACCTCCGCCATATCAGGGGCATAATAGACATTTTGTAAAATCGAAATATCTTTATGCCCAGATATTTTGGCTAATGTCATCACATCTACTTTTTTAGATAGCCTAGTTAATGCCTCACGCCGCGTATCGTGGAAATGCAAATATTCTCGCTCGGCAAGTTTTTTGAGTTTTCGGAATGTTGCATCAAGCACACTAGACTTAATATCAAAACACAATCCAGCATCCCCTATCTCGACTTTTAACCGTTCTAAAATAGCGATTGCATTTTTAGTCAATGGCACGGTTCTTGATGTACCGTTTTTTGTCATAGGCAAAAATGCAGTACGTTTCTCAAAATTTACATTACCCCAACTAAGACTACAAATCTTCCCTGCTCTCATTGCGGTTTCAACAGCAAACAATATTGCCGCAGCCGTTCTCGCTTTTGCAGTTTTGAGCGTATCAACATATTCACTGATAGCCACAATAGCATTAATATTTTCTTCCGTTACTCGCTGAGTTCGAGGTTTCCCTTTTTCGGGTAATTGTATGCCGACCATAGGGCTTTTTTGTATATACCCCCATCGCTCAAGGGCAATTTTGAATATATGACCTATCGTAGATAATTCACGGCGCACACTTTCACTTTTTACTGATTCCAATCGCTCCGCAATCCAATCCTCAATATCTCTCCGACTAACATCAGATATATATTTATCCGTAACTGGATGGCGCAAAAAGCGATTCAGCCGATTAAATTCGTGCTTTTCTCCACGCTTTGTTGGCGTAATTTTGTTCAAATACCGCTTAATAACATCAGAAAATAATGTATCAGGTTGCAATCCTTGTGCTTGCAATTCTATTTTCTTTTCCTCTTCCGCACCCCATTTCATGTTGCATTGGCGTAATCGATGCAT
Protein sequences of DBSCAN-SWA_2 >NC_000907|1500121:1513073|1506559_1507081_-|WP_010869207.1|DBSCAN-SWA MNLQTIENFEQFLKVNDKQRIVTNSRHIATVFGKRHDNIIRDIKALVIEQDCGEFALLNFEETSYFDEWGRKQPMYQMTKNGFLLLVMGYRTQKAMKFKVEFIKAFDFMREKLQQEGYSLMHKYNELCIEHKAKKAFASLCGKGLREWKGDKPVLEATLKLFEDKMQIELPIK >NC_000907|1500121:1513073|1511873_1512158_+|WP_005693943.1|DBSCAN-SWA MESIKLSQKAEEEIVNAARMAALSNLTEKSQNLITLEDIAIYFGRHYQTVAKIISKLPNFPKPVTPVTVDQQNSRPRYIAGEVVRWGRINAKPY >NC_000907|1500121:1513073|1501282_1501639_-|WP_005693956.1|DBSCAN-SWA MKRNWDLIRSILLKLESQSEARGSLLPDGFTGFDSETVSYHFKLLQSAGLIEAIDYSSLNEMSLIARLLTWQGHELLDKIRNDTVWNSLKTTIKSKSLDLSLDAIKQVAQTIISQMLA >NC_000907|1500121:1513073|1509961_1510261_+|WP_005693946.1|DBSCAN-SWA MTIQIKTTLTFDSWLSKLKNLRAKAKINARIKRLQFGNFGDIKSVNDGIFELRIDEGQGYRVYLKNQNGVLVILLCGGDKSTQDKDIKQAKLLAQELGL >NC_000907|1500121:1513073|1512158_1513073_-|WP_005693942.1|integrase|DBSCAN-SWA MHRLRQCNMKWGAEEEKKIELQAQGLQPDTLFSDVIKRYLNKITPTKRGEKHEFNRLNRFLRHPVTDKYISDVSRRDIEDWIAERLESVKSESVRRELSTIGHIFKIALERWGYIQKSPMVGIQLPEKGKPRTQRVTEENINAIVAISEYVDTLKTAKARTAAAILFAVETAMRAGKICSLSWGNVNFEKRTAFLPMTKNGTSRTVPLTKNAIAILERLKVEIGDAGLCFDIKSSVLDATFRKLKKLAEREYLHFHDTRREALTRLSKKVDVMTLAKISGHKDISILQNVYYAPDMAEVAELLD >NC_000907|1500121:1513073|1508720_1508858_-|WP_165442161.1|DBSCAN-SWA MFRILFAVALLWAAYELNLNQDCDGYICDTSSLISALHKPLDSAH >NC_000907|1500121:1513073|1506034_1506550_-|WP_005693952.1|terminase|DBSCAN-SWA MSDVKGKSTSGRGLTPKQEKFCQLYIELGNASEAYRQSYDCSKMTTEVINVKASELLNKNGKITVRVEELRQAHQQRHNLTLDNIIADLQEYRDICMGRKPLTITTVVKNAQEGTAQSVNTECFVFEPTGANKALELLGKHLGMFTNKVDVTTDGKPLPTVINVTFSDEPA >NC_000907|1500121:1513073|1507208_1507490_-|WP_005693951.1|DBSCAN-SWA MLNQLKQSLRLNLVLTLVCLSLFLTACTNKITTKPEYIYPPQAYTAPCVKTAFTGETYGDVVIQLVKVTAERDKCASQVDHLNKWINQAKGGK >NC_000907|1500121:1513073|1500121_1501222_-|WP_005693957.1|DBSCAN-SWA MKFTDKTTQADTQRTITKDGFLVVPATISKVGVFDYLATELGLKEDGIKKVARTEKSLFSDETIKSFENATLTVGHLKDGVNAKNWKQLSVGVVRNVKRVGDELTAEAWIYDEQAIKTVQEHGVEQLSCGYDCDIKPSTVQDADFEMSPMIGNHVAIVAKGRCGGSVKLADEDKTIMGKTAKILDAFLGAFGIKLSDEQKKQIEDEEKSGSEEGKEPKGEQPTKPKEKKSEPENKKEDDVEKEELEKSLKAKDEEIQQLKDAQAKRDAEVKQAAVLADAKTAFKEVNFADNATVREIQESAVVAQGIFTKDEAAKLSDEEISGAYQTAKVVVAKLADERKSLGNILLGDAEPKAAPKIDFNKTYNS >NC_000907|1500121:1513073|1510257_1510551_+|WP_005643896.1|DBSCAN-SWA MTEQLKDFDVAEHLTSEEEIQLYLNEILQEDNIELILSALGDIARARNMSQIARDAGISREGLYKALSGTGNPTFATVMKVMKALNLQFQVQQSRFA >NC_000907|1500121:1513073|1510581_1510944_-|WP_050396694.1|DBSCAN-SWA MGFAVPYLEQNGGSFETEFPRVAAGFAEMKCDARYAEKYRMRPISDELGMEIDGYLGVIRKVTPELYDVFVLTYIKRWEKQGIWRYLHISRREYFNRLKTVKTSLLLLLSTEGKQYLFIA >NC_000907|1500121:1513073|1507401_1507677_-|WP_005693950.1|DBSCAN-SWA MTKYIYIALVGVVVVLFGALRYQSSVIDELEITTKQQEDTNKSLSLALQQERNDEIERIATENAESVKTIIKTQPCAHTRLPQSVLDRLHE >NC_000907|1500121:1513073|1511012_1511588_+|WP_005693944.1|DBSCAN-SWA MTHLNLIPVFNGLIQNQPVQLCNARELHAFVESKQQYTDWIKNRINEYGFIQDEDYLVITERTNGRPRKEYHITLDMGKELGMVERNERGRQIRQYFIRCERTLKALQQPQQLALPEPEKFTHEFTEFEIETLVWLLIGHHQMNTLLGQLEKPLDAIGSNLHPAVYSYWKEYGRQYKDALPTIKRLMAPFK >NC_000907|1500121:1513073|1508240_1508597_-|WP_005650535.1|holin|DBSCAN-SWA MPIKEPDVWALIWSWLQTNLSSSSAQSAFWALFISLLRFGFMRKKPAIRYVLIDAAMCASIAGVAVPICTHLFGHTEYSSFLGTMIGFVGTEKIREFLFKFINRRIEKDDNDDFRSDI >NC_000907|1500121:1513073|1503393_1504704_-|WP_005693954.1|DBSCAN-SWA MNILDGIKSLALKLGSKQDQTYYARGLSLTDDLMQIEALWRDNWIANKVCIKRSEDMVRNWRDIFSNDLKSEQLDEFTKLERRLKLRETLTKALQWSSLYGAVGLLVVTDTINITSPLQPTERLKRLIILPKWKISPTGQRDDDVFSPNFGRYSEYTITGGTQSVSVHHSRLLIINANDAPLSDNDIWGVSDLEKIIDVLKRFDSASANVGDLIFESKIDIFKIAGLSDKISAGLENDVAHVISAVQSIKSATNSLLLDAENEYDRKELSFGGLKDLLTEFRNAVAGAADMPVTILFGQSVSGLASGDEDIQNYHESIHRLQETRLRPVLEVLDTLLCNELFGGQPDDWWFEFLPLTVVKQEQQVNMLNTFATAANTLIQNGVVNEYQVANELRESGLFANISADDIEEMKNANELARNFEEPEGESTQVQASEDE >NC_000907|1500121:1513073|1507669_1508272_-|WP_005693948.1|DBSCAN-SWA MTMMISEVTFNKIFPHAVKGVYQAISAQIEKAGCVNKMQQAMFLAQCGHESGGFIRFKENLNYSWLGLSQTFRKYFPDPLTAKKYERKPELIANRIYANRLGNGDEKSGDGWKYRGRGLIQITGKDNYAAFRKWLGRDIEPEDVAGNLDLSVKTAVWYWKCYELAELNSVEKVTRRINGGLNGIDERCKLYRALMVTDND |
16 | Haemophilus_phage(45.45%) | terminase,holin,integrase | attL 1498816:1498829|attR 1513211:1513224 |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
DBSCAN-SWA_3 |
1558773 : 1597183
Sequences of DBSCAN-SWA_3
Nucleotide sequences of DBSCAN-SWA_3 >NC_000907|1558773:1597183|DBSCAN-SWA CTTAAATTAATTGACCCTGATATAACTGAATCTGCTTACCTGAAAAATACTCGGCTTCTTTTGGCTCATGCGTTACTAAAATTGTTGTAATTTCATTTGTTTGAATTAAATTTTTTAACACTTTCCAAATATCTTTACGGGAAGACCAATCTAAAGAAGAAAAAGGCTCATCTAAAAGTAATAAATCAGGACGATAAATTAGTGCCCTTGCTAAAGCTACACGCTGTTGTTCTCCACCGGACAACTGATGAGGATAGCGATTAATAAGATGATCTATTTTTAATTCAGATAATAATATCTGTTGTTCAGCATCAGATGCTGATGGATTAGCAAGTATTAAATTTCCTCGTACCGTTTTATGAGGAAACAAATAAAGTCGTTGATTTAAATAACGAAAATTTCTCTTCCACGGAGGATTATTTTCTAGAACTTGGTTATTCCATAAAATAGAGCCAGAATAATCAATATAACCAGCAATCGCATTTAATAAAGTCGTTTTTCCGCTACCTGATTCACCAACAACAGAAAGGCATTCACTTTTTTCAATTGAAAAAGAAATAGATTTTAAAATATTAGTTTGAAGATTCTGAACTATTAACATACTAAACAGCCCTATTAATCATCCGTAAAACTAGCAACAAACATGAAGATATAAATAAAAGCCATAATGATGCGCCAATAGCGATTTCAAAATCACCACTTGAAATATTCAAATAGACTGCCATAGGTAAAGTTTCGGTTTTAAATCGCGTTGCCCCTGCCAACATTAATGTGGCTCCGAACTCCCCTATTGCGCGAGACCAAGCTAAAACTGAAGCACAAACCAAAGGCTTCCAACACATAGGAATCTCTATTTTTATTAAAGTCTTAAACGGTGATAACTCAAGAGTATAAGATGCAAATCGATAACCTGATTCAAAGGAAGAAAAAATACCGCGAGTGCTACGCATGTTAAAAACCACCAAAACAAAGAAAACAAAAGAAATAGGAATTTGGCGAAATTTTACGGACGTAAGTGGGCGGGAATTATTGAAAACAGGGGCTTTGGCGGTGCATTGCCCCTTTTTTTATTCTTAGGGAAAGAAAACTAAGAAAAAATCAGATCTTTGGTTGATTTAGTCAAAATGAACCAGAAAAACTAAGAATTTAAACAAAAAAGAAAACGCCCGTTTAAATGGCGTTTAAATCTTTAAATCAGGCTATGCCCGATATGCACTACTTGCCCGATGATTTGTAGGTTTTGAGCATTTTCGCCTGTAATGCTGATTGGCGGGTATTCCTCTTTGTTATCGCTGATAAGCGAAATGCCGTCCCATTCCATCTTCACACGCTTAACCCACACACTTTCGCCGTTTTGAACAAGGTAAATGCGGTCGCCTTGAATTTCTTTGCGGCTTAAATCTACTAACATCTGATCGTAGTTATTGATAGTTGGCAGCATTGAATTGCCGTTTGCCCAGAATACGGCGCAGTTATCTGCTTTTACGCCTAGGCTTGTTAGCAATTCGTCTGAATACGGCTCTTGTCCATCAGGCTGGGTGATACCCTCGTTAAAACTCCCAAATCCTGCAGAAACGTTGATGGAGCTATAACTATCAATCATACTCACCCCTTCCTCTAACATGGCTTGCATTCTTTCAAATGCACGGCTAACAAGGCTTCCTGCAGGCTTTTCTTCTGTTGTCTTTTCTTCTTTTATTTTACCGGTCGCAAGCCATTCAATGCTTACTCCTGTAACTTCTGCAATTTTTACAAGGTTGGAACGAGATGGATCGGCTTCACCTTTTCGCCATCTTGTAATTGTAGAAAGTGTTACGCCTGTTTTTCGAGCAAATTCGCTTGGGCCATTCAGTTTATCTACTAGATATTCAATCCTTTCTGGGAAATTGTCTTGATTTTGGTACTGCATACTAACCTCTTTAGTCGTAATAGTTGAATAATTACAACTATTACGGGATTAAAAACTAAATTATTACCCGTAATAGAACTAATTAAGTCATTGTTTTTATTCGAAATAGTAAAACAATAGATTAAAATATAGCCAAATGAAACTATTACGGTGTATTTTATAGTTGCAACATGCAACTATTACGGATAATATACACCACATAAGGTACAGCAAAAAAGGTGTATTAAATGAGTGTATTAGAAAAACCAAAAAAAACCGCAGAACAGGATTGGCACCGCGCCGATATTCTTGCGGAATTAAAAAAGAATGGTTGGTCGCTTCGCTCTTTAGCAAAAGAGGGGCAAGTCAGCTACAACACATTAAAAACAGTTTTGGATAAATCTTATCCAAAGATGGAGCGTTTAGTTGCAAATGCAATTGGTGTTCCACCTGAAGTTATCTGGGCTGGTCGTTTTGCTGAACGAAATAAAAGACCAACATTACAACATAAGTACTGATTTTAACCGTAAAAGTTATAAAAAGGAACATTTATGGATAATCAAAGCTTAAAAACGCACTATTCAGTGTATGAATTAGCAAACTTAAAGCTAAAAACACTACCTTCAGCCCCCAAAAACATTTGGGAACAAGCCAAGCGAGAAAACTGGAAATCTCAAAAACGCCAAGGGCGTGGTGGCGGGCTGGAATATGAATTAGCCAGTTTGCCAATCGAAGTGCAAAACGAGCTTCTGCTCAAAACTACCCCAGAGCAAACGGCGGTAGCTTTGCAAAAAATAGAAGAAACTCGACCGCTTGCAAGCAATGAAGTCTGGCAATTATGGGACGAAGCAAGTGCAAAAGCCCAAGAGCAAGCAAAAATCAAACTTGGCACGATGTTTGCAGTAGCAAATTTAGTGGAAAGCGGTGTGAACGTGTTAGATGCCTTCCGGCTTGTCTGTGGCAAAGAAAATGCCGAACGGCTGAAAAATAACGAAAAATTACTCTCAGTTGGTTCTTTAAAAAATTGGTGGTATCGGGTCAAAGACGCCCCACGGCAAGATTGGCTGCCCTTGATGCTCAACAACAGCGGCAAGAGTAGCAAAAACGTGGCAGAAATAGATGAAGCTGCTTGGCAGTTCTTCAAAAATTTCTACTACAGTCGTGAAAAACCCTCACTGGCTCACAGCTATGAGGTATTAAAACAAGCCGCACAATACAACGGTTGGCGCATTCCCTCTCGCTCTTCGCTAAAACGCAAAATGGAACGAGATGTACCAAAAACCGAAGAAGTGTTCCGTCGTGAAGGCCAATACGCATTAAGTCGGCTTTATCCCTCACAGGTTCGCACCGTGGCAATGTTACAAGCGATGGAGTGGATCAACGGCGACGGTTATCAACACAACGTTTGGGTGCGATTCCCTGATGGCGAAATTAAACGCCCGAAAACATGGCTTTGGCAAGATGTTCGCACCCGAAAAGTGCTGGCCGCTAGAACCGATAAATCGGAAAACACCGACACCATACGCCTCAGTCTGCTTGATGTGATTAGTCGCTACGGTTTGCCGAAACACTTAACCATCGACAACACCCGAGCGGCAGCCAACAAGAAAATGACGGGCGGGGTAAAAAACCGCTACCGCTATCAAGTAAACGAAAACGAAGTGCAAGGCATTATTCCGGCACTCGGTATCGAACTGCACTGGACGTCGATTCAATTCGGCAAGGGGCGCGGGCAAGCCAAACCAATTGAGCGTGCCTTCTCTCACGGCGGTTTGGGAGATTATGTCGATAAGCACCTGTTATTACGCGGGGCTTATGCAGGGGCGAATGCCTACGAAAAGCCCGACTATGACGGCAAAAACGGCGCAGAACAGCCTGTCGATTACGCCACATTCTTAATGGCATTAGAGCAAGGCATTCAGCAATGGAACAACGTGGGCAACCGCCTCACCGAAATTTGTGCAGGCAAAAGCAGTTATGCCGAAGCCTTTGAGCGAGATTGGGCTGTTGCCGAAAAACGCCCGATTAGCCAAAGCCAAATGCGGTTGTTGCTTACCCTGCATGAGGAAGTTCGCCTTAACCAAGACGGTACCTTCTACCTAAACGCAGGCAAAATCGGTACGAACAAAAACCGCTATGAGTCACTGGCGCTTATCGGTACCTCACACAAACGCGTTGTGGTGCGCTACGACCCAGCCAATCTGCACGACAAAGTGTGGGTTTATGCCTTWACGGGCGAATACTTGGCGGAAGCGGAAATCACCGAAAAAGCAGGCTTTGGCGACCAAATGGCAGGACGCGAACACAACAAAGCAATGCGCAACTGGGTAAAACATACCGAAAAAGCGGCGAAAGAACGCGCTAAAGCGGAAGAAATGGAACTCAGCAATTACGCCCCGGCGGTCGAATTTGAAGAGCGGTTCTTGGAAATGTTGCCAGAGCCGGTAAAAGCCCCTCAAACGCAAGCAGAAGAGGTGGAATATGAAGAAGTGCTAGATTTCAACACCGTGCGAAAAGTACCGAAAGCAGTGGAAGTAGAAGCCGAAGAAATCAGCGAATTTAATCGTGATTGGGAAAAGGGTTTAGAGCTTTTAAAGAAAAGTAAAGGGCGTTAAACCAACCGCCTTTAAACCAGATTTAAACAGGGTTTAAACGCCCTAAGGAGAACAAGATGAGCAATATCACATTAAACGAAAACGCAATGCTTTATTTAAAAGCAGACTATTATCGCCCTGAAATGCCCACTTTTAAAGCCTGCTATTTCCGATTAAGCAAAATTGCCCAAGAACAAGGCTGGGGAACATTGCCGAATTTAGCCCAAACCAAAGCCCTGTTTAAAGCGGCAGTCCCTGAGATTATTTGGACGAGAGAGGCGTTTAAGCGTGCCAATACTCAAAAGAAACACGCACATAAGGCAACGCCTTATCTTGAACAAGTAATGTAATTCGAGCAGCAAAACTCTCAGGTAACAGCACATAAAACGGAGCTGGCAAGTTAGATAAATCAAGTGGTTCAGAGCCTATTTTGTTCAACTCTAACACTTGAAGATGGCGAGATTTCAATTTTGCGATTAGTTGATGAAGAAATGCTGAACGTGAATTACCCACCACAGCTTGTAACGCATCATCAAGATTAAGCCAAGAGGCAGAACCGTGAGCAGGCAAGGCTTGAGCAAATTTTAAAAACTGCTTATGCCAATTTTCTTCAGAAAGCAATGAGGTTGGCTCTTTTTGTACAGAATGTTCAAGTTTAGTAATCACTTCTGAAAATTCGTGAAAAAGTGTTGCCACGGAGTAGAGCTTAACAGGTTGGCGAACCATTTTTAACAGTAAATCAGTTTCAGACATAACGCCCCCAAAGGTAAAAACAGGAAACCCATTATGACACTAATCAACAAACTCAAACAACACTTAAGCGACAGCCAAATCACCCAAGCCCAGCTTGCCCGCGAAGCAGGCGTAAATGCAGGTGCATTGTCGGCATACCTTAACGATAACTACAAAGGCAATATTGCAGATGTGGAAGCAAAACTGGCAGCTTACCTTGAGAAAAAAGCGGTGCAAGCCCGCGAGTTTGTAGAGGCACCAGCCTTTATCGAAACAGCGACTTCTCGTCAAATTTTCAAAACGCTGGAATTTGCCCAAATCGCCAACTGCTTAGCGACTGTTTACGGCATGAGTGGCGTAGGTAAAACCAAAGCGATCCAAGAGTTCGCCAAAAGTCACGCTAACGTGTGGCTGGTAACTGCAAGCCCTAGTCGTTCAAGTTTAAGCGAAATTTTGTATGAAATCGCCCTTGAGTTAGGCATCAGCGACGCACCACGCAGAAAAGGCACACTCTCACGCCTGATTGCTCGCAAAATCAAAGGCACAGAGGGCTTGCTGATTGTGGATGAAGCCGACCACCTTCCTTATGAGGCACTCGAAGAACTCCGTATTATGCAAGAAGAAGCCGGTATTGGCTTAGTGTTGGTAGGCAACGACAAAGTCTATACCCGAATGAAAGGCGGTATTAGCCCAAGCCACGAATATGCAAGATTGTGGTCGCGCGTGGCAAAAAACACCAGCATTCAGAAAACTAAAAAAGCAGACACGCAAGCAGTCGCTCAAGCGTGGGGGTTAGAAACCGACGAAGAAGCCTTAAAAGTGATGCAAAGCATTACCGAAACAGGCGGTGGTTTGCGAATTTTAACCCAAACCTACGCTTGCAGGAATGGTAGCAAAAGGATCTGGCAAGTTGATTGATGCCGACTTAATCATTAAAGCTCGCCAAGAGTTATTAGGAAAAGGCGAATAGGAAGATTTATGCAAAAAGTCTACAACAAAATGGCAGGCGAAATGATGAGCCCTCGCAATGCCGTTATCCATAACCAATTAGCTATGCTTGAACTTGCCACACTTGAGTGCGAAGCATTAGGCATTGAAGTGGAAACCGTCGAATGGTTCGATATTGGTAAACCCCGCCTTGTCGTAAAAGATTGCTCAGCTTTGCGCCATTTAATTAAGACTGGTAAAGCCTTTAATTATGGCTCAGAAGTGAAAAACGGCATCCGTATTTACCTAAATCAAATGATGGTAAAAGGCGTAAAATTTATTTGGAAATCAGATGTAACTAAACATTAACCACAGGAGAAACTATGGCAACGAAAGTAAAAAGCCAAGCGAAATTACGCTTTGTAAGCGTAGAACAGGTGCAAAGTGCGATTAAAGAAATTGGCGATTTAAGCCGTGAACATACCCGCCTTGCGACCGAGATGAACGACAAGATTGGGGCAACAAGTGAACACTATGCTCCGAAATTGAAAGCCTTAAAAGAAGAGATTGAGCCATTGCAAAAGGCGGTGCAGGAATACTGCGAGGCAAACCGTGATGAGCTGACCGAGTTCGGCAAAACCAAAACGGCGAATTTTGTGACAGGTGAAGTGCAATGGCGACAACGCCCACCTTCAGTCGCTATTCGTGGGGCGGAAGCTGTGATGGAATTCTTGCAACGTATGGGCTTCGACCGCTTTATTCGCACCAGGCAAGAAATCAACAAGGAAGCGTTGCTCAATGAGCCAGAAGTGGCAAAAGGGATTGCCGGCGTGACAATTAAACAAGGGCTAGAAGATTTTGTGATCAAACCATTTGAGCAGGATGCGAGATGATGGACGATTTACAAGATGTAAGCAGATTAAGAGAAGCATATCAGTTTTATCAAAAAGCAAAACAAGATGAAGATTCGATTGTTTGCGGTTGTTTAAATGATGCGTATGAATGGCTCTTCAGTGAATTGAAGGCACTGTTTGATGAGGAGGAAGAATAGTGAAACTAAAACAGAAACTTTTAACGTTTCCAAACGTATGTTTATTGCTTCTTGTAATTTGTAGCACGCTAGGTTTAGCACTGGTTTGGTTTATTCCATTTGTTGGTCAAGCCTTAATTTGGAATTCCCTCGTTTTTCTATGCTGGGTGGTTTATTTCGAGGTTCGTGGCTTAAAAGATTGGGGCGAACACAATCTTGAGCAATTAGTAAAGATGGCTGAAGTTTCCGCAGCAGCAGCTTACAAAATTAGCAGCATGGTGGCAAAGTGATAATGAATGGTAAGGAGATGTAATGAGTGCCTCTGTAATTTGCTTAATCGTTGCCAGCGTACTATCGCTTATCGTGCTGTATTTAGAACAAGATTAAAGCCTATTTAAAAGCCCTTTAAAAATCTCCCCTACCCCCTCTTTGCAAAAGAGGGAGACGGATTGAGGGGCTTTCAAAATATGTTTTAACCCACAGGAGAAACCGATGAAAACCAAACGACCACACGCCAAAAGCGTGGAAAACTTCAACCGCTACCGCTTTTATGCGGAGAAAGCGGCAAAAGAAGAACAAGCCGGCAACTACGAAGAAGCCGAAACTCATTGGGATTTAGCAATGCTTTCTGCCAGCCCCGAAAACAAAGAATGGGCAATCCGCCGACGCGATTTTTGTCAACGTATGCATCAAAGACCATTTGAGGGGGAATAATGATGACTGAAACCCGTAAAAACGAGCTAGAAAACCAGCTAAACCAAATGATTGTGATGCTAAAAGAAGCTCAAAAATCTTTGTTTAAAGGGCAATACACCCACGCAGCTATTTTTGTGGGGAATGTGTCGGATCAGTTGCCAAATATGCGAATGATGTTAGCGAGGGGGTAAAGATGAATGCAATCCAATTTAGATATTTTAAAGGCGTTATGACTAAAGAGCCTCTAAAAACGATTATCGACACTTGGTACAAATTAAGAGCTGAACGAGATAAAAAGCTAACCAACATATTTAATACTATCCCTTTTTATGAAAGCTGGTTAGGTGATGAAACTTCTATTTTTGGAATAGTTTGCAGTTATGACAATCCAGCTCGTGATGAGGCAGTATTAACAAAAGGATACAGAACTGAAGATTATAAAGGAAAATGTGTGGTTAAACCTGATAGACGTTATAAGGTTGGCAAGGATTTTGACAAAAAACTACAGGCTATTCGACAAATTTTAAAGGAAGCCCCTGATTTCTCAAGTTATTCGCTAAAAGAGCTGGGTATGTATTTGTTAGTTGGTAATTTTAGCCGACTTTATTTCTCAGTATCTGGGGTTCAAGATGATATTTATATCGCAAAAATTCCAGTTAAAGAGCAAGGTAATTTTGGTGATGATTTTTTAGAAATCCACGAATGCTTAACTGAAATAAAAGAGAGTGAATTTCTTTCTATTCAAGGCTTATAACAAGGAGGCAACTATGTAACCGCACAATAACCGCTGCCCACACCATTCCATCTAGGTTGTTATAACTCGGTGTGGGCAAGTTTAAAGGGTGTTTAAATTTTAAAGTAAATCGTTTAAAGCCTGTTTAAATCAGCTTTAAGCCAGTTTTAAAGGATTGACTAAGAGGACACACAATGAGCGAAAAAGCCAAACTAATCCAGCTGATCCATATTGGCAAACAGCAGCTTAATATGGACGAATTCAGCTACCGCGAAATGGTCAAGCGACTGACCAATAAAACCAGCTCCACCAAATGCACGGTGGTGGAACTGCTCAAAATTCTGCACGAAATGCAGCAAAAAGGGGCTAAAGTGAAACACTTTGCAAAACGTGGGACAAAACCAACCGCTTACAGTCCTGCTACAGGCGAAGTTAAGGTGAAAAGTGAAATTGCTCATAAAATCCGAGCTGTCTGGATTCAGATGGGTAAGCACGGATTTTTAGCTGACCCAAGCGNAAAAGCCTTAAACAGTTATATGCGAAAAGTGATGAACAAAGGAAAAAGTGTGCTTGCACTCAATGTAGGGGCGTTAAACAGCAACGATGCCAGCAGATTTTTGGAAATTCTCAAAAAGTGGCATAAGCGGGTAATGCTTAAACGTCTTGCTGAAAAATATGGGTGCATTACAAGTGCTGAAACAGGCTATGATGAACTTTGTTTAGTATTTAAAAATTATCAGGGGGTAGCATGAAACTCTGTCGTTGCCCTATTTGCCACAGTGATATTCACTTGGAAGCCCTTATTGAAGATGATGCCGGTCGTGAATTATTAGGCAAAATTAGTCAACTTACCCACGGTTGTGCCCAACCGATGGTTGGTTACTTAGGCTTATTTAAGCCAGCCAAAAGCAACCTCAACAACGCCCGAGCTTTGAAGATATTGAGCGAAGTGTTAGATCTCTACCCTTGCTCGCTGCTTTTGGCTCAAGCCCTCAGCGAAACGGTGGCAAGCCTGCGCAAAAAACGCCAACAAGCCTTGCAAACTGGGCAGAAAATTGAACCGCTAACGAACCATAATTATTTAAAATCGGTGTATGAGACTCAAAAACCACACTTTGCTGTGATTCGCTCCGGCAAAAATCAGTCAGAAACCGTCAAAGCCCAACAAGCGGAAGACAAAAAAGTGCAAGATGCGATTTTATATGTCGAACGGTTCGTACAATTAGGGCAAGAAGAGTTTGTGAAAAACAGCCCTGAATATCAAATCTGGCTGAATCATAAGGCACAAAAACAAGCCCTTTAATTCTCCCTCAAGGCGGTCATTACCGCCTTTTTTCTTGCCTTAAACTCACCCTTTTAGACTTTTTTATTTCTCGCCAGTCCTTTCTATATCAGCTTTAAGCCACTTTTCGGCTTGTATTAAGAAAAATTGTGCTAGTGGGAAATTTTAGGTTTTGTACAATAGGCACATTGATAAATTGAATTGGGTAAGCTATGTCGCAAACATTACAACAAACAGGATTATTTGATGATGAACACGCTGATATTGGTGCATTGTTCGACCATTTAGACCAAATCCCCAGCGTAGAGTTAGAAAAACGTTGGCCATCGCTATTGGTGGAGGTAATAGAGGTAATGCAAGCGGAGTATTGCGCCAAAATTTTGCAGAAGATAAAGCAAAAAAGACCGCTTCGAAGCTCGTGGGCGTAATGGCTCACTATTTTGGCGGTAAGTCGTTTTATCTGCCCGCAGGTGATAAAATCAAAGAAGCCTTACGAGATGCACAAATTTATCAAGAATTCAACGGTAAGAATGTACCTGACCTAATAAAAAAATACCGATTGTCAGAAAGCACAATTTATGCGATCTTACGCAATCAACGAACGCTTCAAAGAAAGCGACATCAGATGGATTTTAATTTTAGTTAGGTGGTCTTATGAAATTACTCAAAGCATTAGCTGTATTAAGTTTAGCGACAATTTCCTCTCACTCATTTGCCGTAGATGGGTTTCAAAACGTAAAATTCGGGGCATCTAAAACCGAAGTAAGAAATGCGTACCAGAAATGCCAATGGCAGAAAGATGAATACGATCTTTTTTGCCCAAATTTTACATTAGGTGCGATAAAAGATACTGGAGCATATTTTTATTTTATTGATGATAAATTTGAACGTATTGCTATTAACATTCCAAATGTGAACATTGATGGCATCGGACAAGCTCTAAGTGAAAAATATACTCTTTCATCTCAACCGACACAGAGAGAATTAGCCAATCCAAAACCGAATAATGTGTATGACTTTGGATTTGATAAAGATACCATCTTAATCCGATATACATATGACAACGATATGACTGAAGAGATTTTTCTCATTTATACTACACCTGATTTTAACAACAAATTACAAACAAAGGACGCCCAATCAGTTAAAGATCAACTCTAGTGTGATGACTCACAAACTCACCCCATAACTCAATCCCCTAAACTCCAGTTATTAAATAATCCTTAATAACTGGAGTTTTTTATGTCTTTACCTATCACCAAAATTGTTGTGCATTGCTCGGCAACTCGCAACGGCAAATCCATTAAACAACCAGGCAAAAATGCCGCACAAGTGATTGACGGCTGGCACAAGCAACGTGGCTTTAAACGTCAGCTTTCATCACAACGTGCATTTAATCCGCACCTATCTTCGATTGTTATCACTTTGTCATTGATGTGGACGGCTCAGTCGGAACCGGTCGCCAAGTGGGCGAAATTGGTGCACACGTTAAGGGGCACAACCAAAATTCAGTGGGGATTTGCTTAGTTGGCGGTATTACCGCAAGCGGGAAAAATCACGGCGAATACACCGAAGCCCAATGGCAATCCCTGTACAAACTCTTGCAAGAACTGGAAGCAGAACACCCGAAAGCGCTTATTTGTGGTCATCGTGATTTATCACCAGACCTTAACGGCGATGGGGTCATTACCCCTAAAGAGTGGCTGAAAGATTGCCCGTGCTTTGATGTGTGGAGCTGGTTGGATAGCGAGCAAGTGGTCAATCTTGACCATCTTTACAAGGAGTAACAAGCGGTGGGATTTTCTGAACTTTTTACTAATGCAGATGGACGACTTTCCACTACTGCCAGCATTCAATTTTGGGGCTTCGTTGCTGCCACTGGTGTGCTGTTGTACTCGGTTTATTTAGATAAGCCCTATGTGCCGGAAATGTTCAGCACCTTTTTATTTGCCTGTGTTGGCACTGCTGCCACCAAAGGTGTGGCAAATGCCCTTTCACAACGGAGAGAACAAGGAAAAGAGCAAGGGAGAGAGCAAGGGAGAGAGCAAGAATGATGAATTTAATTTTAGCCTTTTCTGGTGTGATTGCTTTATATGGTGGGTATCTCTACCTACGTTTACGTCAAAGCCAAAAGCAAGCAGCCACTTTACAAAAAGAAAAAGAACAGTTGCAAACTCAAAAAACTGTTGCCGAAACTAAAGTTAAAAATTACCAAGTGAAACAGAAAAATGAAGAAAACCTTATTAGCCGTAGCCGTACTAGCCTGCTTGAGCGGATGCACAACGATGGCGACCTCCGTGATTAACCCCAGTTGCGCGGGTTTTAGCTTAATCAAAGCCAGCAGACAAGATACCACTGAAACCCTGCGACAGGTTGCTGTGCATAACGCCACCTATCGCCAAATTTGTGAAGAACAACCCTAATGGCAGATGTATTAGACCAATTAAATGAGCGAGAAGAAGCCCTCTTACAAAACATTCTCGCCCCACATTTAGATACCGAATTGAGCGATGATGAAGTGGACGCAATTGCCGAAGCTGGTCGCCAATGTAGCGAATGTGGCTTGCCCATTCCCACTACACGCTTGCGTGCGAATCCATTCGCTCACCGCTGTGTAAGTTGCCAGCAAGATTGGGAGGAAGGACGATGATTAGCGAATTTTGGGAATTTGTGCGATCCAATTTTGGTGTCATTTCGACCCTGATTGCGATTTTTATCGGGGCATTTTGGCTCAAACTCGACAGCAAATACGCTAAAAAGCACGATTTAAGCCAACTTGCCGACATTGCCCGCAGCCACGATAACCGCCTAGCAACACTGGAAAGCAAGGTGGAAAATTTGCCGACCGCAGTCGATGTAGAACGCCTAAAAACCTTATTAACCGATGTGAAAGGCGACACCAAAGCCACTTCACGCCAAGTAGATGCAATGAGTCACCAAGTGGGCTTGTTATTAGAAGCAAAATTAAAGGAATGATGAAATGTCGTTTAAAGAATTGATTACTCAAGACCAACGCCTTGTGGTATTACGCGTACTTTCCGAAGCCGGCTATGATGCCAACGAGTCGATTATTAATGATGGCTTGGATTTATACGGTCACGATATTAGCCGCGATTTAGTCCGTACCCATTTGAGCTGGTTAGAAGAGCAAGGCTTACTCACTATTGAACGCCTAAAAGATGGCTATATGGTGGCAAGTATTACCCAACGGTGGCTTAGATGTAGCACAAGGTCGTGTGGCAGTGGAAGGCGTAAAACGCCCCCGCCCGAAAATTTAAACACCGTTTAAAGGAGGTTTAAATGAATGACAAAACCACCCGAGGGCGTGCCAGCAAGGTTGATTTATTGCCGCCAAACATCAAATCCACCCTCACGATGATGTTGCGTGATAAGCAATACTCACAAGCCGAAATTCTGGAAGAAATTAACAACATCATTGCAGACAGTGGCTTAGATGAATCAATGCAGCTTTCCAAAACCGGCTTAAACCGTTTTGCATCCAAAATGGAACGTTTTGGCAAGAAAATTCGTGAAGCCCGTGAAGTGGCAGAGGTCTGGACAAAACAGTTAGTCGAAGCCCCACAAAGCGACATTGGCAAACTGCTGATGGAAGCGGTGAAAACCATGGCATTCGACTTAACCCTCAATGCCGATGAAGCCGTGGCAAACGACCCGAAATTTTTAAATCAGCTTGCCCTGATAGCCAACCGCATTGAGCAAGCCCAAAGTATTAGTGAAGAGCGAGAGCGCAAAGTGCGCAAAGAAGTCGCCCAACAAGCTGCTGATACCGCAGAAAAAGTGATTAGTCAAGCAGGCTTATCTGCCGATACGGTCGCCCAAATCAAGCAACAAATTTTAGGAATTGCCTAATGCAAACCTTACCCGATTTAATCCCCTTTGACCCAAATGCCTTACTGCTCGGCTATCAAAAACGCTGGGTGGCAGATACCAGTCAGCTCAAAATCGCCGAAAAATCCCGACGCACCGGTTTAACCTGGGCTGAAGCGGCAGATGATGTGATGATTGCCAGTCTTGCCAAATCAGAGGGCGGTTCAGATGTGTTTTATATCGGCTCTAATAAAGAAATGGCACGCGAGTTTATTGACGCCTGTGCGATGTGGGCAGCCCAATTTAACCGTGCAGCAGGGCAAATCCAAGAAGAACTCTTTAACGACGAAGATAAAGACATTCTCACCTACGTGATCTACTTTGCTTCCGGTTTTAAGATTAAAGCCCTTTCTTCCAACCCGAAAAACTTACGCGGTATGCAAGGCGTCGTTTGTATTGATGAAGCGGCGTTTCACGAGAAATTGGCTGAAGTGCTAAAAGCGGCACTCGCTCTCACGATGTGGGGTGCAAAAGTGCGGTTGATTTCCACCCATAATGGCGTAGATAACCTGTTTAATCAGTTGATTCAAGACAGCCGTGCGGGGCGTAAAAGCTATTCGGTGCATACCATCACCCTTGATGATGCTTGTGCGGAGGGCTTATATCAACGTATTTGCCAAGTCAGCAAACAGCTGTGGACGCCTGAAAAAGAAGCTGCGTGGAAAGCTGGTCTGTTGCGTGAAACCGCTACCGAAGACGATGCACTGGAAGAATACTACTGCGTGCCAAAAGCCAGTTCTGGGGCGTATATTCCCCGCCCAATGATTGAGCGTGCAGCGACCGAAGGCAAGGCCAAACTGCGTTTTGAGTGCGATGCCAAATTTATGGAATGGACGGAAGACGAACGCACAGTCATCACCAGTGAATTTTGTCTTACCCAACTATTACCGCACCTGCAAGCCCTCAACCCTGACCGTCGACACGCCTTTGGGGTGGATTTTGCCCGCAGTGCTGACTTAAGCGTTTATGCCGTCTGTGCCGTACAACCCGACACCGCACGCCATTTTGACTTAACGCTGGAAATCAAAAACTGCCCATACAACCAACAAAAACAAATAATGCTGTTTATGTTGGCAAATCTGCCACGCCTTATTGGTGCTGCCTTCGATGCCACCGGCAACGGCGGCTATTTAGCGGAAGCAGCTTTAATTCGCTACGGCAGCAGTATGGTCGAAGCCGTGCAACTGAATGAAAAATGGTATCGGGAGTGGATGCCGAAATATAAAGCCTTGTATGAATCAGGTTATATTCAAATTCCGAAAGATGAAGAAATCATCTTAGACCACGGGCATATACAGGTGATTAACGGTGTGCCAAAAATTGACAAATCACGCTCAAAAGATAAATCAGGCAAACGCCACGGCGATAGTGCAGTGGCGTATTGTATGGCGGTGCGTGCCAGTTATATGACAGGTGGAGAGATTGATTTCATACCTCTGCCCGATAAACATTCAGACCGCAGCGAAAATGATGAATTTGATGACTTTATATCCAACTGGGACTGGTAAGGATAACGAAAATGCAAAGTAGAATTTTAGATATTCACGGCAACCCCTTCCGCTTTGAAGCTGATATGCAAACCGAAAGCGAAAGCCGCTTAATGCCGCTGCAATACCATTACAGCGACCACCCAGCCAGTGGGCTAACCCCTGCTAAAGCCGCACGCATTTTACGAGCAGCCGAGCAAGGCGATTTAGTCGCACAGGCAGAACTCGCTGAAGATATGGAAGAGAAAGACACCCATATTCTTTCAGAACTTAGCAAGCGACGTGGCGCAATTACCGCCGTAGATTGGCAGATTAAGCCCCCACGCAATGCCACGCCAGAAGAACAGCGTGATGCGGAAATGTTGCAAGAAATTTTAGAAGATGCAGTGTGGTTAGACGATTGCATTTTTGATGCCACTGACGCCATTCTCAAGGGCTTTTCCAGCCAAGAAATTGAGTGGGAGCAAGGCTTAGTCGGCGGCTTAAAACTGATTAAAAACGTGCATTGGCGTGATCCTGCGTGGTTTATGACCCCAGCTTACCAACGCAACAGCCTCCGTCTGCGTGATGGCACGCCCGAAGGGGCTGAAATGCAACAATTCGGTTGGGTCAAACACGTTGCCCGCGCCAAAACGGGCTATTTAAGCCGTATCGGTTTAGTTCGCACTTTAGTCTGGCCATTCATCTTTAAAAACTATTCCGTGCGGGATTTTGCCGAGTTTTTGGAAATCTACGGCTTGCCGTTGCGTTTGGGTAAATATCCCGAAGGGGCAACCGACAAAGAGAAACAAACCTTACTGCGTGCGGTGATGAGTATTGGACACAACGCAGGCGGCATTATTCCGCGTGGTATGGAACTCGAATTTGAAAAAGCGGCAGATGGCTCAGACAGCACCTTTATGGCAATGATTGAATGGGCGGAAAAATCAGCCAGTAAAGCCATTTTAGGCGGCACACTCACCAGCCAAGCAGACGGGGCAACCAGCACTAACGCACTCGGCAATGTGCATAATGATGTGCGTTTAGAAATTCGCAATGCCGACCTAAAACGCCTTGCAGCCACCCTTACCCGTGATTTGGTCTATCCACTTTATGCTCTCAACTGCAAATCATTTAATGACGCCCGTCGCATCCCGCGCTTTGAATTTGATGTGGCAGAAAGTGAGGATTTAAACGCTTTTGCCGATGGGCTAAACAAGCTGGTCGATATTGGCTTCCGCATTCCGAAGCAATGGGCGCACGATAAATTGCAAGTGCCAATCGCTACTGAAAATGAAGAGGTTTTGGCAAAATCTTTTCAAAATCCGACCGCTTATATGCACAGCAAAGCTGACGGAAAAATGGCAGTATTATCGGTGCAACCCGACCCAGAGGATTTGCTGGATAACTTAGAACCCACGGCGGAAGATTACCAAGCCGTTATCGATCCGCTATTGAAACCCGTGGTCGAAGCCTTGCAAAAAGGCGGCTATGAATTTGCACAGGAAAAACTAGCTATCCTTTATGCTGAAATGAATGATGAAGAGCTGGAAACTTTGCTTACTCGTGCGATTTTTGTCAGCGACTTATTAGGACGTGCCAATGCCAAACGATAACAACACGCCACCCGATGGCAACGACATTGATATGGGCTATGTCTACGCCTAGAGCCAAAACTGGCTGTCGATTACCTCAAATCAAAAGGCGTGAATATTACTTGGAACTGGTACGAACAGTTAGAAAGTGCGCACGCCCGTGCATTTACCGTAGCAAAAGCCACTAAAGCGGAAGTGTTAGATACCATCCGCTGGGCAACGGAACAAGCGATTGCCAACGGCACCGGTGAGCGGGAATATATCAAAAAACTTGAGCCAATGCTCAAGGAATTGGGCTGGTGGGGCAAAGCCAAAGATGAAAATGGCAACGAAGTGCAACTCGGTAGCCCTCGTCGCTTACGCACCATTTTACGCACCAATAAAATCACCGCTTACCACGCTGCACGTTACGCTCAACAAATGGAAAACGTGGACGAACAGCCTTATTGGCGCTATGTAGCCGTCAATGACAGCCGCACCCGAGCCAGCCACTTAGCCCTGCACGGTAAAATTTATCGTGCAGACGACCCCATTTGGCAGACAATGTATCCGCCGAATGATTGGGGTTGCCGTTGCCGTGTGGAAGCCCTGAGTGAATATGCCGTACAAAGTCGTGGGCTTAAAATTTCAAGCAGCGATGGCGAAATGGAAATGGAAGAAGCGGTGGTCGGCATTGATAAAGACACTGGCGAAGAAATTCGCACCACGGTGAGCAAAATCAAAACCGACCAAGGCGAAATGAAAGTGGGCGCTGGTTGGAACTATAACGTGGGTTCTGCCGCCTTTGGCACTGATGTGGCCGTGTTGCGTAAATTGCAACAGGTGAAAAATCGGGAGTTAAGACAGCAGACTATTCAGGCGATTAACAACAGCGAAGCACGCCATAAAGCCTTTGCCGATTGGGTGTTGGCAAATTTGGGCAAGCGAGGGGCAAGTGCAAGATATATGTCGGCTGGGTTAGTGACGACAGAAATTGCGGAAGCTGTAACAGAAATAACCCAAGGCGGAAAAAATGCAGAATTGGTTTTAGTAATGTCAGAAAAACGTTTGGCCCACGCAAATAGTGATAAACATCACGAAGGCGGTGTCGGACTAACAGCTGAAGAGTATGCGTCTATTTCTCGCATTGTTGCAAATCCAAGCCTTGTTTTATGGGATACCCTAGAGGGGCATAATAATTTGATTTACATCAATCAAGAACGAACTATTCAGGTAATTGTTGATGTGCCAAATAAACACTCAATTAAACCTAAGGAAAAAGTAGATGCAATCATCAATGCTTATAAAGTTGATATGAACAACGTGAAAAGACAGCTTTCAGGTGGGAATTATGTATTGCTTAAAGGAAAACTGTAAGTGTTATGGTGGGGGTTGAACCCACGATATACATATGCCATTAAAGAATGGGAATGCCGCGTTACCATTTCGCCACATAACACTCACAGTTTTAGTTCTGTTCAATTTACGCCCAAATATCAGGAAAGTCAAATTATATGCACATTGAATATAAATTCGATACCAGCACTATTCAGCAGAAATTTAAAAAGCTAGCGCAGGTGATGGACGGGCGAGATATTACTCGCAAAGTGGCTGGCGTATTACGCCAAGAAGCCGAGAAATTCTTTGATCTAGAGCAAGCCCCCACGGGTGAAAAATGGGAAGACCTAGATGAAGATTACAAAAAATATCGATACGCAGCAGGTCACACTGGCAAAATTTTACAAATCAGAGGCGGAAGAGGTTTGGCTGGTAGTTTAAGTTTAGATTATGGTGATAATTATGCTTTAATTGGTGCTGCTGAAGAGTATGGTGGTTTCCATCAACTCGGAACAACATTTATGCCGGCACGTCCATTCTTAGGGCTAGGCAAAGACGGCGTCAGCGAAATTAAAGCGATTTTAAACCGAGAGTTGTCGGAATTAACTCAAGAATAGGCTAAAATCGCAAATATCGCCACAGAATCACGCTAAGGGCGTTTGAAAATCAATTTATATCATTTTACGTCTCAAAAAATTTAAACGTGCTTAAACGCATTTAAACGGCATTTAAACGCTATTCTAATTTAAACCTTTCTCTAATTTTCCACCGCTGACTTTCAGCGTTTTATTTTAGGCTGATATATCACAAATCCGCCCTTCCCTCCCTTTACCGCAAAATAGCGGTTATGAAAGCAGAAAAAACCTCTTTAGCGGTACTCACCGCCCAACTTACCAGCCCCGACGGTTGGCAGCAACTTCTCCCCAAGGGCGAATTTCGCTCACGGGACGGCTCGCCCACCGACGTGGCGCATTGGTTTATTGATGGAACGATTGCCCAAAACCTTATCCACAAAGCCCGACAGCTTAATCAAGATTTACTCGTGGACTACGACCACGAAACGATTTTGAAAGCGAAAAAAGGCATTGACGCAGGCAACGTGGTGGCAGCGGGTTGGTTTAATGCCGATGAAATCCAATGGTTCGATGATGAAACACGGCAAGGCTTGTACATCAAACCCCGTTGGACGCCAAAAGCCTATCAACAAATCAAAGATGGTGAATTTGCTTTTTTAAGTGCGGTTTTCCCCTATGACGAAAACGGCACGCCTCTTGAACTCCGAATGGCAGCCCTAACCAATGACCCAGGCATTACTGGTATGCAACGGTTAGCCGTGCTTTCGGCAACCCTTAACCCACAGGAGAACGTCAAAATGCCTGAATCCTTACGCAAATTACTGGCAAAACTGGGTGTAGAAATCGCAGAAGGTGTAGAGCTAACCGAAGAGCAAGCCAACACCGCTTTAAATGCCCTTGAAACCTTGCAAACCGACAAAACCAAAGCCGATGAGCAAGTGGCAACTTTAAGTGCAAAAAATACTGAAGTGGATCTTTCCCAATATGTGCCAAAAGCGACTTATGACGCGGTAATGAGCCAAGTGGCGGTGTTATCAGCAAAAACCGATGATGTAGAAATCGACAACCACATTTCCAAAGCCCGTAACGAAGGGCGTGCAGTGGAAGCCGAAGTGGAATACCTCAAACAATTTGGCAAACAACAAGGTGTGGCAGCTTTGTCTGCAATGTTGGAAAAACGCCCACAAATTGCCGTGCTATCGGCGCAACAAACCCAAACCACCAAGGTGGAAAAGCCTGTTGAAAAAGGCACTGCCGTGTTAAGTGCTGCCGATAAAGAAGCAGCGAAATTATTGGGTATTTCTGAACAAGATTACGCAAAAGAACTGGAGGCGAAATAATGGCAAACGTAACCCCTGATTTAGTCAAAGCCCTGTTTGTCGGTTTTGGTAAAAACTTTAAAGACGGGTTGGCAAAAGCCCCGAGCCAATATACTGAAATTGCCACAGTCGTGAAATCCACTACCGCAAGCAATACTTATGCGTGGCTTGGTCAAATGCCAGGGCTGACAGAATGGATTGGCGACCGCACCTTAACCGCGATTCAAAGCCACGGCTATTCTATCGTCAATAAAAAATGGGCAAACGGTGTAGAAATCCAACGCACCGATATTGAAGACGACAACGTTGGCGTATATAGCCCATTGATTGAAGAATTAGGTCGTGCTGCAGGTGAAAAAGCCGATGAATTAGTCTTCGGTGCATTAACGGCAGGCTTTAAAACAGCGTGCTACGACGGTCAATACTTCTTCGATACCGACCACCCTGTGGGTGCGAATGTCGATGGTACTAACCAGAAATCGGTGAGCAACATTACCGATGACAGTACAGGCGTAACAGAAGCTAATGCGTGGTATCTCTTAGACTGTTCTCGCAGTTTAAAACCGATTATCTACCAAGAACGCAAAGCCCCAACACCGGCACAGATTACCGATGCCAACGATGAAAAAGTCTTTATGAAAGACGTGTTTACTTACGGTGTGGATTCTCGCTCAAATGTAGGCTATGGCTTCTGGCAAATGGCACACGCGGTGAAAGGCAAGCTGACTGCGGAAAATCTCTGGAAAGCGATTGAAGCGATGCGAGCGGTGCGTGGTGATGGCGATAAACGCTTGGCAATTCGTCCAACGCACATTGTTGTGCCACCTTCTCTTGCGCAAGCAGCAACCAAGTTGCTTGAACGCGAATTGCGTGCCGAAGATGGTGTAGCAGTCGATAACGAGTTCAAACGTATGAACTTGAAATTGATTGTGGGCGACTACCTCTAATCAACTACAAGCGGTCAGATTTGCCAAATATTTTACAAATTTGACCGCACTTTAAACCTGATTTAAAGAGGATTTAAATGCGATGGATAAAACATTTTGTGTTGTGGTGCAAAACCGGATTAAAGAAGGCTATCGCCGTGCTGGTTTCAGTTTCCACCTTGGGGACAATTCGCTTGCAGCTGTGTCAGAAAGCCAGCTCGCCCAGCTCAAAGCCGACCCACGCTTGGTGGTACAAATCACCGAAACAGGCAGTCAAGAAGGTGGCGAAGGGTTATCAAAAGAGCTGCGGGTAGTGACGAACAGAAACAACTTCGTGCTGATCCACCATCAACCGATTTAAACACTTTCACAGTGGAACAGTTAAAAGCCCAACTCACCGAACGTGGGATCACCTTTAAACAAAGTGCCACTAAAGCGGAATTGATTGCGTTATTTGCTCCCGCCGATGGTGAAAAAAGTGAGGCATAACGATGGTGTTATATGCCAACCGTGAAAGCCTGATTAAGCGTTACACTCTCAAGGTGCTTGAGCAAATCGCTTGGCTACCCGAAGCGCAATCGCTGGACGAAGCCAAAGTGCAAGAAGCCTTAGAAGACGCCAGTCAAACCATCGACAGTTATTTGGGTGGTCGTTATGTGTTACCACTCAAAACTGTACCAGCAGTGTTAGAACGCCATTGTTGCTATATCGCTCGATACTTTTTAGAGAAAAATCGCGCTACCGACCAGGCCCGTCAGGACTATGAAGACACAATCCGTTTTCTGGAAAAAGTCGCCAGTGGTGCGATTTCTCTCGGTTTATCAGACGATGATGAAACGGTAGAAAGCGAAAATGGCGCAATGATGGAAAGTGCTGGCAGCGTATGGGGGCGCAATACCTCAAAAGGGTTTATCTAATGAGTGTCATTGCTGAAACCAACGAGGCACTACTTGCTAAAATCAAAGCCCTGTGTGGGGATTATCTGCGTGAAGTCGATACCCACCCAGGACAATGGGATGACAGTTCAGTCCGCCGTTTAGTGCGTAATCCGCCTGCCGTTTATGTGGCGTGGTTGGGGCAACAGCCCAACAATAATCCCCACACAGTGACCGCCCGTTGGGGGGTGTTTGTGGTGGCTGAAGTGTTAAACGGGCAACGTCGCAATGCCGTCGGTATTTACCAAATTGTGGAAACCCTCACCGCAGGGCTACATAAGCAACGCATTGCGCCCAGCGGTATGTTTGAATTGCAAACGGTGCAAAACCTGTGGTCAGATACCCAAAGCGGAATGGGTGTTGCGGTTTATGGTATGTACTTTAACGCCGTGCAACCTTTGCCGGATATGACAAGCGATGACACCTTGTGTGATTTTAAAATTTATGATCACACCTTCAACCAAGATAAAGATGAACACACGATTGACGGCAAAACCCGCCTCACAGTGGAATTGCCAACGCAATCAGATTAAACAGGGGGCAATATGCCAACATTTAAAATTAAGCCTAAAACAGGATTGCTGATTCGAGACCCAGAGACCTTTGAGTTGTTAAGCGAAAGCGGTGAAGATAAGCCCAAAATCAGCTACTGGCTCAATCATCTTAAAAATGGCGATGTGGAGCTGGTCACAGAAACCACCACAAAAGCCAAAAATAGCAACAAGGAGCAAGCCTAATGTCTATTTCTTTCAATAATATTCCGTCCGCTTTGCGTGTGCCTTTAACTTACATTGAGTTTGACAATACTAAAGCCGTGAGTGGTCCCCCCACCGCCTTGCACAAAGTGTTGATGTTAGGCACAAAACTTGCCACAGGCTCAGCTAAAGCTGGTGAAGCGGTGCGCGTGTCAGCGTATGCACAAGCCAAAACCCTATTTGGGCGTGGTTCACAACTGGCTGAAATGGTTAAAACCTTTAAAGCCCACAACAGCACACTTGATTTATGGGTACTCCCTCTTGATGAAGCGCCAAGTGGGGCAAAAGCCACAGGTTCTGTGCAAATTACCGGCACCGCAACTCAAGCTGGCACTTTTAGCCTGATGATTGCAGGTAACAACTACAAAACCGCTGTGACCAGTGGCGATACAGCAGATGTGGTCGCAGGCAAACTGCAAAAACTGATTGCCGCAGACCAAGATGTGCCAGTGGTAGCAACCGTCGCAGGCAACACCATTACGCTCACTTGCCGTTTTAAAGGCGAAACCGGCAATGAGATTGATCTGCGCTGCAATTACTACTCAGGCGAAGCCTTCCCTGAAGGATTAAAAGCCACTATCACTGATATGAAAAACGGTGCAGTCAATCCGGATATGTCAGTGGCAATTACTGGTTTAGGCGCAGAATGGTGGAACTACATCATTAACCCGTTCACCGATACCGAAAGCCTGAATTTACTGCGTGCCGACTTGGTAAAGCGCTGGGGACCATTAAAACAAATTGACGGCATCTGCTTTATGGCAAAACGTGGTACACACGCAGAAGTCACCACCTTTGCTGAGCAACGCAATGACTATTTGTTCAGCTTGCTTGCTACCCATAAAGCCCCACAGCCTGCCTATCTTTGGGCAAGTGCTTATGCTGCCGTGGTTGCAGGCTCGCTTGCTATCGACCCTGCTCGTCCTGTGCAAACCTTGGTGATGGATTTACTGCCACCGAGTATGTCAGACCGCTGGGACTTACCGGAGCGCAACACGCTTTTGTATAGCGGTGTTAGCACCTATACGGTCAATGCAGGCAGTCAGCCACAAGTGGAAGCAGCAATCACGATGTATCGTAAAAATGCCTTTGGCGATAACGATGAAAGCTATCTCTATGTGGAAACCATAGCCACCTTGAGTTATTTACGCTACGCCATTCGCAGCCGTATTACCCAGAAATTCCCACGCCATAAATTGGCGAATGACGGCACACGCATTGGACCGGGGCAAGCAATTGTTACGCCAAAAATTATTCGTAATGAACTCTTGGCATTGTTCACTGAGCTAGAATTTGCCGGCTTAGTCGAAGACTTTGAGCAGTTTAACCAAACCCTCTTTGTAGAACGTGATAGCAATAATCCGTGCCGCGTGAATGTGTTATCCAACGAAAACCTGGTTAACCAGTTCCGCATTTATGCACACGCCATTCAATTTATTTTGTAAGGAGCAACAATGGCAACACAATTTCAAGGCTCAGCAATTATTCGCCTCAATGGGAAAGAATGGCCGTCCGACAACGACGGTACGCTCACCCCAGGTGGCAAAGAGCGCGAAACCGTCAAAGGTTCGCGTGTCTATGGCTTTTCTGAAAAACCTACTGAAGCAATGGTGGAATGTACCGTGTTTAACTGTGCCGAAACCGATGTGATGGAATTACAAAATATCACCAACGCCACAGTGGAGTTTGAAACTGACATTGGTCAAGTTTATTTGCTCCCTGGTGCATGGACAGTAGAGACCGGCACGTTAAGTGCGGACGGCAAAATCAAGCTCAAAATGGCTTCGATTGAATGTAAACGTGTGCAATAAGGGGGAATCAAAATGAAATTGATGTTAGAAACCGGCTTAATGTTTGGTGAAGAAGCCCAATTAGAAGTAACAATGCGTGAACTTACCACGGGTGATTTACTCGATGCTGAAATGGCAGCAGAACGTTTAGTGATGACCCCCGAGGGCGAGGCAGTGTTAGCCAAATCCCCTGCGTTATTCGGCTATGAGCTGCTCCGCCGTCAAATCGCTTCAGTAGGCAAAATTAACGGCCCGATTTCGATGCGTCAGTTACGTTCGCTCACGACCGAAGATTTAAACCGCATCAGCCTTTATGCGCAAAGCTGGGAGTCGGCCAAAGCAGAACAGGTGGTCTCGCGGGGGCGATTGGATACAGCAGATCAGGAAACTGGAAAAGACCTGTCTGCTGTTAGCTAAGCATTATCAGTGCAACCCTGTGTGGTTGCTTTCTCAACCTATCTTTAACTTGCCACGCTATATTGGCTACATAGGAGGCAATGATGGCAAATAACTCTACCTCGTTTTTTGTCAATCTAGCGGGCAACGTCTCACAACAAGCGGCACGATTTAGCAATTCGATTGCCAATATGGCAAACAAAAACGTGAGCAGCCTGAACAAGGTCAGTCGTGCTATTTCTGCGGTTTCCAAGGGCTTTAATGGGCTGGGAAACATCACTATCCCTATCATTGGTGTCGGAGCAGCAGCTGGTGCGACCATGGTCGGGAAATCAATGTTGCGTACCGCCGCTGATTTCGAGATGGCAAAAATCCGAATGAAGCAGACCTTTGGTGAGCAAGGTGAGGCTGCCGATGCGTGGCTTAAAAAATTCGCTACTGATACCCCAATGGCATTTGCCGACACCCAAGATGCAATGATGCGTCTGAAAACCGCTGGCATTGACCCGATGAACGGTTCATTGCAAGCCCTTGTGGATTATAACGCCAAAGTGGGCGGCGATAAGGCAAACCTAGACGGCTATATCTCGGCCATCAGTAAAGGTTTTATCAAAGGCAAGCTTTCCATGGAAGAAATCAACCCTTTGCTTGAACGTAATGTCAAAGTATTTGAAATCCTTGCCAAGGAAACAGGTGGTAAATACACCGCAGACCAAATGCAAAAAATGTTACAGGAAGGCAAACTAGGGCGTAAAGCTATCCATGCCTTATTGCGAGGTATGGGACGCGATGCTCAAGGGGCAGCCAAGGAACAGATGAAAACCTGGGACGGTTTAGTATCTAACCTTGAAGATACTTGGACGTCGATGCAGGCACGCTTTATGGAACACGGTGCTTTTGATGCCTTGAAAAAGGAACTAGGCGATTTTGTTGAGTGGCTTAACGAAAAAATTGATGATGGCACACTTGATGATTTTCCGAAAACCGTCAGCGACACGCTGATTGAAGCCCTAAAAAACCTAAAAGAGATGGCAAAAGACGTGAAGCCTGTTTTAGAGAGTATCGGCTCGGTCATGAGCTGGGTCTCTGAAAAGGCTGGCGGTTACGGCAATTTAGCCAAATTTATGGGAGCCTTATACCTCGGTAATAAAGTGCTGCGTAACGACAAAGTGCAAACGCTAGGCGGTTGGGGCTGGTCGGGAGCTAAATGGGGTTATAACAAAATCTTCAACCGTAAAAAAGGCGGCGCAGGTGGTTTGGCTGATGGTGTGGCAGGTGCATTAGGAGCTACCGTAGGCGTTACCCCTGTTTATGTAACCAACTTCCCGATGGGCTTTGGTGGCGGTGGCGGTGGTGGTTATGGTTACGATGTCATTGAAGATGGGCGTGATAAAGATAAGAAAACCCAAAAGAAAAACAAACCACCAAGACCAAAACGAGGACGTGGTAGTGTGCGTTCCCCTGTTGCAGCAGTGGCAGCTTCTGCGGCTGCCGTGCCTAAGGTTGCTGCACCTGTTACCACTGCCTCAAGCGGTGTGGCACGTTCCGTGGGCAATGGCGTGAAATCTTTAGGGCGAGGGGCATCAAAAGCCGTACCTTACCTAGGAACAGGTTTGGCAGTGGCAGAAGGTGTCACCGTGTTGATGGACGATACCACCAACACCAAAGAGAAATCTGAGGCGATTGGTTCTATCGCAGGTGCCACTGCTGGGGCGATAGTCGGACAAGCCCTGATTCCAATTCCTGTAGTTGGAGCTGCAGTAGGCTCTTATTTAGGTGGTTGGCTCGGCGAATGGTTAGGCTCCGAAGTCGGAGAGTATCTTTCTGATCCTGAACCGATTAAAAACGAGCTAAACGGCACAATTAACATTGCGGTGAAAGCCTCTGACCAACTCATTGCCACGGCAACGCAAGCCAAAATACAAACCAATCAACAACGGGATAGCTTAGAAACAGCAGTGCAAATGGGAACATTAGGCATGGGAGGTATGTGGTAATGGCAAGTAAGATTACAGGTAAAGGTAGCTTTCGTGGTGTGCCTTTTCTTATTGAAGAAGAGCAAGGCTTAGACGGAGGTCGCCGTATTGTCTCACACGAATATCCGTTGCGTGATGAGGGTTTAACCGAAGATATGGGCAAACGCCTGCGCCGTTATCAAGTCTCTTGCTTAGTTATCGGTGACGATCACTTAGCACAGGCAGAAAAACTGATTGACGCCCTTGAAGCCAGTGGTGCAGGCACGCTCAAGCACCCTTACTTTGGCACTATTGAGGTGCGGGTGGACGACTACCGTGCGAAAAACTCAACCAACCATCAAAGGGTTACGCGTTTTGACATCAATTTTCTGCCGGCAATCGAAAAAAATGCCCCAGAAATTGCCGAAGACACCGCTTATTCGGTGTTGTCGGAATATCAAGCAACCCTCAATAGCCTGTCGGACGAATTTGCCGAAATGGTGCAAGATGTGTCGGGTTTTATCGAATCTATGGTAGATAATCCACTGTTTCGCCTTGCTGATACTACCGCCGCATTTATCGAAAACATCTTTGAGGGCGTGGCAAATACGGTGAGCGGATTAACAGAAGTGAAAGACAAAGCCTTGTCGATTAAAAACCGCTTGAGCAATCTGCTTTTAACGCCAAAAGTGTTGGCATACGAACTGCAACAACTGACAAGACTGAACGTGCGAAGTGCGGTCAATTCGCAACGACAATTTGTACAACACATTGTGATCACTGATTCCATCAGCTCAGCATTAGGCGATTTAACTGCGACTAAAAACGAAATCAGCAAAAGCACACTGGACGAAATGGTGACAGCCAAAACCAACAATGTGGCTGAAACAGAAATTTTAGCCCGTCAGTTTAAAAACTTACACGAGCAAGAAATTTTTGATGCCTTGATGAACAAAACCACGTTTTTATTAAAACGTTTAGTACTTTCTACCCTTGCGGTGGAATATGGCAAAGCGATTTCTGATGCGGTGACTGAGTCTGTGGCACAGAAAACGGTCACGGAAGAGACAATCGCCACTCTGATTGAATCCAAAACCGATGTGCAGCGTTACATTGCTGAGGTGGACGAACAGCTGGAAGCGGTCATTTTAGACAACGCCGATGCAGAACAGTGGACAAGCTACGCAGCCCTTGAGCAGTATCGCTTAACCTTAATGCGAGATTTACAAATCCGTGGCGAGCGATTGGCAAATGCCATTGAAGTGAAGTTAAACGACACTTACCCTGCCATTTTGCTCGAATACCGCCACACCGGAAACAGTAAAACGTGGAAACGCTTGGCGCTGCGTAACGGTATTTCGCACCCGCTCTTTTGTTTAGGTGGCACTACCTTGGAGGTTTTACAGTAATGCCAGATACAAATAACACAGAAACCAATAATAAGATCGAACTCTATCTAAATGGCAAAATTTTATCCGGTTGGAAAAGCCTTAACCTGCAACGCTCGCTGGAATCAATGAGTGGTCGTTTTGATTTAGGCATTGCTGTGCGACCTGAAGATGATATATCAGTGCTTGCCGCAGGTTCGCCACTGGTGCTGAAAATGGGCGGGCAAACCGTGATTACCGGTTACTTGGATGAAATCAAACAACGCGTAAGCGGTAACGACAAAACTATCTCTGTGAGTGGACGAGATAAAACTTGCGACTTGGTGGATTGTGCCATTATCCACAACAGCTACCAATTCAAAAACCAAACTGCCAAACAAATTGCCGAAGCCATCTGTAAACCTTTTGGCATTAGCGTAGTATGGCAAGTGCAAGCCCCTGAAGCCAATGAACGAATCCCTGTCTGGCAAGTAGAACCAGGCGAAACCGCCTTTGATAATTTAAGCAAAATCGCCCGACACAAAGGCGTGTTAGTCACCAGCGACGTGGACGGCAATTTGCTTTTCACCGAGCCGAGCAACAAGCAAGTCGGTAATCTTACCCTTGGCGAAAACTTGCTCGAACTGGAACAAACCGACAGCTGGTTGCAACGCTTTTCGCTCTATCGCGTGATTGGTGACGCAGAACAAGGCGGCGCCAAAGGTGATACCAAAACCAAAAACAAAGCGGCAAAAGGCAAGGAAAAAGATGATGGCGTGGTAGAAGATCCCGATATTTACCCAGGACCAGCAGAAGGAGGCAAGTAATGAGTGCAAGCGGTTTAAAAGTAGAAGTCAATGACGAAGCCATCAATCGTTATCGCCCGATGATTATTATTGCCGATGACAATATGACCGGCTCTAGCGGTTATCAACGTGCCGACTGGGAACGCAAACGTCGCCAAGCCGAAGGCAAAAAGCCACAGCACGAGTGCAAGGTTGGTTTAAGCCTGACGGCACACTGTGGCTACCGAATGAACTGGTAGTACTCGATGCCCCACAATTTGGCATACACAAGGCTGAACGCCTGATTGTAGATTGCACTTACACCTTAGATGAGAAAGGTACCATTACTGAAATGACCTTAATGCACCGTGATGCCTTTGATGAACCAGCTGATGACACCTTAGACGATACCAAAGACAGCAAAGGCAAGAAAGACAAAGGTAAAAAAGGTAAATCGAAAAAGGCGAAGAAGTCTGATAAAGACAACGTGTCTGAATTTACTGGTTTTTTAGACTAATTTAAACGAGATTTAAACAGGATTTAAAAGAGGTTTATGCAAGCAATAAATCGCATAATTGCCCCACTTAAACGAGGGCTACAACTACTGGTCAGCCGTGCGGTGGTGTCAGTGGTGAATGATGCCTACGCACGCCAAAATCTCCAGCTACGGCTGCAATCAGAAGAAGTGGCCGATGATGTGGAACGCTTCCAAAACTACGGGCATTATTCTGTGCCCAAAGCCGGTGAAGCCATTGTGGTGTCTGTCGGCGGCAAACGTTCCCACTTGGTTGCCGTGGTGGTTGATGATAAAAGCGTGCGTCCTGCCGGCTTGATTGCTGGCGACAGCGTGTTGTATCATTTAGAAGGTCATCAACTGCGCTTAACCGAAAATGGTGAAGCGATCCTCTCGTGTAAAAAATTCACTATCGAAACCGACACCCTCGACTGTTCCGCACAACAAATCACGTTTGATAGTCCGCAAACGACCTTTACCGGTAACGTTGATATTATGGGAATATCAACAGCAACCGACCACCAGTCAAGCGGAATCAGCGGAAAAAACCACGACCACGAAGAACGTGTGGGCAAACCTGTTCCGTAAGGAGCAGTATGTCAGATTTAGCCCTAACATGGCATAACGGCGAAGGCGACTTGGTGCTAGGCACTGAGTCGCTTTTGCTTGATGATAGCCTTACCAATGCCATTATCATTAGCCTGTTCACTGATTTGCGCGTGGAGGGTGAACGTGGCTGGTGGGGTGATAGCTATAACGATGGCTTTCAAACCGGCTCAAAACTTTGGACTTTAAGCCGTGCCAAACAACTCCCCGAAATCCTTGATGACGCGCAACTTTACGCCAGCCAAGCCTTGCAATGGCTAGTTGATGATGGCGTAGCCAAAAGCGTGCAAGTGATTGCCTCCAATCCGCAAATGTCGGTCTTGCTGTTAGAAATCCTTGTGGTGTTGCCCGATGGCAGCACAGAACAACGCACCTTTCGTGCAAATTGGAGTCTCTAATGGCATTTAATACCCCGACACTCTCTACCCTGATTAAACAAGGCGAGCAACAGTTTCAATATCGCTTCCCAACACTTAAACGACACAATGTGATTGGCGTGATTAACCGCATTTGTGCAGCATTAAGTGCCGGCGAACATATGCACTTGGACTGGCTCGCACGCCAAATTATCCCCACCACCGCGGAAGAAGACTATTTAATCGAATACTGCCTCTATAAAGGCATTGTACGCAAACAAGCCTCAACCGCCACGGGATTAGTGACTGTGACCGCAGCCAACGACACTACAATCCCCGCAGGCACAGTGTTTGAAGATACCAACACAGGGCTGACCTTTATCACCACCCAAGAAACCGTGGTAAAAGCCGGCACCGCTGATATTGCGGTGAAATGTGAAACCACAGGCGTAGAAGGTAATTTAAAAGCCGGTACAAGCCTTTCACTGACCTCGGCAATTTTGGGCTTATTGCCCACCGCAACCGTCAAAGTAATGAGCGGTGGCGCGGACATTGAATCCCTTTCGCGTTTATTAGCACGCCTAATTTATCGGGTTCAGTACCCGCCAGCTGGTGGAGCATCACATGATTATATACGTTGGGCAACGGAGGTGCCTGGTGTTACTAGAGCTTGGTGTTTCGAACGCTATTATGGTGGTGGCACAGTTGGCGTAGCATTTGCTTGTGATGAACGTGAAGATATTTTACCAACGCCAGAAGATATTGCCCGTGTGCGTGCCTATATCGAAGGACATAAGAATGAAGTAACAGGACAATTTGAAGGCATGCCAGCAAATGTAGAACTGTATGTCTTCGCACCACAGTTTCAAGCGGTCAATTTTAAGATCCGTCTTGCACCTAATACGCCAACCTTACGCCAAGCAGTACGTAAAAGCCTTGCTGCTTATCTTGCCAACGCTGGCGTGGGGGCGTTGCTCTATCTTTCGCAAATTCGTGCGACCGTTTCCAACACCGCAGGCGAAGTCGATAACAGCGTGATTTTTCCAACCGCAGATGTGCAATTGTTAAGCGATAACATCGCTATCCTAGGAGACATCGAATGGCTATGACCCACGCCAGTATTTAGACGCGGCGATAAAATTGCTCCCAGTAGGGTTAGCGTGGAAACGAGCGTTAGACAGCAATCTTGCCAAGGTGCTTGCCGTGCGTTGTGACCAACTTGTAGAAGTCAATAGCAAAGCTCACACCCTCATCAAAGAGCGAATGCCGGGGCAAGCTACATTGTTACTTGAAGAATGGGAAGGATTTTACGGCTTGCCCGAGTGTGGGCGGCAAATTGTAGGGAAAACGCTAGTACAACGACAAAAGCAAGTACAGGAAAAAGAGAATGAAGTGGGGTCAAATAGCAAACGGTTCTTAGAAGAGATAGCAACCCAAGCTGGATTTAAAGTCAGAGTTGTTAACCATTATCCACACCATTGCTTGCGAGATTGTACCTACCCACTTTATGAACAAGCAAACCATTGGCGCATTTTTATGTACACCCCAGCAGTATCATCTATTAGGTACGCAACTTGTTTAGATGATGTGGTGAAAAATTTAACCATATTTGAGCGTAATAAAGAGCTAGAGTGCTTGTTAAAACGTTATCAATACGCTCATTTAGAATTTGTATTTATCTATGAAGAGGAAACTCAATAATGTATCACTTAGACAATGATTCAGGGGTGTCAACGTTTGCCTTGGCCCCCGTTAAAAGCACACAGCGTCTTTGGTTTACCGAAGGTGGTCATGGCAATGCTATCAGTTATCCTGGTGCTGACTGGTTTAATATGGTACAGGCCGAATTGTTCTCTATTTTAGATGATGCCGGAATCCAGCCTGATAAGGGGCGGTTGAATCAGATTTCACTTGCTATCCGTAAATTATCAGAAGGTAAAGTTGAAGATTTTAGCCAACAACTCAAACAAGCCGATGGTTATAAATATATCGGTCGGTGTAAGTCTGTTGCTGAGTTGCGCACTATCCGCCCAACTGAAAATGGGCAACGCATTTTGGTAGATGCTTATTATGAAGGCAGTACTGCAGGTGGTGGAGAGTTTGTTGCGGATTTACAAGACCTAATTACACCTGATGACGGTGGGACATGTTTTGTAGTACCGAATAATGGTGGGCGCTGGAAGCGATTGTTCTCTTCATCATTGCAAGATACCGATTTCGGCGTAATTGGCGGCGTTGCTGACGATACAACGAATTTAAATGCGTTTTTAGATGCGTTGCGGACATATAAAGTTAAAGGCTACTTTACTTCACGCCACTATAAAACCTCAGCTGCATTAAATATTGCGGGGGTCGATATTGAAGGGGTTCTAGCTGGTTATAAAAACAAACACGGCACGCGAATTACAGGTAACGGTAACCACAATATCTTTGAGCAAATGGGGGGGGAATTACAACACATTACTTACTCGCTTAAAAATTTTGCGTTAAGCGGTGGCATTGTTGGGTTGAAAATGACCTATGCCGTCAATGCAGTGGTTGAAAATGTATTTATTGACAATGTAGAACGTGCTTTCTTGCTGGGTGACTCACAATTCGTCGGCCCGATTTGGTGCAGCCTGAAAAATTGCCGTGGTGAAGGTCGCATCTCTGGCTTGGAGATTGATGGCAACAAATGGGCAAACGCTAATATGTTTGAAACTTGCTTTTTCAAAGGCGACGAATTTGCCGGCAGTATTACGGCAAAAGGCGGGATTGGAGCAGTCTCGAACCATTTTGTTAACACCGAATTTGCTGGTAAAGGTGTTGGTGTCAAGCTCGGGAAAAACAAGTCGACCGCTTTTGACAACTGCTATTTTGAGAGCGAGGGGCCATCCCTACTCATCGAAGATTCAACCGCAGATTTAGCATTGAACAATGCAACATTTGGAAGTTTAACTGAAAATAATAAGACGGGGAAAACATCGTTTATCCATCACTCTTTAGGCACTTGTAATATGTCTATTTCGAGTGGGTATATTTATCTCGCTGGCAACAATCAAAACAACTTAGCATTTATTGAGAGTGATAAGCCGGAATCTCTTGTGGTAAATATGGCGACACCAGTAAAACGAGAAATATATACGGCAACTGGCTTTAAATTATTCAAAAATCCTGATTTACCAAACAAAAATTCCCGGGTGCACTATACTAGTGGGTATGTTTGTGAGTTTTCTAGCCAGAACAAAAATGCAGAGCTTGGTAATGGTGATTTAACAGCTTATTACAATTTAAATAACAGTCGTTGTGCTGTTGGATTAAATTTAAAAATTGGTTCAAGCACAACAAAAGGTACAGGGCAATGGCAATTTCGTTTACCATTCCAAGCTAGTGGAATTGGCAAATACTACTTGGGTCAAGCAATAGCCATAAAAGCTGATGGTAGTAAGTTAATGACAGGTGTAGCACGTATTGTAGGAGGGTCAAACCAAGTTGTAGCTTATTTTAATAATGTTAATCCAGCTGATGCTACACGGCCGTTCGAATGGACTGAAGGTGACCGATTAGATATTTCGATTGAGTATGAGATTTAAAAATGCCAAAGAAACACTACTGTACAGGTTGGCGAAAAGCCCCTACCAATATCAATAGTTGTTGCCACCAACACGACCGAGACTACGGCATACACGGCACAATCAGTCGCGCTGATGCGGATAAACGTCTAAGAGAATGCTTAATTGCACAAAGGTATCCATTCAAGGCATGGATATTTTGGGTGATAGTACGATTATTAGGTTGGATATTTTATAAGGAAAATAAACTAAGCCATTAAAACAACGAAAAAATATCAGGGTTTTATATTCTCAGTTTTTGAAACGTAATATTGAACGAATTAGCAAATTTGATAAAAGGAGGGTTTACCTCGCACAAAGTTTAAAAAGAAAAGACGGCGATAATAACGGCACGGCAATGCGCGTTATTACCAGCTACGCAGAACATGCCTGCATATAGCCATACGCCGCCTACCTTGCGCAAGGCGGGCGGATTGTAACAAATCTTTTAATTATGGAGAATATATGCAGTCAATTAAAACAATCCGTTGCACATTTTGTAACAAATTATTGGCGAAAGTAGGTACAGTTGGTTATTTAGAAATCAAATGCCCACGCTGCAAAGTAATTAACTTTACTAAATAACTTTATTTGAGTGTCGGAATACCTTGAGTATCAGAACGCCATAGAAGGAAAAACTATGGCAAACAAAAAAACTTTTAAACAAGCCCCGCTACCGTTTATCGGGCAAAAAAGAATGTTTTTGAAACACGTGGAAATTGTGTTAAACAAACACATTGATGGAGAAGGTGAAGGTTGGACGATTGTGGACGTATTTGGTGGGAGTGGTTTATTAAGCCATACTGCCAAACAACTAAAGCCAAAAGCAACCGTAATTTATAACGATTTTGATGGCTACGCCGAGCGATTAAATCACATTGACGACATCAACCGATTACGCCAAATTATCTTCAATTGCTTACATGGTATTATACCAAAAAATGGACGATTAAGCAAAGAAATTAAAGAGGAAATCATCAATAAAATCAATGATTTCAAGGGTTATAAAGACCTGAACTGTTTAGCTTCTTGGTTATTATTTTCTGGTCAGCAAGTTGGAAGTGTTGAGGCGTTATTTGCTAAAGATTTTTGGAATTGTGTGCGCCAAAGCGATTACCCAACGGCTGAGGGCTATTTAGATGGCATTGAGGTTATAAGTGAGTCGTTCCATAAGCTAATCCCCCGCTATCAAAATCAAGATAAGGTGCTACTATTACTTGATCCACCTTATTTATGCACTCGCCAAGAGAGTTACAAACAAGCCACTTACTTTGATTTGATTGATTTTCTACGCTTAATCAATCTAACCAAACCTCCTTATATCTTCTTCAGCAGCACGAAAAGCGAATTCATCCGCTATTTGAACTATATGCAGGAGAGCAAAACAGATAACTGGCGAGCGTTTGAGAACTATAAACGAATTGTGGTGAAAGCGTCAGCTTCCAAAGATGGAATTTATGAGGATAATATGATTTATAAATTCTAAATTTAAACGCTCTCTAAATACCGTTTAAACATATAAATGAGCCATTAAAACAACGAAAAAATCTCAAGGTTTTATTTTCGTAGTTTTAATGGTTTTTTTTCGCAGTTTTAATGGCTCGCTACAACGCAATAAAATCGAACTCGCAATATAAGTCTGAGCAATAATGATCCCTACAGGGGAAAAAATCCATTTACTTATAAAAGGAAGTAGTTCAGCCAATATCCCTTGTGAACTAAAAAGTAGAAGCAAACTTAGTCCTGTGACTAATGGTGGCAAAACCATTGGTAAATCAAACAAAGTGTCAAAAAATGATTGAAAAGGCAACCGCACTTGACTCATTCGCCATGCAGATGGAATAGCAATACATAATGCTAATATCAAAGAAAAAAGAGACGTTCCCAATGACATTAGCAATGCAAAATGCAATTCGGAATTAAATAATATTTGTTGAAAAAAATAAAAATCTAATTTTGCGATTAAAGAAAGCACCGATCCCATAACAACAAATAATAGTATTAATAATGGGATCAGCGCTAACTTTAAACTTAGACAATTATTTAGCCGGTAAGAAACCTTCATCAGTAAAATACTTCACGCCTTGAGGAGATTTAAAGAAATCAAATAACTGTTGAGCTTCTTTTGGATATTTAGAAGAAAAAAGTAGACCAATAGTAACTTTTTCTTCTGGTGTGCCTTTTGGACTTGGTAATAATTCAACCTTGTCTCGAACTTTCCAAGCACCTGAACGACCTACTACAGCTGCATCTACATCACCATTTAATAAATATAGCATTAATTGTTTTACCGTCGCAGCTTTCACAACAATTTTATCATTAAGTTGCTTTTGATATCCTGACAACTCAAACATTTTTTCAGCGCCTTTACCAAGAGCCATTGCTTTACTATCACCAATACCTAAACGTAATGAGCTTTCAGCTAATGCTTTAAAAGAATCAATCCCTGAAATTTTATCTTTACGAATAGCCATAACTGGAACATGCAATACTATGGTCCCTATATTGTTTACATCATTAGTTTTCTGTAATTTTGTGACATAATCCTCTGAACCCGCTAAAAAAAGATCACCACTTTTTACCGTGTTATAACGAGCTAGAATCTGTCCAGAACCACCATATTCAACAGTTACTTTATTTCCTGTTTCTTGTTCATATTGGTGAATAATTTTTTCCACAGGCTCCTTCAGTCCCGCCCCAGCATATAAATACAAGTCTGCAGCTTGTACAGAAAATGTAGTTAAAATCATTGAAGTTACAGCAACTAATTTTTTCATTTTCTCTCCTTATAAAATGAGTTTCAGCGAAAATCGATATATATAAAATTGTATAATGAATTATTCGAAAGATTTATTCAATCTTTAGTTTATAAATTAATCGATTTTTTTTCTAATTTCATGACATGGCACTAATTGACTTAATTTTGAAACAACAAAAAAGGTTGGGACTCCCCAACCTTTCACTTAATCTTTCAATAATTTAATTTTTTCAATCACATTTGTTGTTGAACAACCATTTTCAAAGTTTAGCACTTTAACATCGCCACCGTTTGCCCAAACTTCTTTACTGCCTGCAATCTCTTCGGGTTTGTAATCGCCGCCTTTGACTAAAAGATCTGGTAGAATTTCGCCGATTAAACGTTGTGGTGTATCTTCAGTGAAAGGCACCAACCAGTCTACGGATGCCAAACCAGCCAATACCGCCATACGGTTTTCAAGATTATTAATTGGGCGACTTTCACCTTTTAAGCGTTTAACAGAATCGTCGCTGTTTACCGCAACAATTAGACGATCGCCCAATTTGCGTGCATTTTCTAAATAAGAAATATGCCCTGGATGCAAAATATCAAAACAGCCATTAGTCATCACAATTTTTTCACCGCGCGCTTTAGCTTGTGCGACAGCATCTTTTAATTCTGCTTCACTCATAATGCCAAATCCAGTTTCAGGACGAGCATGAATCGCATTTTCAAGTTCCACGGTCGAAACCGTTGAAGTCCCCAATTTCCCCACCACAATTCCTGCGGCAACATTGGCTAGGTAACAAGATTCTTCGAAAGAACGTCCATCTGCTAATGCGGTTGCTAATACGCTAATGACAGTGTCACCGGCTCCCGTCACATCAAACACTTCTTTTGCAACAGTTGGCAAATGATAAGGCTCTTGATTTGGGCGTAATAATGTCATGCCTTTTTCAGAACGCGTCACCAAAAGTGCGGTTAATTCAATATCAGAAATTAATTTTAAACCTTTCTCAATAATCTCTTCTTCCGTATTGCATTTACCCACAACAGCTTCAAATTCAGACATATTGGGTGTCAATAATGTAGCCCCACGATAACGTTCAAAATCAGTTCCCTTTGGATCGATCAACACAGGCACATTCGCTTTGCGTGCAATTTGAATCATTTTCTGAACATCTTTAAGCGTGCCTTTGCCGTAATCAGAAAGAATCAAAGCACCGTAATTTTTCACCGCACTTTCTAACTTCGCTAATAAATCCTTGCAATCTACATTATTGAAATCTTCTTCAAAATCAAGGCGGAGCAGCTGTTGATGACGAGATAAAATACGTAATTTAGTAATGGTTGGATGGGTTTCTAATGCAACAAAATTACAATCAATTTTTTGTTTTTCTAATAAGAGGGAAAGTGCAGAACCAGTTTCATCTTGTCCAATCAATCCCATTAACTGAACGGGTACATTGAGTGAAGCAATATTCATCGCCACATTTGCTGCACCACCCGCGCGTTCTTCATTTTCTTGTACACGAACCACTGGTACTGGTGCTTCTGGTGAAATACGGTTGGTTGCGCCGAACCAATAACGATCAAGCATCACGTCGCCTAATACGAGTACTTTTGCTTGCTTAAATTCTGCTGAATATTGAGCCAT
Protein sequences of DBSCAN-SWA_3 >NC_000907|1558773:1597183|1586979_1587765_+|WP_164927870.1|tail|DBSCAN-SWA MPDTNNTETNNKIELYLNGKILSGWKSLNLQRSLESMSGRFDLGIAVRPEDDISVLAAGSPLVLKMGGQTVITGYLDEIKQRVSGNDKTISVSGRDKTCDLVDCAIIHNSYQFKNQTAKQIAEAICKPFGISVVWQVQAPEANERIPVWQVEPGETAFDNLSKIARHKGVLVTSDVDGNLLFTEPSNKQVGNLTLGENLLELEQTDSWLQRFSLYRVIGDAEQGGAKGDTKTKNKAAKGKEKDDGVVEDPDIYPGPAEGGK >NC_000907|1558773:1597183|1560908_1561178_+|WP_005693493.1|DBSCAN-SWA MSVLEKPKKTAEQDWHRADILAELKKNGWSLRSLAKEGQVSYNTLKTVLDKSYPKMERLVANAIGVPPEVIWAGRFAERNKRPTLQHKY >NC_000907|1558773:1597183|1565963_1566233_+|WP_164927869.1|DBSCAN-SWA MKLKQKLLTFPNVCLLLLVICSTLGLALVWFIPFVGQALIWNSLVFLCWVVYFEVRGLKDWGEHNLEQLVKMAEVSAAAAYKISSMVAK >NC_000907|1558773:1597183|1570704_1570959_+|WP_005693513.1|DBSCAN-SWA MMNLILAFSGVIALYGGYLYLRLRQSQKQAATLQKEKEQLQTQKTVAETKVKNYQVKQKNEENLISRSRTSLLERMHNDGDLRD >NC_000907|1558773:1597183|1558773_1559373_-|WP_005645090.1|DBSCAN-SWA MLIVQNLQTNILKSISFSIEKSECLSVVGESGSGKTTLLNAIAGYIDYSGSILWNNQVLENNPPWKRNFRYLNQRLYLFPHKTVRGNLILANPSASDAEQQILLSELKIDHLINRYPHQLSGGEQQRVALARALIYRPDLLLLDEPFSSLDWSSRKDIWKVLKNLIQTNEITTILVTHEPKEAEYFSGKQIQLYQGQLI >NC_000907|1558773:1597183|1571954_1572524_+|WP_010869228.1|DBSCAN-SWA MNDKTTRGRASKVDLLPPNIKSTLTMMLRDKQYSQAEILEEINNIIADSGLDESMQLSKTGLNRFASKMERFGKKIREAREVAEVWTKQLVEAPQSDIGKLLMEAVKTMAFDLTLNADEAVANDPKFLNQLALIANRIEQAQSISEERERKVRKEVAQQAADTAEKVISQAGLSADTVAQIKQQILGIA >NC_000907|1558773:1597183|1593429_1594275_+|WP_032828356.1|DBSCAN-SWA MANKKTFKQAPLPFIGQKRMFLKHVEIVLNKHIDGEGEGWTIVDVFGGSGLLSHTAKQLKPKATVIYNDFDGYAERLNHIDDINRLRQIIFNCLHGIIPKNGRLSKEIKEEIINKINDFKGYKDLNCLASWLLFSGQQVGSVEALFAKDFWNCVRQSDYPTAEGYLDGIEVISESFHKLIPRYQNQDKVLLLLDPPYLCTRQESYKQATYFDLIDFLRLINLTKPPYIFFSSTKSEFIRYLNYMQESKTDNWRAFENYKRIVVKASASKDGIYEDNMIYKF >NC_000907|1558773:1597183|1593254_1593374_+|WP_005693545.1|DBSCAN-SWA MQSIKTIRCTFCNKLLAKVGTVGYLEIKCPRCKVINFTK >NC_000907|1558773:1597183|1580656_1581208_+|WP_005693530.1|DBSCAN-SWA MSVIAETNEALLAKIKALCGDYLREVDTHPGQWDDSSVRRLVRNPPAVYVAWLGQQPNNNPHTVTARWGVFVVAEVLNGQRRNAVGIYQIVETLTAGLHKQRIAPSGMFELQTVQNLWSDTQSGMGVAVYGMYFNAVQPLPDMTSDDTLCDFKIYDHTFNQDKDEHTIDGKTRLTVELPTQSD >NC_000907|1558773:1597183|1577096_1577537_+|WP_005693523.1|DBSCAN-SWA MHIEYKFDTSTIQQKFKKLAQVMDGRDITRKVAGVLRQEAEKFFDLEQAPTGEKWEDLDEDYKKYRYAAGHTGKILQIRGGRGLAGSLSLDYGDNYALIGAAEEYGGFHQLGTTFMPARPFLGLGKDGVSEIKAILNRELSELTQE >NC_000907|1558773:1597183|1559961_1560681_-|WP_005693492.1|DBSCAN-SWA MQYQNQDNFPERIEYLVDKLNGPSEFARKTGVTLSTITRWRKGEADPSRSNLVKIAEVTGVSIEWLATGKIKEEKTTEEKPAGSLVSRAFERMQAMLEEGVSMIDSYSSINVSAGFGSFNEGITQPDGQEPYSDELLTSLGVKADNCAVFWANGNSMLPTINNYDQMLVDLSRKEIQGDRIYLVQNGESVWVKRVKMEWDGISLISDNKEEYPPISITGENAQNLQIIGQVVHIGHSLI >NC_000907|1558773:1597183|1563331_1563604_+|WP_005693495.1|DBSCAN-SWA MSNITLNENAMLYLKADYYRPEMPTFKACYFRLSKIAQEQGWGTLPNLAQTKALFKAAVPEIIWTREAFKRANTQKKHAHKATPYLEQVM >NC_000907|1558773:1597183|1574061_1575624_+|WP_010869229.1|DBSCAN-SWA MQSRILDIHGNPFRFEADMQTESESRLMPLQYHYSDHPASGLTPAKAARILRAAEQGDLVAQAELAEDMEEKDTHILSELSKRRGAITAVDWQIKPPRNATPEEQRDAEMLQEILEDAVWLDDCIFDATDAILKGFSSQEIEWEQGLVGGLKLIKNVHWRDPAWFMTPAYQRNSLRLRDGTPEGAEMQQFGWVKHVARAKTGYLSRIGLVRTLVWPFIFKNYSVRDFAEFLEIYGLPLRLGKYPEGATDKEKQTLLRAVMSIGHNAGGIIPRGMELEFEKAADGSDSTFMAMIEWAEKSASKAILGGTLTSQADGATSTNALGNVHNDVRLEIRNADLKRLAATLTRDLVYPLYALNCKSFNDARRIPRFEFDVAESEDLNAFADGLNKLVDIGFRIPKQWAHDKLQVPIATENEEVLAKSFQNPTAYMHSKADGKMAVLSVQPDPEDLLDNLEPTAEDYQAVIDPLLKPVVEALQKGGYEFAQEKLAILYAEMNDEELETLLTRAIFVSDLLGRANAKR >NC_000907|1558773:1597183|1577767_1578835_+|WP_005693524.1|DBSCAN-SWA MKAEKTSLAVLTAQLTSPDGWQQLLPKGEFRSRDGSPTDVAHWFIDGTIAQNLIHKARQLNQDLLVDYDHETILKAKKGIDAGNVVAAGWFNADEIQWFDDETRQGLYIKPRWTPKAYQQIKDGEFAFLSAVFPYDENGTPLELRMAALTNDPGITGMQRLAVLSATLNPQENVKMPESLRKLLAKLGVEIAEGVELTEEQANTALNALETLQTDKTKADEQVATLSAKNTEVDLSQYVPKATYDAVMSQVAVLSAKTDDVEIDNHISKARNEGRAVEAEVEYLKQFGKQQGVAALSAMLEKRPQIAVLSAQQTQTTKVEKPVEKGTAVLSAADKEAAKLLGISEQDYAKELEAK >NC_000907|1558773:1597183|1582884_1583241_+|WP_005693533.1|tail|DBSCAN-SWA MATQFQGSAIIRLNGKEWPSDNDGTLTPGGKERETVKGSRVYGFSEKPTEAMVECTVFNCAETDVMELQNITNATVEFETDIGQVYLLPGAWTVETGTLSADGKIKLKMASIECKRVQ >NC_000907|1558773:1597183|1581411_1582875_+|WP_005693532.1|tail|DBSCAN-SWA MSISFNNIPSALRVPLTYIEFDNTKAVSGPPTALHKVLMLGTKLATGSAKAGEAVRVSAYAQAKTLFGRGSQLAEMVKTFKAHNSTLDLWVLPLDEAPSGAKATGSVQITGTATQAGTFSLMIAGNNYKTAVTSGDTADVVAGKLQKLIAADQDVPVVATVAGNTITLTCRFKGETGNEIDLRCNYYSGEAFPEGLKATITDMKNGAVNPDMSVAITGLGAEWWNYIINPFTDTESLNLLRADLVKRWGPLKQIDGICFMAKRGTHAEVTTFAEQRNDYLFSLLATHKAPQPAYLWASAYAAVVAGSLAIDPARPVQTLVMDLLPPSMSDRWDLPERNTLLYSGVSTYTVNAGSQPQVEAAITMYRKNAFGDNDESYLYVETIATLSYLRYAIRSRITQKFPRHKLANDGTRIGPGQAIVTPKIIRNELLALFTELEFAGLVEDFEQFNQTLFVERDSNNPCRVNVLSNENLVNQFRIYAHAIQFIL >NC_000907|1558773:1597183|1571634_1571943_+|WP_010869227.1|DBSCAN-SWA MSFKELITQDQRLVVLRVLSEAGYDANESIINDGLDLYGHDISRDLVRTHLSWLEEQGLLTIERLKDGYMVASITQRWLRCSTRSCGSGRRKTPPPENLNTV >NC_000907|1558773:1597183|1578834_1579761_+|WP_005693526.1|head|DBSCAN-SWA MANVTPDLVKALFVGFGKNFKDGLAKAPSQYTEIATVVKSTTASNTYAWLGQMPGLTEWIGDRTLTAIQSHGYSIVNKKWANGVEIQRTDIEDDNVGVYSPLIEELGRAAGEKADELVFGALTAGFKTACYDGQYFFDTDHPVGANVDGTNQKSVSNITDDSTGVTEANAWYLLDCSRSLKPIIYQERKAPTPAQITDANDEKVFMKDVFTYGVDSRSNVGYGFWQMAHAVKGKLTAENLWKAIEAMRAVRGDGDKRLAIRPTHIVVPPSLAQAATKLLERELRAEDGVAVDNEFKRMNLKLIVGDYL >NC_000907|1558773:1597183|1568120_1568675_+|WP_005693508.1|DBSCAN-SWA MKLCRCPICHSDIHLEALIEDDAGRELLGKISQLTHGCAQPMVGYLGLFKPAKSNLNNARALKILSEVLDLYPCSLLLAQALSETVASLRKKRQQALQTGQKIEPLTNHNYLKSVYETQKPHFAVIRSGKNQSETVKAQQAEDKKVQDAILYVERFVQLGQEEFVKNSPEYQIWLNHKAQKQAL >NC_000907|1558773:1597183|1567566_1568124_+|WP_010869224.1|DBSCAN-SWA MSEKAKLIQLIHIGKQQLNMDEFSYREMVKRLTNKTSSTKCTVVELLKILHEMQQKGAKVKHFAKRGTKPTAYSPATGEVKVKSEIAHKIRAVWIQMGKHGFLADPSXKALNSYMRKVMNKGKSVLALNVGALNSNDASRFLEILKKWHKRVMLKRLAEKYGCITSAETGYDELCLVFKNYQGVA >NC_000907|1558773:1597183|1594828_1595566_-|WP_005693547.1|DBSCAN-SWA MKKLVAVTSMILTTFSVQAADLYLYAGAGLKEPVEKIIHQYEQETGNKVTVEYGGSGQILARYNTVKSGDLFLAGSEDYVTKLQKTNDVNNIGTIVLHVPVMAIRKDKISGIDSFKALAESSLRLGIGDSKAMALGKGAEKMFELSGYQKQLNDKIVVKAATVKQLMLYLLNGDVDAAVVGRSGAWKVRDKVELLPSPKGTPEEKVTIGLLFSSKYPKEAQQLFDFFKSPQGVKYFTDEGFLPAK >NC_000907|1558773:1597183|1590899_1592771_+|WP_005693543.1|tail|DBSCAN-SWA MYHLDNDSGVSTFALAPVKSTQRLWFTEGGHGNAISYPGADWFNMVQAELFSILDDAGIQPDKGRLNQISLAIRKLSEGKVEDFSQQLKQADGYKYIGRCKSVAELRTIRPTENGQRILVDAYYEGSTAGGGEFVADLQDLITPDDGGTCFVVPNNGGRWKRLFSSSLQDTDFGVIGGVADDTTNLNAFLDALRTYKVKGYFTSRHYKTSAALNIAGVDIEGVLAGYKNKHGTRITGNGNHNIFEQMGGELQHITYSLKNFALSGGIVGLKMTYAVNAVVENVFIDNVERAFLLGDSQFVGPIWCSLKNCRGEGRISGLEIDGNKWANANMFETCFFKGDEFAGSITAKGGIGAVSNHFVNTEFAGKGVGVKLGKNKSTAFDNCYFESEGPSLLIEDSTADLALNNATFGSLTENNKTGKTSFIHHSLGTCNMSISSGYIYLAGNNQNNLAFIESDKPESLVVNMATPVKREIYTATGFKLFKNPDLPNKNSRVHYTSGYVCEFSSQNKNAELGNGDLTAYYNLNNSRCAVGLNLKIGSSTTKGTGQWQFRLPFQASGIGKYYLGQAIAIKADGSKLMTGVARIVGGSNQVVAYFNNVNPADATRPFEWTEGDRLDISIEYEI >NC_000907|1558773:1597183|1564964_1565282_+|WP_010869223.1|DBSCAN-SWA MQKVYNKMAGEMMSPRNAVIHNQLAMLELATLECEALGIEVETVEWFDIGKPRLVVKDCSALRHLIKTGKAFNYGSEVKNGIRIYLNQMMVKGVKFIWKSDVTKH >NC_000907|1558773:1597183|1571076_1571304_+|WP_005693516.1|DBSCAN-SWA MADVLDQLNEREEALLQNILAPHLDTELSDDEVDAIAEAGRQCSECGLPIPTTRLRANPFAHRCVSCQQDWEEGR >NC_000907|1558773:1597183|1589240_1590308_+|WP_005693541.1|plate|DBSCAN-SWA MAFNTPTLSTLIKQGEQQFQYRFPTLKRHNVIGVINRICAALSAGEHMHLDWLARQIIPTTAEEDYLIEYCLYKGIVRKQASTATGLVTVTAANDTTIPAGTVFEDTNTGLTFITTQETVVKAGTADIAVKCETTGVEGNLKAGTSLSLTSAILGLLPTATVKVMSGGADIESLSRLLARLIYRVQYPPAGGASHDYIRWATEVPGVTRAWCFERYYGGGTVGVAFACDEREDILPTPEDIARVRAYIEGHKNEVTGQFEGMPANVELYVFAPQFQAVNFKIRLAPNTPTLRQAVRKSLAAYLANAGVGALLYLSQIRATVSNTAGEVDNSVIFPTADVQLLSDNIAILGDIEWL >NC_000907|1558773:1597183|1595752_1597183_-|WP_005693548.1|DBSCAN-SWA MAQYSAEFKQAKVLVLGDVMLDRYWFGATNRISPEAPVPVVRVQENEERAGGAANVAMNIASLNVPVQLMGLIGQDETGSALSLLLEKQKIDCNFVALETHPTITKLRILSRHQQLLRLDFEEDFNNVDCKDLLAKLESAVKNYGALILSDYGKGTLKDVQKMIQIARKANVPVLIDPKGTDFERYRGATLLTPNMSEFEAVVGKCNTEEEIIEKGLKLISDIELTALLVTRSEKGMTLLRPNQEPYHLPTVAKEVFDVTGAGDTVISVLATALADGRSFEESCYLANVAAGIVVGKLGTSTVSTVELENAIHARPETGFGIMSEAELKDAVAQAKARGEKIVMTNGCFDILHPGHISYLENARKLGDRLIVAVNSDDSVKRLKGESRPINNLENRMAVLAGLASVDWLVPFTEDTPQRLIGEILPDLLVKGGDYKPEEIAGSKEVWANGGDVKVLNFENGCSTTNVIEKIKLLKD >NC_000907|1558773:1597183|1566656_1566830_+|WP_005693505.1|DBSCAN-SWA MMTETRKNELENQLNQMIVMLKEAQKSLFKGQYTHAAIFVGNVSDQLPNMRMMLARG >NC_000907|1558773:1597183|1580234_1580657_+|WP_032828369.1|DBSCAN-SWA MLYANRESLIKRYTLKVLEQIAWLPEAQSLDEAKVQEALEDASQTIDSYLGGRYVLPLKTVPAVLERHCCYIARYFLEKNRATDQARQDYEDTIRFLEKVASGAISLGLSDDDETVESENGAMMESAGSVWGRNTSKGFI >NC_000907|1558773:1597183|1583253_1583637_+|WP_005693534.1|DBSCAN-SWA MKLMLETGLMFGEEAQLEVTMRELTTGDLLDAEMAAERLVMTPEGEAVLAKSPALFGYELLRRQIASVGKINGPISMRQLRSLTTEDLNRISLYAQSWESAKAEQVVSRGRLDTADQETGKDLSAVS >NC_000907|1558773:1597183|1571303_1571630_+|WP_032828368.1|DBSCAN-SWA MSEFWEFVRSNFGVISTLIAIFIGAFWLKLDSKYAKKHDLSQLADIARSHDNRLATLESKVENLPTAVDVERLKTLLTDVKGDTKATSRQVDAMSHQVGLLLEAKLKE >NC_000907|1558773:1597183|1585612_1586980_+|WP_010869234.1|DBSCAN-SWA MASKITGKGSFRGVPFLIEEEQGLDGGRRIVSHEYPLRDEGLTEDMGKRLRRYQVSCLVIGDDHLAQAEKLIDALEASGAGTLKHPYFGTIEVRVDDYRAKNSTNHQRVTRFDINFLPAIEKNAPEIAEDTAYSVLSEYQATLNSLSDEFAEMVQDVSGFIESMVDNPLFRLADTTAAFIENIFEGVANTVSGLTEVKDKALSIKNRLSNLLLTPKVLAYELQQLTRLNVRSAVNSQRQFVQHIVITDSISSALGDLTATKNEISKSTLDEMVTAKTNNVAETEILARQFKNLHEQEIFDALMNKTTFLLKRLVLSTLAVEYGKAISDAVTESVAQKTVTEETIATLIESKTDVQRYIAEVDEQLEAVILDNADAEQWTSYAALEQYRLTLMRDLQIRGERLANAIEVKLNDTYPAILLEYRHTGNSKTWKRLALRNGISHPLFCLGGTTLEVLQ >NC_000907|1558773:1597183|1572523_1574050_+|WP_005693520.1|DBSCAN-SWA MQTLPDLIPFDPNALLLGYQKRWVADTSQLKIAEKSRRTGLTWAEAADDVMIASLAKSEGGSDVFYIGSNKEMAREFIDACAMWAAQFNRAAGQIQEELFNDEDKDILTYVIYFASGFKIKALSSNPKNLRGMQGVVCIDEAAFHEKLAEVLKAALALTMWGAKVRLISTHNGVDNLFNQLIQDSRAGRKSYSVHTITLDDACAEGLYQRICQVSKQLWTPEKEAAWKAGLLRETATEDDALEEYYCVPKASSGAYIPRPMIERAATEGKAKLRFECDAKFMEWTEDERTVITSEFCLTQLLPHLQALNPDRRHAFGVDFARSADLSVYAVCAVQPDTARHFDLTLEIKNCPYNQQKQIMLFMLANLPRLIGAAFDATGNGGYLAEAALIRYGSSMVEAVQLNEKWYREWMPKYKALYESGYIQIPKDEEIILDHGHIQVINGVPKIDKSRSKDKSGKRHGDSAVAYCMAVRASYMTGGEIDFIPLPDKHSDRSENDEFDDFISNWDW >NC_000907|1558773:1597183|1566832_1567393_+|WP_005693506.1|DBSCAN-SWA MNAIQFRYFKGVMTKEPLKTIIDTWYKLRAERDKKLTNIFNTIPFYESWLGDETSIFGIVCSYDNPARDEAVLTKGYRTEDYKGKCVVKPDRRYKVGKDFDKKLQAIRQILKEAPDFSSYSLKELGMYLLVGNFSRLYFSVSGVQDDIYIAKIPVKEQGNFGDDFLEIHECLTEIKESEFLSIQGL >NC_000907|1558773:1597183|1563536_1564007_-|WP_005693497.1|DBSCAN-SWA MSETDLLLKMVRQPVKLYSVATLFHEFSEVITKLEHSVQKEPTSLLSEENWHKQFLKFAQALPAHGSASWLNLDDALQAVVGNSRSAFLHQLIAKLKSRHLQVLELNKIGSEPLDLSNLPAPFYVLLPESFAARITLLVQDKALPYVRVSFEYWHA >NC_000907|1558773:1597183|1583717_1585613_+|WP_010869233.1|DBSCAN-SWA MMANNSTSFFVNLAGNVSQQAARFSNSIANMANKNVSSLNKVSRAISAVSKGFNGLGNITIPIIGVGAAAGATMVGKSMLRTAADFEMAKIRMKQTFGEQGEAADAWLKKFATDTPMAFADTQDAMMRLKTAGIDPMNGSLQALVDYNAKVGGDKANLDGYISAISKGFIKGKLSMEEINPLLERNVKVFEILAKETGGKYTADQMQKMLQEGKLGRKAIHALLRGMGRDAQGAAKEQMKTWDGLVSNLEDTWTSMQARFMEHGAFDALKKELGDFVEWLNEKIDDGTLDDFPKTVSDTLIEALKNLKEMAKDVKPVLESIGSVMSWVSEKAGGYGNLAKFMGALYLGNKVLRNDKVQTLGGWGWSGAKWGYNKIFNRKKGGAGGLADGVAGALGATVGVTPVYVTNFPMGFGGGGGGGYGYDVIEDGRDKDKKTQKKNKPPRPKRGRGSVRSPVAAVAASAAAVPKVAAPVTTASSGVARSVGNGVKSLGRGASKAVPYLGTGLAVAEGVTVLMDDTTNTKEKSEAIGSIAGATAGAIVGQALIPIPVVGAAVGSYLGGWLGEWLGSEVGEYLSDPEPIKNELNGTINIAVKASDQLIATATQAKIQTNQQRDSLETAVQMGTLGMGGMW >NC_000907|1558773:1597183|1590333_1590900_+|WP_165442165.1|DBSCAN-SWA MKLLPVGLAWKRALDSNLAKVLAVRCDQLVEVNSKAHTLIKERMPGQATLLLEEWEGFYGLPECGRQIVGKTLVQRQKQVQEKENEVGSNSKRFLEEIATQAGFKVRVVNHYPHHCLRDCTYPLYEQANHWRIFMYTPAVSSIRYATCLDDVVKNLTIFERNKELECLLKRYQYAHLEFVFIYEEETQ >NC_000907|1558773:1597183|1570447_1570708_+|WP_005693512.1|DBSCAN-SWA MGFSELFTNADGRLSTTASIQFWGFVAATGVLLYSVYLDKPYVPEMFSTFLFACVGTAATKGVANALSQRREQGKEQGREQGREQE >NC_000907|1558773:1597183|1566435_1566657_+|WP_005693504.1|DBSCAN-SWA MKTKRPHAKSVENFNRYRFYAEKAAKEEQAGNYEEAETHWDLAMLSASPENKEWAIRRRDFCQRMHQRPFEGE >NC_000907|1558773:1597183|1588276_1588825_+|WP_005693539.1|plate|DBSCAN-SWA MQAINRIIAPLKRGLQLLVSRAVVSVVNDAYARQNLQLRLQSEEVADDVERFQNYGHYSVPKAGEAIVVSVGGKRSHLVAVVVDDKSVRPAGLIAGDSVLYHLEGHQLRLTENGEAILSCKKFTIETDTLDCSAQQITFDSPQTTFTGNVDIMGISTATDHQSSGISGKNHDHEERVGKPVP >NC_000907|1558773:1597183|1569308_1569815_+|WP_005693510.1|DBSCAN-SWA MKLLKALAVLSLATISSHSFAVDGFQNVKFGASKTEVRNAYQKCQWQKDEYDLFCPNFTLGAIKDTGAYFYFIDDKFERIAINIPNVNIDGIGQALSEKYTLSSQPTQRELANPKPNNVYDFGFDKDTILIRYTYDNDMTEEIFLIYTTPDFNNKLQTKDAQSVKDQL >NC_000907|1558773:1597183|1581220_1581412_+|WP_005693531.1|DBSCAN-SWA MPTFKIKPKTGLLIRDPETFELLSESGEDKPKISYWLNHLKNGDVELVTETTTKAKNSNKEQA >NC_000907|1558773:1597183|1565296_1565806_+|WP_005693500.1|DBSCAN-SWA MATKVKSQAKLRFVSVEQVQSAIKEIGDLSREHTRLATEMNDKIGATSEHYAPKLKALKEEIEPLQKAVQEYCEANRDELTEFGKTKTANFVTGEVQWRQRPPSVAIRGAEAVMEFLQRMGFDRFIRTRQEINKEALLNEPEVAKGIAGVTIKQGLEDFVIKPFEQDAR >NC_000907|1558773:1597183|1564040_1564904_+|WP_010869222.1|DBSCAN-SWA MTLINKLKQHLSDSQITQAQLAREAGVNAGALSAYLNDNYKGNIADVEAKLAAYLEKKAVQAREFVEAPAFIETATSRQIFKTLEFAQIANCLATVYGMSGVGKTKAIQEFAKSHANVWLVTASPSRSSLSEILYEIALELGISDAPRRKGTLSRLIARKIKGTEGLLIVDEADHLPYEALEELRIMQEEAGIGLVLVGNDKVYTRMKGGISPSHEYARLWSRVAKNTSIQKTKKADTQAVAQAWGLETDEEALKVMQSITETGGGLRILTQTYACRNGSKRIWQVD >NC_000907|1558773:1597183|1565802_1565964_+|WP_005693501.1|DBSCAN-SWA MMDDLQDVSRLREAYQFYQKAKQDEDSIVCGCLNDAYEWLFSELKALFDEEEE >NC_000907|1558773:1597183|1561211_1563275_+|WP_010869221.1|transposase|DBSCAN-SWA MDNQSLKTHYSVYELANLKLKTLPSAPKNIWEQAKRENWKSQKRQGRGGGLEYELASLPIEVQNELLLKTTPEQTAVALQKIEETRPLASNEVWQLWDEASAKAQEQAKIKLGTMFAVANLVESGVNVLDAFRLVCGKENAERLKNNEKLLSVGSLKNWWYRVKDAPRQDWLPLMLNNSGKSSKNVAEIDEAAWQFFKNFYYSREKPSLAHSYEVLKQAAQYNGWRIPSRSSLKRKMERDVPKTEEVFRREGQYALSRLYPSQVRTVAMLQAMEWINGDGYQHNVWVRFPDGEIKRPKTWLWQDVRTRKVLAARTDKSENTDTIRLSLLDVISRYGLPKHLTIDNTRAAANKKMTGGVKNRYRYQVNENEVQGIIPALGIELHWTSIQFGKGRGQAKPIERAFSHGGLGDYVDKHLLLRGAYAGANAYEKPDYDGKNGAEQPVDYATFLMALEQGIQQWNNVGNRLTEICAGKSSYAEAFERDWAVAEKRPISQSQMRLLLTLHEEVRLNQDGTFYLNAGKIGTNKNRYESLALIGTSHKRVVVRYDPANLHDKVWVYAXTGEYLAEAEITEKAGFGDQMAGREHNKAMRNWVKHTEKAAKERAKAEEMELSNYAPAVEFEERFLEMLPEPVKAPQTQAEEVEYEEVLDFNTVRKVPKAVEVEAEEISEFNRDWEKGLELLKKSKGR >NC_000907|1558773:1597183|1575714_1576959_+|WP_010869230.1|capsid|DBSCAN-SWA MNITWNWYEQLESAHARAFTVAKATKAEVLDTIRWATEQAIANGTGEREYIKKLEPMLKELGWWGKAKDENGNEVQLGSPRRLRTILRTNKITAYHAARYAQQMENVDEQPYWRYVAVNDSRTRASHLALHGKIYRADDPIWQTMYPPNDWGCRCRVEALSEYAVQSRGLKISSSDGEMEMEEAVVGIDKDTGEEIRTTVSKIKTDQGEMKVGAGWNYNVGSAAFGTDVAVLRKLQQVKNRELRQQTIQAINNSEARHKAFADWVLANLGKRGASARYMSAGLVTTEIAEAVTEITQGGKNAELVLVMSEKRLAHANSDKHHEGGVGLTAEEYASISRIVANPSLVLWDTLEGHNNLIYINQERTIQVIVDVPNKHSIKPKEKVDAIINAYKVDMNNVKRQLSGGNYVLLKGKL >NC_000907|1558773:1597183|1588833_1589241_+|WP_005693540.1|DBSCAN-SWA MSDLALTWHNGEGDLVLGTESLLLDDSLTNAIIISLFTDLRVEGERGWWGDSYNDGFQTGSKLWTLSRAKQLPEILDDAQLYASQALQWLVDDGVAKSVQVIASNPQMSVLLLEILVVLPDGSTEQRTFRANWSL |
47 | Shigella_phage(29.41%) | tail,head,capsid,transposase,plate | NA |
Homologous phage analysis in the prophage regionThe bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')
|
Acr ID | Acr position | Acr size | Homology with known anti | Neighbor HTH/AcRanker | Neighbor Aca | In prophage | Protospacer in prophage |
---|