CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NC_010001	Lachnoclostridium phytofermentans ISDg, complete sequence	7 crisprs	csa3,DEDDh,cas3HD,DinG,WYL,c2c9_V-U4,cas3	0	0	4	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_010001_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010001_1

288524-288631

Orphan

Consensus_repeat	Method
AACTTATGATTACCGGAACATGTTTT	CRISPRCasFinder

1 spacers

DinG

The CRISPR arrays of NC_010001_1

>merge|NC_010001|1|288524-288631|CRISPRCasFinder
AACTTATGATTACCGGAACATGTTTTGGGTTCCGATAATAGAACTTATGATTGCCGGAACACGTTTTTGGTTCCGATAATAAAACTTATGATTATCGGAACATGTTTT

>NC_010001|1|1|288524-288631|CRISPRCasFinder
AACTTATGATTACCGGAACATGTTTT	GGGTTCCGATAATAGAACTTATGATTGCCGGAACACGTTTTTGGTTCCGATAATAA
AACTTATGATTATCGGAACATGTTTT

Protein	Signature genes	Signature genes Name	Protein_function
NC_010001.1\|WP_012198260.1\|285207_285843_+\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_081428460.1\|292017_292533_+\|30S-ribosomal-protein-S7	unknown	unknown	gnl\|CDD\|235398
NC_010001.1\|WP_012198253.1\|275695_276031_-\|DUF1292-domain-containing-protein	unknown	unknown	gnl\|CDD\|377740
NC_010001.1\|WP_012198259.1\|284606_285221_+\|RNA-polymerase-sigma-factor	unknown	unknown	gnl\|CDD\|224511
NC_010001.1\|WP_012198264.1\|289501_290617_-\|RNA-polymerase-sigma-factor-RpoD	unknown	unknown	gnl\|CDD\|236413
NC_010001.1\|WP_012198267.1\|292843_294961_+\|elongation-factor-G	unknown	unknown	gnl\|CDD\|234569
NC_010001.1\|WP_012198254.1\|276344_278903_+\|ATP-dependent-DNA-helicase	DinG	COG1199_DinG_CAS-IV-A	gnl\|CDD\|224120
NC_010001.1\|WP_012198269.1\|296630_297458_+\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012198270.1\|297865_299836_+\|EAL-domain-containing-protein	unknown	unknown	gnl\|CDD\|238923
NC_010001.1\|WP_041703052.1\|299815_300406_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012198265.1\|291401_291824_+\|30S-ribosomal-protein-S12	unknown	unknown	gnl\|CDD\|235355
NC_010001.1\|WP_012198272.1\|300817_301807_+\|MreB/Mrl-family-cell-shape-determining-protein	unknown	unknown	gnl\|CDD\|237563
NC_010001.1\|WP_012198263.1\|288695_289409_-\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	unknown	unknown	gnl\|CDD\|153251
NC_010001.1\|WP_012198268.1\|295199_296393_+\|elongation-factor-Tu	unknown	unknown	gnl\|CDD\|234596
NC_010001.1\|WP_012198255.1\|279074_279992_-\|diacylglycerol-kinase-family-lipid-kinase	unknown	unknown	gnl\|CDD\|224513
NC_010001.1\|WP_012198258.1\|283703_284357_+\|DUF4358-domain-containing-protein	unknown	unknown	gnl\|CDD\|379531
NC_010001.1\|WP_012198261.1\|285890_287309_+\|MBOAT-family-protein	unknown	unknown	gnl\|CDD\|224610
NC_010001.1\|WP_012198262.1\|287320_288520_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|379541
NC_010001.1\|WP_012198257.1\|282191_283226_-\|sugar-kinase	unknown	unknown	gnl\|CDD\|238571
NC_010001.1\|WP_012198256.1\|280344_282126_+\|DUF885-domain-containing-protein	unknown	unknown	gnl\|CDD\|377577

Protein	Function_ID	Function_description	E-value
NC_010001.1\|WP_081428460.1\|292017_292533_+\|30S-ribosomal-protein-S7	gnl\|CDD\|235398	PRK05302, PRK05302, 30S ribosomal protein S7; Validated.	6.23806e-107
NC_010001.1\|WP_012198253.1\|275695_276031_-\|DUF1292-domain-containing-protein	gnl\|CDD\|377740	pfam06949, DUF1292, Protein of unknown function (DUF1292). This family consists of several hypothetical bacterial proteins of around 90 residues in length. The function of this family is unknown.	4.49479e-07
NC_010001.1\|WP_012198259.1\|284606_285221_+\|RNA-polymerase-sigma-factor	gnl\|CDD\|224511	COG1595, RpoE, DNA-directed RNA polymerase specialized sigma subunit, sigma24 homolog [Transcription].	1.14936e-35
NC_010001.1\|WP_012198264.1\|289501_290617_-\|RNA-polymerase-sigma-factor-RpoD	gnl\|CDD\|236413	PRK09210, PRK09210, RNA polymerase sigma factor RpoD; Validated.	0
NC_010001.1\|WP_012198267.1\|292843_294961_+\|elongation-factor-G	gnl\|CDD\|234569	PRK00007, PRK00007, elongation factor G; Reviewed.	0
NC_010001.1\|WP_012198254.1\|276344_278903_+\|ATP-dependent-DNA-helicase	gnl\|CDD\|224120	COG1199, DinG, Rad3-related DNA helicases [Transcription / DNA replication, recombination, and repair].	1.18331e-64
NC_010001.1\|WP_012198270.1\|297865_299836_+\|EAL-domain-containing-protein	gnl\|CDD\|238923	cd01948, EAL, EAL domain. This domain is found in diverse bacterial signaling proteins. It is called EAL after its conserved residues and is also known as domain of unknown function 2 (DUF2). The EAL domain has been shown to stimulate degradation of a second messenger, cyclic di-GMP, and is a good candidate for a diguanylate phosphodiesterase function. Together with the GGDEF domain, EAL might be involved in regulating cell surface adhesiveness in bacteria.	2.49733e-86
NC_010001.1\|WP_012198265.1\|291401_291824_+\|30S-ribosomal-protein-S12	gnl\|CDD\|235355	PRK05163, rpsL, 30S ribosomal protein S12; Validated.	7.58727e-82
NC_010001.1\|WP_012198272.1\|300817_301807_+\|MreB/Mrl-family-cell-shape-determining-protein	gnl\|CDD\|237563	PRK13928, PRK13928, rod shape-determining protein Mbl; Provisional.	0
NC_010001.1\|WP_012198256.1\|280344_282126_+\|DUF885-domain-containing-protein	gnl\|CDD\|377577	pfam05960, DUF885, Bacterial protein of unknown function (DUF885). This family consists of several hypothetical bacterial proteins several of which are putative membrane proteins.	2.23124e-70
NC_010001.1\|WP_012198268.1\|295199_296393_+\|elongation-factor-Tu	gnl\|CDD\|234596	PRK00049, PRK00049, elongation factor Tu; Reviewed.	0
NC_010001.1\|WP_012198255.1\|279074_279992_-\|diacylglycerol-kinase-family-lipid-kinase	gnl\|CDD\|224513	COG1597, LCB5, Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase [Lipid metabolism / General function prediction only].	1.0654e-57
NC_010001.1\|WP_012198258.1\|283703_284357_+\|DUF4358-domain-containing-protein	gnl\|CDD\|379531	pfam14270, DUF4358, Domain of unknown function (DUF4358). This domain family is found in bacteria, and is approximately 110 amino acids in length.	1.88903e-17
NC_010001.1\|WP_012198261.1\|285890_287309_+\|MBOAT-family-protein	gnl\|CDD\|224610	COG1696, DltB, Predicted membrane protein involved in D-alanine export [Cell envelope biogenesis, outer membrane].	1.92812e-79
NC_010001.1\|WP_012198262.1\|287320_288520_+\|hypothetical-protein	gnl\|CDD\|379541	pfam14286, DHHW, DHHW protein. This family of proteins is found in bacteria. Proteins in this family are typically between 366 and 404 amino acids in length. There is a conserved DHHW motif. There is some distant homology to the Lipase_GDSL_2 family.	6.40069e-34
NC_010001.1\|WP_012198257.1\|282191_283226_-\|sugar-kinase	gnl\|CDD\|238571	cd01166, KdgK, 2-keto-3-deoxygluconate kinase (KdgK) phosphorylates 2-keto-3-deoxygluconate (KDG) to form 2-keto-3-deoxy-6-phosphogluconate (KDGP). KDG is the common intermediate product, that allows organisms to channel D-glucuronate and/or D-galacturinate into the glycolysis and therefore use polymers, like pectin and xylan as carbon sources.	8.87716e-84
NC_010001.1\|WP_012198263.1\|288695_289409_-\|1-acyl-sn-glycerol-3-phosphate-acyltransferase	gnl\|CDD\|153251	cd07989, LPLAT_AGPAT-like, Lysophospholipid Acyltransferases (LPLATs) of Glycerophospholipid Biosynthesis: AGPAT-like. Lysophospholipid acyltransferase (LPLAT) superfamily member: acyltransferases of de novo and remodeling pathways of glycerophospholipid biosynthesis which catalyze the incorporation of an acyl group from either acylCoAs or acyl-acyl carrier proteins (acylACPs) into acceptors such as glycerol 3-phosphate, dihydroxyacetone phosphate or lyso-phosphatidic acid. Included in this subgroup are such LPLATs as 1-acyl-sn-glycerol-3-phosphate acyltransferase (AGPAT, PlsC), Tafazzin (product of Barth syndrome gene), and similar proteins.	2.64913e-43

>NC_010001.1|WP_012198262.1|287320_288520_+|hypothetical-protein
MSEVNKNLEAIPNPPTVKKGKGKGQRAKYSNVIIFLVLIYVLTIASMVKPVKGYSESENRVLEGRPKFSLESLFNGTFISKYETFVTDQFVSRDAWIGIKTRTELAMLKKDINGVYIGKDGYLIEKVDNSDLEMEQVNRNEKRLYAFINKYKEQLGDEHVFAMIAPTAFEILKDKLPPYASGFDQGAFLDRLDEALANQFIDLRETLTEHKKDYIFYRTDHHWTTLGAYYAYVEWANKIGETPMSQDEFEIKKISNDFLGTIYSKINLKLSSDDMYLYDSGKNYTVEYNMDGVKKNSLYEMSHLDTKDKYSVYLGGNNPVVKIDSDNHNGKKLLIIKDSYAHSFAPFAANHFETTYMVDLRYFNMPMSRFIEENGITDVLVLYNVNTYVKEKSLDNMVR
>NC_010001.1|WP_012198261.1|285890_287309_+|MBOAT-family-protein
MVFSSLPFLFRYLPIVLILYFIAPRKYRNAVLFFTSLVFYAWGEPIYVLLMLFSTLVDYTHGMLVHHFKQKGEITKAKIALSSAMIINISLLGFFKYSDFAISNINALTGSDIGLLKLVLPIGISFYTFQTMSYTIDIYRGEAEVQKNIISFGAYVVLFPQLIAGPIVQYKTIAKQLQERREDFDQFSYGVLRFMSGLGKKVLLANNIGILWDRISVTPNGELTVVTAWLGITAFAFQIYFDFSGYSDMAIGLGNMLGFQFLENFNYPYMSKSITEFWRRWHISLGTWFRDYVYIPLGGNRCGLGKQIRNIAIVWFLTGFWHGASWNFIMWGVYFGVILILEKFVLLKFLNKLPSFLSHIYAIVLVWIGWAIFAFDDFSKGINYIKAMFGVNTIGFINDNARYLLMNYAIILIVLILGSTDLPKRVANRLVGEHSEKKTTAVVQGLFIVGVFVISVAYLVDASYNPFLYFRF
>NC_010001.1|WP_012198260.1|285207_285843_+|hypothetical-protein
MKTNREFIEGIYKKAELLRQQKENSKSESWHLRFLRFNREKKRVPAFAASLATFALFALVIITGSQAGKSPNIDNIENKHLRTVEGQNPIANVSAYGIDEDVSNENINTVLGVITEVVDIQNQKYINIQVSKLLCGEGTPDYITITEGLPLTITTESLKEMNVIVSVKPILGQEEYALIDENSIYFYAKEENNQNYYQAIDGTIVSEDSFK
>NC_010001.1|WP_012198259.1|284606_285221_+|RNA-polymerase-sigma-factor
MNNADNFSSVGKDISSKEGVQSEQDKIIYQNFLDGDMEAFEELVIKHKDRLIYFIQRLVNNLTIAEDLAQDAFVEVLVHKERYHFQVSFKTYLFTIGRNKAIDYIRKNKRMMLVEDYPESYDEENRMEENIIRKEESKLLYDAMKKLKPDYKAAISLIDLEQMSYAEAAKVLKKSDAQMKVLIYRARKSLAKLMEKEGYSYENK
>NC_010001.1|WP_012198258.1|283703_284357_+|DUF4358-domain-containing-protein
MRNKKLMALSLVAVLAFTACGKKETNEPTPTPTVAPTETPAATETPTETPAEPGTDGSGEELGATELTSNETLDKIHEEVKAAYGDNYLPNMPFTVENLDEMFGIKADWYDAAIAEGPMMSAHVDKLIGIHVTEGNLENVQNALNEYQKKIATDIQYPMNLPKVQASVVETAGDYVFFVMLGTIDEMKYTEDSDMIKAFGEQNQIAVDIIKKNIEAK
>NC_010001.1|WP_012198257.1|282191_283226_-|sugar-kinase
MLTVNENREFDALALGEILLRLSAPSNERIVRGDTFEKCAGGAELNVVSGISMMGLRTGIISKVPQNDIGTYVKNHLRFCGVSDDCLIFDESRDARLGIYFYENGAYPRKSSVVYDRRNSSINTISMDDIPESTFSSTKLFHTCGITLALSPQTRDVTEECIKKFKEQGALISFDVNYRANLWDEATAKEYIERILPYVDILFVSEETSRRTFGKTGTIKEIMKSYTEDFNIKIVATTERIVISPKKHTFGSTIYNAVEDKFYEEAPYQNIEVIDRIGSGDAYVSGVLYGLLAYDDCQKALEIGNAASAVKNTIPGDLPSTDLKEIQKIISSHQNIGPQSEMNR
>NC_010001.1|WP_012198256.1|280344_282126_+|DUF885-domain-containing-protein
MKDLKKRGKQGLVTIALSLSILVTGCANKEKPKDLTFEDYSNQMFQEIVSSSAITYSQFIEDPENFGITEYDHVLATLSKKEYDKSIKQCEEDLAQLLKFDYDTLTTAQKIDYDITKGMLERSIASKDSYYYSEPLSPLDGDHITLSGIVSLYGNRYFQTLVEKEKGNKKEVEKFFEIYEMIGKYFNEVAQYEKEKAKAGLFMNSSRAEVVRKACLSVVNNNASDYKKTFQEEVTKLSFLSDSEKKELIEQSDSLVEKHIVPAYQKLVDTMNDLKDQGGKSKGFYETEAGKIYYENLLKSTCSVNATPEELMKLLEENLAVFVNEKDQILADHPNIENEIVISARQWPDAESITKMLSNKAKEDFPDADLAWGVKEMPTCMNSFAGGLFYPFAIDSTLKEEYIYLGTMNAPGTLSFLQVLAHEGVPGHLFHYNYLNDIGTTDYRKVLAWAGTGLVGYLEGWTTYVEEIGYSYGGLSDVQAREAQLNRLIEITLVTMVDIGVNYYGWENDKISEVISQYAPQYLIMSTYIKSIVEESPGLYSSYAVGYLYTKHIIDAINEKSGGTMSKKEVHEKYLSVGPVTYDILMRELGVAQ
>NC_010001.1|WP_012198255.1|279074_279992_-|diacylglycerol-kinase-family-lipid-kinase
MYHFIINPHSKTGKAKELWQGLRQRLENESINYKEYFTTGHGHATQIAKEICTIDNERKTIVIVGGDGTANEVINGIDNYEDVLLGYIPMGSSNDLARGLLLPKNPAEALDRVLNPRKIRAVDHGQVTFEDGLPRRFSVSSGIGYDAAICQVAQTTKIKNFLNKIGIGKLTYFLIGVKEIFANKPCDATVIADGITYSVKNLIFMASLIHKCEGGGLLMAPDASDNDRKLSICLVSNIPKLKILFVMPTIFLGKHTKIKGVQMITCSSVSIHTQSPLYVHTDGEVLGEHTDLTLRCTSEQVNIIT
>NC_010001.1|WP_012198254.1|276344_278903_+|ATP-dependent-DNA-helicase
MPDTDLKSIKISVRNLVEFIMKSGDLDNSVGKRDPDAMQEGSRLHRKIQRRMGPEYKPEVALRVTVPVSREDIEFELIIEGRADGIITNIEPTKEDNPILEEKPTLEEKPTLEEKPILEGKPILEGNPILEENPTLGEHHPSEEHPSKQNGAEGNIHVIIDEIKCVYADISQITEMIPVHRAQALCYAYIYAKERVLDTISIQITYCHLETEAIRILSEELKFKELSNWFQNLIQEYCKWAAWQIKWMESRNESIKQIEFPFEYRPGQRDLVTGVYRTIIRDKKLYIEAPTGVGKTISTVFPTVKAMGEGFVSKIFYLTAKTITRTVAEDTYQLLLERGLSMKLVTITAKDKICILDKPNCNPAACERAKGHYDRVNDAVFDLLTSESRISRELIEQYAMKHCVCPFEMCLDVTLWADGIICDYNYAFDPNVYLRRFFENDKKQDYVFLIDEAHNLVDRAREMYSAMLYKQDFLTVKGIVKDKSKTMVKRLEACNEVMLRLKRGCDDIEVLQDVNDLVLPLLRLMSEYEEFFKEYGDFEGREVVSQLFFDLRKFLAIHDILGEDYLIYSDYDERGEFRVKLLCMDPARNLLTCLNKGRSSIFFSATLLPITYYKEQLGGSEEDYAIYAPSPFEVSKRLLMIAKDVSTKYTRRGQDEYERIVSYIEGFVNAKVGNYFVFFPSYQMLQQIAQLSEDRIPNLLLQKTSMGELEKEEFLAAFEENPTNTKVGYCVMGGIFSEGIDLKKDRLIGAVIVGTGLPQVGNERELFRGYYDDRNGSGFDHAYLYPGINKVLQSAGRVIRTVEDKGAILLLDERFLNSQYKNLFPREWEQYDIVNQEKMQELLEDFWSQKNE
>NC_010001.1|WP_012198253.1|275695_276031_-|DUF1292-domain-containing-protein
MDKHGDDCNCSSDEFFHDQVTLTLEDDTEVVCDIIAVFPCGEKQYIALLPEDAGEEGEVFLYEFIQNGDEIELESIEDDAEFEAVSEAFDEFIDSEEFDEMFGDEEAEDEE
>NC_010001.1|WP_012198263.1|288695_289409_-|1-acyl-sn-glycerol-3-phosphate-acyltransferase
MKRILLMLLRSFFNLPIWFFQLKRLCNIEKHDRFERYAWLHKNAPVANRRGRVTIDCHGLENLPKEDGYILFPNHQGLFDALAFLETHERPFVTVMKKEVKDIFFLRDVIKLLQAEIIDREDIRQSMTVIKNMTTRVKGGENFVIFAEGTRSKNGNQIGEFKGGSFKSAMNARCPIVPVALIDAFKAFDTNSIKKITVQIHYLKPLYYDDYKGMKSTEIAELVENMIKETIAKFAQE
>NC_010001.1|WP_012198264.1|289501_290617_-|RNA-polymerase-sigma-factor-RpoD
MEEQVNTFEARLKELIAFANDNKGVIEVDKVNDFFKELNLNVRQIDKIYEYLEANNIVVLNPTDEDEPNEDALLELEDDSDMIGDTEDLSAMTSTISDDPVKQYLKEIGSYPLLSVAEEIELAKKIEAGDNMAKQILAESNLRLVVSIAKRYVGRGLSFLDLIQEGNLGLIKAVDKFDYNKGYKFSTYATWWIRQAITRSIADQSRTIRIPVHMSEVINKTYRVSRNLLQELGREPSEQELADAMNLPIEKVREILKVSADPISLDTPIGEEDDSHLGDFIKDDTIMGPEDAASYAVLQDQISKLLDTLTEREQRVLILRFGLQDGRSRTLEEVGKEFNVTRERIRQIEAKALRKLRHPSRARMLKGYELN
>NC_010001.1|WP_012198265.1|291401_291824_+|30S-ribosomal-protein-S12
MPTFNQLVRKGRKTMEKNSQAPALQKGFNSLRKKTTDASAPQKRGVCTAVRTATPKKPNSALRKIARVRLSNGIEVTSYIPGEGHNLQEHSVVLIRGGRVKDLPGTRYHIVRGTLDTAGVAKRRQARSKYGAKRPKEAKK
>NC_010001.1|WP_081428460.1|292017_292533_+|30S-ribosomal-protein-S7
MNDCYLTVDIKEGSNVPRKGHIQKRDVLADPIYNNKTVTKLINNIMLDGKKGTAQKIVYGAFEKVAEKSGKDATEVFEEAMNNVMPVLEVKARRIGGATYQVPIEVRPDRRQALGLRWLTMFSRKRGEKTMVDRLAGEILDAAANTGSAVKRKEDMHKMADANKAFAHYRW
>NC_010001.1|WP_012198267.1|292843_294961_+|elongation-factor-G
MAGREYPLERTRNIGIMAHIDAGKTTLSERILYYTGVNYKIGDTHEGTATMDWMEQEQERGITITSAATTCHWTLELEHKKAPGALEHRINLIDTPGHVDFTVEVERSLRVLDSAVGVFCAKGGVEPQSETVWRQADKYNVPRMAFVNKMDISGANFFNVVDMIKSRLGKNAVPIQLPIGKEDTFKGVIDLFEMKAYYYLDDKGEQIEIKEIPDDMKDQAEEYRAAMIESICETDDDLIEAFLEGNEPSNEELKKALRNATISVQIIPVLCGSAYRNKGVQKLLDAVIEFMPAPTDIEDIKGFDEEGNEIHRISSDEEPFAALAFKIMADPFVGKLAFFRVYSGTLNAGSYVLNATKNKKERVGRILQMHANKREDLDKVYSGDIAAAVGFKFTSTGDTICDEKHPVVLEAMEFPEPVIDVAIEPKTKAGQDKMGEALAKLAEEDPTFRVRTNEETGQTIIAGMGELHLEIIVDRLLREFKVEANVGAPQVAYKEGFTKEVDIDSKYAKQSGGRGQYGHCKVKFSPMDVNGEKVFEFVSTVVGGAIPKEYIPAVQAGIEDAMKCGVLGGYPVLGVRANCYDGSYHEVDSNEMAFKIAGSMAFKDAMHKAGPILLEPIMRVEVTVPDDYMGDVIGDISSRRGRIEGTEDNNGSKIIRGFVPLSEMFGYSTTLRSKTQGRGAYSMFFSTYEPVPKNVQEKVLSNKTK
>NC_010001.1|WP_012198268.1|295199_296393_+|elongation-factor-Tu
MGKAKFERNKPHCNIGTIGHVDHGKTTLTAAITKTLHDRLGTGEAVAFDKIDKAPEERERGITISTSHVEYESKARHYAHVDCPGHADYVKNMITGAAQMDGAILVVAATDGVMAQTKEHILLSRQVGVPYIVVFMNKCDMVDDPELLELVEMEIRELLSEYEFPGDDTPIIQGSALRALEDPNSQWGDKILELFDAVDTWIPDPQRATDKPFLMPIEDVFSITGRGTVATGRVERGVLHVSEEVEIVGVKEETRKVVVTGIEMFRKLLDEAQAGDNIGALLRGVQRTDIERGQVLCKPGTIKCYKKFTAQVYVLTKDEGGRHTPFFNNYRPQFYFRTTDVTGVCNLPEGVEMCMPGDNIEMNIELIHPIAMEQGLGFAIREGGRTVGSGKVATIIG
>NC_010001.1|WP_012198269.1|296630_297458_+|hypothetical-protein
MNMQNKTVFHRKFGKGIIVDLNQNKLSVQFDAGKKIFVYPDAFRQFLVLMEKDGKSYVDGMLKELDRKEEISNRIARKMERHNQLIDKLKLHPSSQIVIRFVENDKATFLEDKIINTGLIQTGKTKGSPVRPSRLHQNSACILTERNEEEDESSRTIFGIAMVEEDFLGTDCKDGKVTLHSQYVLLLPDHLQKLKFWNYYTDERYPEKLVWKSGEFRYCSNLISAQILKDIMSLPLENDAAALAEEFYHYFCEINQIEESTLPLPLGKLLEEGIK
>NC_010001.1|WP_012198270.1|297865_299836_+|EAL-domain-containing-protein
MILGGLSSRRGYYDEHNTRNKRKIRFFVIMGIGILSIVAFLLSLKGMLHSEAEKKLLEYTGLSADYIKKSEAGKQFMEEKWGSGIFTIIPGAKNPTYFQGNAHSYVVTIKGEAIGAFSESGKDALSIYGNNVIDSIETWEDTKVYQEIIDKKGLVILTKLANGEKYYIAFTSPSWLENGYIISIVSYQEIIQEIQSVLKMAIVIVLFSLLAIILAFFYSILHRNRIKKRRMDMGAVDKITGLPNPLLHKKKVKEKLTKGNESYAYVTFCIDNFELIYELSGKQYCEKLLKQIASKIQIMLVDGELFTRYQNDEFGMLLEYHGELNLRKRLVEMFKYAGDLPQEDNNFCSITFQCGVCEMKKNMDVKDLIQYARQVRNNEVNGYTPNIEFYNKKEEKGEQPKIEEITNALSHNEFLVYLQPILQLDTKRIAGAEALVRWNHKMDGILPPNVFLPMLEEDGSIVKLDMYVLEEVCEYLRDWMDKGKRAVPISVNLSGKHLERPEFITELVEIVDYYQIPHELLEFEFSEVNLYGAMDMMKNAIQKLRELGFLIAIDQFGAGFSSLQLLKELPIHVLKIDKKLIMNLEDSEFSNQEKTIVMHILSFAKARNLTVIAEGVETKEQQDLLIDQQCDMMQGFYYQKPMPSEEFERLLDASGA
>NC_010001.1|WP_041703052.1|299815_300406_-|hypothetical-protein
MNTTKMERKKITHEIHLVSNYRALLIAKHIGTLLLILYFAPAAITGFDESPALYILLLHNILPAVFFFLFTNKNNSNTKSPRILKPSAYDEVKEEPKKKHTLSFSFAKEMEADTPLLPQLKKKYQYSRVKYQSNSISFLLTCFFLYLWQQQDLTQTNFYLYRYMPVAILAVIVLTRFICIIFYECYIHYSLRSGGI
>NC_010001.1|WP_012198272.1|300817_301807_+|MreB/Mrl-family-cell-shape-determining-protein
MLGCDIGIDLGTASVLVYIKGKGVVLKEPSVVAFDRDTNKIKAIGEEARLMLGRTPGNIVAVRPLRQGVISDYTVTEKMLKYFIQKAVGKQRFRKPIISVCVPSGVTEVEKKAVEDATYQAGARDVAIIEEPIAAAIGAGIDISRPCGNMIVDIGGGTTDIAVISLGGTVVSTSIKIAGDDFDEAIVRYMRKKHNLLIGERTAEDIKIKIGSAYRRPEVVAMDVRGRNLVTGLPKTISVTSEETEEALKETTSQIVEAVHSVLEKTPPELAADIADRGIVLTGGGCLLYGLEELIEEKTGITTMTAEDPMTAVAIGTGKYVEFLSGKKD

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010001_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010001_2

1152785-1152926

Orphan

Consensus_repeat	Method
TAAACTTCTGATAAAAGGTGCGCACTTTGCACCGTCAATCCGATTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010001_2

>merge|NC_010001|2|1152785-1152926|CRISPRCasFinder
TAAACTTCTGATAAAAGGTGCGCACTTTGCACCGTCAATCCGATTATTGGAACATGTTTTTGTTCCGATAATATAACTTATCAGAAGTTTGCTTTTTAAACTTCTGATAAAAGGTGCGCACTTTGCACCGCCAATCCGATTA

>NC_010001|2|2|1152785-1152926|CRISPRCasFinder
TAAACTTCTGATAAAAGGTGCGCACTTTGCACCGTCAATCCGATTA	TTGGAACATGTTTTTGTTCCGATAATATAACTTATCAGAAGTTTGCTTTT
TAAACTTCTGATAAAAGGTGCGCACTTTGCACCGCCAATCCGATTA

Protein	Signature genes	Signature genes Name	Protein_function
NC_010001.1\|WP_012198941.1\|1162541_1163021_+\|23S-rRNA-(pseudouridine(1915)-N(3))-methyltransferase-RlmH	unknown	unknown	gnl\|CDD\|376840
NC_010001.1\|WP_081428497.1\|1140678_1141920_+\|HAD-IA-family-hydrolase	unknown	unknown	gnl\|CDD\|319790
NC_010001.1\|WP_012198922.1\|1142073_1143030_+\|D-2-hydroxyacid-dehydrogenase	unknown	unknown	gnl\|CDD\|181414
NC_010001.1\|WP_041703992.1\|1147702_1148776_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|226361
NC_010001.1\|WP_012198936.1\|1156628_1157798_+\|alanine-racemase	unknown	unknown	gnl\|CDD\|143481
NC_010001.1\|WP_012198923.1\|1143167_1144637_-\|catalase	unknown	unknown	gnl\|CDD\|163710
NC_010001.1\|WP_012198938.1\|1158766_1160230_+\|HlyC/CorC-family-transporter	unknown	unknown	gnl\|CDD\|224173
NC_010001.1\|WP_012198929.1\|1149783_1150539_+\|DUF3221-domain-containing-protein	unknown	unknown	gnl\|CDD\|371575
NC_010001.1\|WP_012198926.1\|1146816_1147710_-\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|224097
NC_010001.1\|WP_012198939.1\|1161111_1161885_+\|threonine/serine-exporter-family-protein	unknown	unknown	gnl\|CDD\|377697
NC_010001.1\|WP_012198940.1\|1161881_1162484_+\|threonine/serine-exporter	unknown	unknown	gnl\|CDD\|378960
NC_010001.1\|WP_012198935.1\|1155088_1156636_+\|bifunctional-ADP-dependent-NAD(P)H-hydrate-dehydratase/NAD(P)H-hydrate-epimerase	unknown	unknown	gnl\|CDD\|238576
NC_010001.1\|WP_012198931.1\|1153270_1153918_+\|redox-sensing-transcriptional-repressor-Rex	unknown	unknown	gnl\|CDD\|235486
NC_010001.1\|WP_012198920.1\|1139973_1140453_-\|S-ribosylhomocysteine-lyase	unknown	unknown	gnl\|CDD\|376888
NC_010001.1\|WP_012198919.1\|1138602_1139820_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|370065
NC_010001.1\|WP_012198930.1\|1150708_1152709_-\|ABC-F-family-ATP-binding-cassette-domain-containing-protein	unknown	unknown	gnl\|CDD\|223562
NC_010001.1\|WP_012198928.1\|1148790_1149330_-\|cupin-domain-containing-protein	unknown	unknown	gnl\|CDD\|380339
NC_010001.1\|WP_012198932.1\|1153914_1154682_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|274009
NC_010001.1\|WP_029501644.1\|1157930_1158278_+\|type-II-toxin-antitoxin-system-PemK/MazF-family-toxin	unknown	unknown	gnl\|CDD\|367091
NC_010001.1\|WP_012198933.1\|1154706_1155075_+\|holo-ACP-synthase	unknown	unknown	gnl\|CDD\|234610

Protein	Function_ID	Function_description	E-value
NC_010001.1\|WP_012198941.1\|1162541_1163021_+\|23S-rRNA-(pseudouridine(1915)-N(3))-methyltransferase-RlmH	gnl\|CDD\|376840	pfam02590, SPOUT_MTase, Predicted SPOUT methyltransferase. This family of proteins are predicted to be SPOUT methyltransferases.	7.5329e-92
NC_010001.1\|WP_081428497.1\|1140678_1141920_+\|HAD-IA-family-hydrolase	gnl\|CDD\|319790	cd02603, HAD_sEH-N_like, N-terminal lipase phosphatase domain of human soluble epoxide hydrolase, Escherichia coli YihX/HAD4 alpha-D-glucose 1-phosphate phosphatase, and related domains, may be inactive. This family includes the N-terminal phosphatase domain of human soluble epoxide hydrolase (sEH). sEH is a bifunctional enzyme with two distinct enzyme activities, the C-terminal domain has epoxide hydrolysis activity and the N-terminal domain (Ntermphos), which belongs to this family, has lipid phosphatase activity. The latter prefers mono-phosphate esters, and lysophosphatidic acids (LPAs) are the best natural substrates found to date. In addition this family includes Gallus gallus sEH and Xenopus sEH which appears to lack phosphatase activity, and Escherichia coli YihX/HAD4 which selectively hydrolyzes alpha-Glucose-1-P, phosphatase, has significant phosphatase activity against pyridoxal phosphate, and has low beta phosphoglucomutase activity. This family belongs to the haloacid dehalogenase-like (HAD) hydrolases, a large superfamily of diverse enzymes that catalyze carbon or phosphoryl group transfer reactions on a range of substrates, using an active site aspartate in nucleophilic catalysis. Members of this superfamily include 2-L-haloalkanoic acid dehalogenase, azetidine hydrolase, phosphonoacetaldehyde hydrolase, phosphoserine phosphatase, phosphomannomutase, P-type ATPases and many others. HAD hydrolases are found in all three kingdoms of life, and most genomes are predicted to contain multiple HAD-like proteins. Members possess a highly conserved alpha/beta core domain, and many also possess a small cap domain, the fold and function of which is variable. HAD hydrolases are sometimes referred to as belonging to the DDDD superfamily of phosphohydrolases.	3.9955e-36
NC_010001.1\|WP_012198922.1\|1142073_1143030_+\|D-2-hydroxyacid-dehydrogenase	gnl\|CDD\|181414	PRK08410, PRK08410, D-2-hydroxyacid dehydrogenase.	1.1049e-160
NC_010001.1\|WP_041703992.1\|1147702_1148776_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|226361	COG3842, PotA, ABC-type spermidine/putrescine transport systems, ATPase components [Amino acid transport and metabolism].	1.13277e-163
NC_010001.1\|WP_012198936.1\|1156628_1157798_+\|alanine-racemase	gnl\|CDD\|143481	cd00430, PLPDE_III_AR, Type III Pyridoxal 5-phosphate (PLP)-Dependent Enzyme Alanine Racemase. This family includes predominantly bacterial alanine racemases (AR), some serine racemases (SerRac), and putative bifunctional enzymes containing N-terminal UDP-N-acetylmuramoyl-tripeptide:D-alanyl-D-alanine ligase (murF) and C-terminal AR domains. These proteins are fold type III PLP-dependent enzymes that play essential roles in peptidoglycan biosynthesis. AR catalyzes the interconversion between L- and D-alanine, which is an essential component of the peptidoglycan layer of bacterial cell walls. SerRac converts L-serine into its D-enantiomer (D-serine) for peptidoglycan synthesis. murF catalyzes the addition of D-Ala-D-Ala to UDPMurNAc-tripeptide, the final step in the synthesis of the cytoplasmic precursor of bacterial cell wall peptidoglycan. Members of this family contain an N-terminal PLP-binding TIM-barrel domain and a C-terminal beta-sandwich domain. They exist as homodimers with active sites that lie at the interface between the TIM barrel domain of one subunit and the beta-sandwich domain of the other subunit. AR and other members of this family require dimer formation and the presence of the PLP cofactor for catalytic activity. Fungal ARs and eukaryotic serine racemases, which are fold types I and II PLP-dependent enzymes respectively, are excluded from this family.	0
NC_010001.1\|WP_012198923.1\|1143167_1144637_-\|catalase	gnl\|CDD\|163710	cd08154, catalase_clade_1, Clade 1 of the heme-binding enzyme catalase. Catalase is a ubiquitous enzyme found in both prokaryotes and eukaryotes, which is involved in the protection of cells from the toxic effects of peroxides. It catalyzes the conversion of hydrogen peroxide to water and molecular oxygen. Catalases also utilize hydrogen peroxide to oxidize various substrates such as alcohol or phenols. Clade 1 catalases are found in bacteria, algae, and plants; they have a relatively small subunit size of 55 to 69 kDa, and bind a protoheme IX (heme b) group buried deep inside the structure. They appear to form tetramers. In eukaryotic cells, catalases are located in peroxisomes.	0
NC_010001.1\|WP_012198938.1\|1158766_1160230_+\|HlyC/CorC-family-transporter	gnl\|CDD\|224173	COG1253, TlyC, Hemolysins and related proteins containing CBS domains [General function prediction only].	1.34611e-110
NC_010001.1\|WP_012198929.1\|1149783_1150539_+\|DUF3221-domain-containing-protein	gnl\|CDD\|371575	pfam11518, DUF3221, Protein of unknown function (DUF3221). This family of proteins with unknown function appears to be restricted to Bacillus. Some members in this family of proteins are annotated as YobA however this cannot be confirmed. YobA is a protein with unknown function.	3.46988e-07
NC_010001.1\|WP_012198926.1\|1146816_1147710_-\|ABC-transporter-permease	gnl\|CDD\|224097	COG1176, PotB, ABC-type spermidine/putrescine transport system, permease component I [Amino acid transport and metabolism].	4.91541e-81
NC_010001.1\|WP_012198939.1\|1161111_1161885_+\|threonine/serine-exporter-family-protein	gnl\|CDD\|377697	pfam06738, ThrE, Putative threonine/serine exporter. ThrE is a family of bacterial and Archaeal proteins that catalyze the export of L-threonine from the cell. UniProtKB:Q79VD1 has been characterized as being necessary for this export. The domain exhibits 10 putative TMs and catalyzes the proton-motive-force-dependent efflux of threonine and serine.	1.43343e-69
NC_010001.1\|WP_012198940.1\|1161881_1162484_+\|threonine/serine-exporter	gnl\|CDD\|378960	pfam12821, ThrE_2, Threonine/Serine exporter, ThrE. ThrE_2 is a family of membrane proteins involved in the export of threonine and serine. L-threonine, L-serine are both substrates for the exporter. The exporter exhibits nine-ten predicted transmembrane-spanning helices with long charged C and N termini and an amphipathic helix present within the N-terminus. L-Threonine can be made by the amino acid-producing bacterium Corynebacterium glutamicum, but the potential for amino acid formation can be considerably improved by reducing its intracellular degradation into glycine and increasing its export by this exporter. Members of the family are found in Bacteria, Archaea, and the fungal kingdoms, and the family can exist either as a single long polypeptide chain or as two short polypeptides. All family members show an extended hydrophilic N-terminal domain with weak sequence similarity to portions of hydrolases (proteases, peptidases, and glycosidases); this suggests that since this region is cytoplasmic to the membrane it may be generating the transport substrate, so may imply that threonine may not be the primary substrate and the ThrE has a subsidiary function.	1.14088e-46
NC_010001.1\|WP_012198935.1\|1155088_1156636_+\|bifunctional-ADP-dependent-NAD(P)H-hydrate-dehydratase/NAD(P)H-hydrate-epimerase	gnl\|CDD\|238576	cd01171, YXKO-related, B.subtilis YXKO protein of unknown function and related proteins. Based on the conservation of the ATP binding site, the substrate binding site and the Mg2+binding site and structural homology this group is a member of the ribokinase-like superfamily.	2.54061e-70
NC_010001.1\|WP_012198931.1\|1153270_1153918_+\|redox-sensing-transcriptional-repressor-Rex	gnl\|CDD\|235486	PRK05472, PRK05472, redox-sensing transcriptional repressor Rex; Provisional.	1.29277e-115
NC_010001.1\|WP_012198920.1\|1139973_1140453_-\|S-ribosylhomocysteine-lyase	gnl\|CDD\|376888	pfam02664, LuxS, S-Ribosylhomocysteinase (LuxS). This family consists of the LuxS protein involved in autoinducer AI2 synthesis and its hypothetical relatives. S-ribosylhomocysteinase (LuxS) catalyzes the cleavage of the thioether bond in S-ribosylhomocysteine (SRH) to produce homocysteine and 4,5-dihydroxy-2,3-pentanedione (DPD), the precursor of type II bacterial quorum sensing molecule.	2.75385e-89
NC_010001.1\|WP_012198919.1\|1138602_1139820_-\|hypothetical-protein	gnl\|CDD\|370065	pfam08690, GET2, GET complex subunit GET2. This family corresponds to the GET complex subunit GET2. The GET complex is involved in the retrieval of ER resident proteins from the Golgi.	0.00231048
NC_010001.1\|WP_012198930.1\|1150708_1152709_-\|ABC-F-family-ATP-binding-cassette-domain-containing-protein	gnl\|CDD\|223562	COG0488, Uup, ATPase components of ABC transporters with duplicated ATPase domains [General function prediction only].	0
NC_010001.1\|WP_012198928.1\|1148790_1149330_-\|cupin-domain-containing-protein	gnl\|CDD\|380339	cd02209, cupin_XRE_C, XRE (Xenobiotic Response Element) family transcriptional regulators, C-terminal cupin domain. This family contains transcriptional regulators containing an N-terminal XRE (Xenobiotic Response Element) family helix-turn-helix (HTH) DNA-binding domain and a C-terminal cupin domain. Included in this family is Escherichia coli transcription factor SutR (YdcN) that plays a regulatory role in sulfur utilization; it regulates a set of genes involved in the generation of sulfate and its reduction, the synthesis of cysteine, the synthesis of enzymes containing Fe-S as cofactors, and the modification of tRNA with use of sulfur-containing substrates. This family belongs to the cupin superfamily with a conserved "jelly roll-like" beta-barrel fold capable of homodimerization.	8.31145e-35
NC_010001.1\|WP_012198932.1\|1153914_1154682_+\|hypothetical-protein	gnl\|CDD\|274009	TIGR02169, chromosome_segregation_protein_related_ptotein, chromosome segregation protein SMC, primarily archaeal type. SMC (structural maintenance of chromosomes) proteins bind DNA and act in organizing and segregating chromosomes for partition. SMC proteins are found in bacteria, archaea, and eukaryotes. It is found in a single copy and is homodimeric in prokaryotes, but six paralogs (excluded from this family) are found in eukarotes, where SMC proteins are heterodimeric. This family represents the SMC protein of archaea and a few bacteria (Aquifex, Synechocystis, etc); the SMC of other bacteria is described by TIGR02168. The N- and C-terminal domains of this protein are well conserved, but the central hinge region is skewed in composition and highly divergent. [Cellular processes, Cell division, DNA metabolism, Chromosome-associated proteins].	0.00783123
NC_010001.1\|WP_029501644.1\|1157930_1158278_+\|type-II-toxin-antitoxin-system-PemK/MazF-family-toxin	gnl\|CDD\|367091	pfam02452, PemK_toxin, PemK-like, MazF-like toxin of type II toxin-antitoxin system. PemK is a growth inhibitor in E. coli known to bind to the promoter region of the Pem operon, auto-regulating synthesis. This family represents the toxin molecule of a typical bacterial toxin-antitoxin system pairing. The family includes a number of different toxins, such as MazF, Kid, PemK, ChpA, ChpB and ChpAK.	4.22085e-40
NC_010001.1\|WP_012198933.1\|1154706_1155075_+\|holo-ACP-synthase	gnl\|CDD\|234610	PRK00070, acpS, 4'-phosphopantetheinyl transferase; Provisional.	2.89104e-35

>NC_010001.1|WP_012198930.1|1150708_1152709_-|ABC-F-family-ATP-binding-cassette-domain-containing-protein
MILACKNISKSFGTTPILDKVAFHVNEREKVAIVGINGAGKSTLIKIIMGELTADEGEIIFAKGATVGYLAQHQDLSTDSTIYEEVLAIKSDIIKMEETIRRLEIDMKSATGAELERMLSSYSRLTHDFELKNGYAYQSEVIGVLKGLGFTEEDFNKKVSTLSGGQKTRVALGKLLLSTPDIIFLDEPTNHLDMESIAWLETFLVNYSGAVVVIAHDRYFLNKVVSKVVELDNTKATMFEGNYSDYAMKKEQLRETMIRHYLNQQREIKHQEEVIAKLRSFNREKSIKRAESREKMLDKIDRLDKPVTVNDKMHIALEPNIISGNDVLTVTDLRKSYGSLTLFDQLNFEVKRGEKVAIIGNNGTGKTTILKIINQIINADAGDVKLGAKVFVGYYDQEHHVLNMDKTIFDEIQDTYPNMDNTRVRNILAAFLFTGDDVFKLIKDISGGERGRVSLAKLMLSDANFLIMDEPTNHLDITSKEILENAINNYTGTVLYVSHDRYFINRTASRILDLTNQTFLNYIGNYDYYLEKKPEMEWRAFGNNNGYNQSDANDNILNGLRINKHLDQANKELQTSSFPQEPVSENKLDWQQQKEEQAKLRKRQNELKKVEDEITRLEARNEELEVLLADSSIYTNSSKLIEVHKEKKELEERLEVLMEQWEELSE
>NC_010001.1|WP_012198929.1|1149783_1150539_+|DUF3221-domain-containing-protein
MKSKIYLYLFILLFTGILVGCTKKPFSIENTKFKAVVIDNNNGLLVKPDVDSNEFRLADKISIGANSAMIFNQDKKEVDLNEIQIGDVVKITYDGIILESYPAQITAVYIEIFESNLLIDGYITIIDDIYKLDSGLNSDINMIALNLTEATNLSEIDKEILLMKLYEMYGLEVKESTFDQLVKEGLINEEELYFPTGIIITISNSEYNEGKQTLEYVINKWRSGLGAIGYKGKAKFDGEEWIISKKSMWIS
>NC_010001.1|WP_012198928.1|1148790_1149330_-|cupin-domain-containing-protein
MKIGAKIKELRVQKSLTQEELADRAELSKGFISQLERDITSPSIATLVDILQCLGTNLEAFFTDTTSEQVVFKRGDYFEKVDNELNNKIEWIIPNAQKNMMEPILLTLEPGGSTYPDNPHEGEEFGYVISGSITIHIGNKTHRVKKGESFYFTPNKNHYIAATGKTGATLLWVSTPPSF
>NC_010001.1|WP_041703992.1|1147702_1148776_-|ABC-transporter-ATP-binding-protein
MDNKLIDLINITKRYGNNVVIDDLNLYIRENEFLTLLGPSGCGKTTTLRIIGGFEQPDQGRVIFDGKDITKLPPNERQLNTVFQKYALFTHMTIEENIAFGLKIKKKSRQYIKDKISYALKLVNLDGFENRMPDSLSGGQQQRIAIARAIVNEPKVLLLDEPLGALDLKLRQDMQYELIRLKNELGITFVYVTHDQEEALTMSDTIMVMNQGYIQQIGTPEKIYNEPKNAFVADFIGESNIINATMVQDRLVNILGANFPCVDVGFGKIQPVDVVIRPEDIDLVAPEAGIITGRVTSLIFKGVHYEMTVMANGFEWLVHSTDLSPVGAEVGIKVDPYDIQIMNKPESEDEEAVGVNE
>NC_010001.1|WP_012198926.1|1146816_1147710_-|ABC-transporter-permease
MNNQEESKVTAQEATVTLVRKSHHFSGKSLLTFPYILWMGAFIIIPLIMVVYYGFTTKANNSFTLENIKLIADPVNQKALYLSLKLSLISTLICLLLAYPLALILKSMKLKSNSFVVFVMILPMWMNFLLRTIAWQNILENNGIINTLLKALNLPTVNIINTPTAIVLGMVYNFLPFMILPIYNTLAKIDDNVINAARDLGANGWITFRKIIFPLSIPGVISGITMVFVPSLTTFVISNILGGSKIVLIGNVIEQQFQKVGNWHAGSGLSTVLMVFILISMAILAKYDKESEGTNVW
>NC_010001.1|WP_012198923.1|1143167_1144637_-|catalase
MDRRNEKKCCNYLTDSLGRPIPNDTNSLTVGSDGPVLLQDVHLIDKISHFDRERIPERVVHAKGTGAFGYFQPYCDWTDYTCAEFLKNPNCKTKVFVRFSTVIGSKGSADTVRDPRGFAVKFYTTDGIYDIVGNDLPVFFIRDGIKFPDVIHSLKPSPDNNLRDPQRFWDFVSLSPEATHMVTWLYSDRGTIKDFRHVDGFGVNTYIWVNECGKRVYIKYHWKTQQGLQTIDRFEAEQLAGSDPDVAVRTLYESIANGFYPSWELCVQMMDPDMIECLDFDPLDDTKVWPEDQFPLMPIGLMTLDCNPENFFAEVEQAAFCPGNIVPGVELSADKMLQGRSFSYFDTQRHRLGPNFAQLPINRSISCINNNQRDGQGTYIFNPNPINYSPNSLNCGFPKVAEVCQSEPECVCGYIARIPIKNPCDFKQAGERYESLSCEERCHLIDNIAVELYKCNQDIIDRVLCFFFKAHQEFGEQVECAIDYYRQMC
>NC_010001.1|WP_012198922.1|1142073_1143030_+|D-2-hydroxyacid-dehydrogenase
MKIVIMEANTLGNDVDLGMFQEFGDVVIYGESNPLENAERIKDADVIIVNKIPMNEDILKGATKLKLICLTATGTNNIDFTYTEKRGISVANVKGYSTQSVVQHTFALLFYVYEKLAYYDQYVKSGDYTRSDIFSNFDVKFHELYGKTFGIIGLGEIGQGVAKIAELFGCKVVYYSTSGKNLNSDYERVDLQTLLKISDVVSIHAPLTKATTNLIGEAELEMMKPDAILLNLGRGAIVNQEALANALLAGKIGGAGLDVLTVEPMLADNPLLKVKDSTRLIITPHIAWATVEARNRCAKEVYFNIKSYLSGEPRNIVE
>NC_010001.1|WP_081428497.1|1140678_1141920_+|HAD-IA-family-hydrolase
MIKNIIFDIGQVLAEFRWRDYIDELTIKEEYKERLAKATVLSPYWNEVDRGVLSKEEIMKRCISIDPEIEKEIKLFFDDTSQLVEEFEYSEELVKDLKSQGYHIYILSNYGRENFSYVKNVFRFLKHVDGAVISYEEQHIKPEPQIYEALISRYGIVPEESVFLDDLAGNLEGAKTFHFHTICFHSLWQAKKELRNLGVMVEEREFDSIIFDLDGTMWDSTENAAIVWKEIAKKDSRITDEVTGPKLKALYGLPLEDIARGLFLSVPEDVAIETMEKCVVAQCPYLAEHGGILLGKIEETLKELSKKYRLFIVSNCKSGYIEAFLEAHKLGQYFDDFECPGGTGKLKADNIRIVMKRNQLRNPIYVGDTGGDGDAAHQAKIPFVYARYGFGEATEYEYVIDSFDQLTTLRMTE
>NC_010001.1|WP_012198920.1|1139973_1140453_-|S-ribosylhomocysteine-lyase
MKPIASFTIDHLKLLPGVYVSRKDSAGDAIITTFDLRMTRPNFEPVMNTAEMHAIEHLAATFLRNHAVFGSKIIYFGPMGCRTGFYLLLSGDYTSAEIIPLMKELFTFISEFEGEIPGAAAIHCGNYLDMNLPMAKFLAKRYLTEVLDSITEEQLEYPN
>NC_010001.1|WP_012198919.1|1138602_1139820_-|hypothetical-protein
MEETNQAEKSPDNITSFSGQSRTSKMIQAAAPYLDAGTRKTADLFIKFNDFMDMIRTFRQQGGLGLFGRKKADTKDDTVSATGLPGLQGLFPGLQGLFGSGKGEGSINFEGILRSIRPYCTPPEISLVDNVLNIFSMKRVMDMYQNMSGMMNMPGMNNMQGMNNMQGMNNMQDMMNNLPNIMNMMNMMNTMSGSPFAGATSGSPTQNAPSQDYNSQGYPPPNASAPPPSSMNYDNSYYESTSPTPYDLLYQAMYGQGPPPDATTNTAGQTVSEASNMQMPGNSPTSGNVQTNWPNYNVPPPVNLPPYDMGNMNRDVTSAPYYTNNAPYRATRSAAEAARKGNSPKQAQNVSAASNTQSGQSGNHSPARQNNQQMFDMLASMVPPEQKNTFDTMKKMFESGMFMPT
>NC_010001.1|WP_012198931.1|1153270_1153918_+|redox-sensing-transcriptional-repressor-Rex
MYDKTISSAVIKRLPRYYRYLGELLENDVVRISSKELSEKMNVTASQIRQDLNNFGGFGQQGYGYNVEYLYTEIGKILGLDKKYNVIIIGAGNLGQALANYTDFERRGFYICGIFDVNPRLIGISIRGIEIRLIDELEEFMKTNTVNIAALTIPKAKAPQVAADLVSLGIHAIWNFAPTDLNLPKDVMVENVHLAESLMRLSYNLKAAEESGESI
>NC_010001.1|WP_012198932.1|1153914_1154682_+|hypothetical-protein
MRLGKRFGDKSEPKTKSLSDLDDLDEDFDLEFENVKVSSYVEPSRMEPRKINRSKVFSEMSLRQIFRNRKIPIVTLDERFINLFPEEKMSGVQRRLRDELVELMKDQSRVLDDIKGLKRYKSQLMQEIMDNMEVDHTPIGRLKERKLAKNQKLIEDINQKLLIAEDSLEKLPGEIAAKNEELMVESLQSCYGNIFEKNLRKKSLEDEIRETEVKLRNLKKQKLEIEKDYRGTYTYLYDMLGTEMMRKIDEEQDLL
>NC_010001.1|WP_012198933.1|1154706_1155075_+|holo-ACP-synthase
MIFGIGTDMIEINRVVKACERKTFLTKIYTEQEQKLLLSDIRKAASNFAVKEAVVKMFGTGFRAIAPNEIEVLRDNLGKPYVNLYGNAEILAKEHNVERIHVSITNTKELVSAYVIGEIIRE
>NC_010001.1|WP_012198935.1|1155088_1156636_+|bifunctional-ADP-dependent-NAD(P)H-hydrate-dehydratase/NAD(P)H-hydrate-epimerase
MRYALDAVQMKNLDKKTIEQIGIPAMVLMERAALYVAEQVREHAKPTDKIIAVCGTGNNGGDGIAAARILHLWGYHVTIGIIGEMEKFSKECREQWKIAKNLGLSIRTEWEITEYNIVIDGIFGIGLGKPVSGEYAKVIQSINQSDCYVVSIDIPSGISASNGQVFGCAVKANETVTFGEQKLGLLLYPGATYAGKIHIADIGFAKEKLDSLTYTYYETTDLDKLPIRMPYSNKGSYGRVLVIAGTESMTGAAYFSAAAAYRMGAGLVKILSAKKAIPVLQGMLPEALFAAYDEEDYEEQVNKALEFATVIVIGPGLGVEAIAKKLLLKVCKEAKVPLIVDADGINLLAMLADEMIPDVLQLTDEVERLHQRIYYIKEILPEGTILTPHLKELSRLTLYPLNKIPCNLIDIASYCTYNNLMIYVLKDSRTIVASKDLRYINVSGTHGMATGGSGDALTGIIAGLIAGGLEAGKAATLGVYLHGLAGEEAAKVKSTYSMLAGDMIEALPEVLRNHD
>NC_010001.1|WP_012198936.1|1156628_1157798_+|alanine-racemase
MIEETYNQRYLRVSANINLDAIIHNVAEARKNIKKETGIFAVIKADGYGHGAVPIARAIDNDVEAYAVAIVEEGIELREAGITKPILILGYTAPELLTEIVQYDLTQTVFQLSMAEKLDEIARTLGKVAKIHIKLDTGMSRIGYQPTAESIDEIVRMKKLSNLMLEGIFTHMACADMTDKTSAKKQFELFTAFVNQLEEQGVKLPIQHISNSAGTIDLPEMNLSMVRFGISLYGLYPSEEVDKNHLSLEPAMELKTHISFVKELEPGHGIGYGSTFVTKKTMTIATVPVGYGDGFPRQLSNVGRVLVHGEFAPIVGRICMDQFMIDVTDIPEVKQGDIVTLVGRDGDNIIPVEEPADLAGSFNYEFVCNVGKRIPRVYYQNGKPVSIRH
>NC_010001.1|WP_029501644.1|1157930_1158278_+|type-II-toxin-antitoxin-system-PemK/MazF-family-toxin
MIIKRGDIFYADLRPVIGSEQGGVRPVLIIQNDTGNKHSPTVICAAITSKMNKAKLPTHVEIDADKYGIVKDSVILLEQVRTIDKSRLKEKVCHLDQDILKRIDKALLISFALDT
>NC_010001.1|WP_012198938.1|1158766_1160230_+|HlyC/CorC-family-transporter
MDGHPIRGLVLILVLVALNAIASAAEAAIENVNEALAEKRAEEGDKKAKRLVRLLDTPHRYINVIEILLTLASLLIGMTYSFQLYRVIEKLVETSTLPEAMAITTSIAMVLVTILITYLIVLFGMLLPRKLALKYADSCAFKMAGMILTCSHLFAPIIWLLEKNTNGILRLFGIRPSDLEDNVTEEEIMSMVNEGHEQGVLEAEEAEMISNIIEFNEKAAKDIMTHRKKMIAINSALCIEDALRFMLDENYSRFPLYDGDIDNIVGLLHLKDVMLYFLDPRLKVEPLSKVAREPYFIPDTQSIDVLFHDMQTKKIHMAIAIDEYGQTAGIVAMEDILEEIVGDIQDEYDDEEELYTRLEDDSYLLSGEASLEDLEDILSLPFAEEDIKNYDTLNGLIVSLLDHIPGDDERATIRYCGYEYELMEIQNRMITSVRVRKIPEEELKASDNEDNQVSQRLGAAMTDAIDTTDEKILSNVEDIILEKKKDK
>NC_010001.1|WP_012198939.1|1161111_1161885_+|threonine/serine-exporter-family-protein
MNYKLLVDTAVLAGEIMLRSGAETYRVEDTIYRILKTSGFDRCDVFVVSTGIIVTLADSSIDAISQVRRVAERQTDLGNIYYANDISRKLCSGEIDLETANEKLSELTKTVRYPVWLAYLCLIIAAPGFAILLGANFIECFLAMWNGIFIMVSNIMSKRLKINRFVTNMMICAVMAISTTGIVNLFHLNAEMELIIAGAIMPLLPGVALTNGIRDTLQGDYVSGAARLVEAFVTAASLAVGIGAGLALAKVLLGGIV
>NC_010001.1|WP_012198940.1|1161881_1162484_+|threonine/serine-exporter
MIVQIIGAFIAVFALALAFGVPRKFLVYSSIVGAIDWLVYLISLERGLGLAMSVFVSTLVIAFISHAFARKFKAPVTVFLIPGILPLVPGVGTYRIVYYLILEDGANASYYFYQTLQIAGMIAIGIFIIDTFFKFFQKPLIKAGVCEVAEDTLPQGSDSLEDSTGHSPEEEERRMEQDLRARAEALRKKMKEREKDDLGL
>NC_010001.1|WP_012198941.1|1162541_1163021_+|23S-rRNA-(pseudouridine(1915)-N(3))-methyltransferase-RlmH
MKITVVCVGKIKEKYLTMAIEEYSKRLSRYCKLEIIELADEKTPDNASPAEELQIKKKEGERILKNIKDNAYVIALAIEGKMLSSEELADKMQLLGVNGESHLAFVIGGSLGLDSEVLDRADFKLSFSKMTFPHQVMRTILLEQVYRGFRIMSGEPYHK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010001_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010001_3

1568588-1568684

Orphan

Consensus_repeat	Method
TAAAAAGTGATGAATGTATTAGTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010001_3

>merge|NC_010001|3|1568588-1568684|CRISPRCasFinder
TAAAAAGTGATGAATGTATTAGTTCTCCAATATAAAATAAAAAGTGATTACTGTGTTGGTTCCAATTATAAAATAAAAAGTGATGAATGTGTTAGTT

>NC_010001|3|3|1568588-1568684|CRISPRCasFinder
TAAAAAGTGATGAATGTATTAGTT	CTCCAATATAAAATAAAAAGTGATTACTGTGTTGGTTCCAATTATAAAA
TAAAAAGTGATGAATGTGTTAGTT

Protein	Signature genes	Signature genes Name	Protein_function
NC_010001.1\|WP_012199264.1\|1555389_1556349_+\|L-lactate-dehydrogenase	unknown	unknown	gnl\|CDD\|133427
NC_010001.1\|WP_012199273.1\|1566937_1567600_+\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NC_010001.1\|WP_012199267.1\|1558777_1559959_+\|aminotransferase-class-I/II-fold-pyridoxal-phosphate-dependent-enzyme	unknown	unknown	gnl\|CDD\|181580
NC_010001.1\|WP_012199272.1\|1566224_1566848_+\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|225107
NC_010001.1\|WP_012199284.1\|1581245_1582583_+\|MATE-family-efflux-transporter	unknown	unknown	gnl\|CDD\|240542
NC_010001.1\|WP_012199265.1\|1556432_1557260_+\|metal-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|224381
NC_010001.1\|WP_041704100.1\|1561218_1562964_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224055
NC_010001.1\|WP_012199279.1\|1576392_1577199_-\|phosphotransferase	unknown	unknown	gnl\|CDD\|162743
NC_010001.1\|WP_012199277.1\|1571955_1573083_+\|exonuclease-SbcCD-subunit-D	unknown	unknown	gnl\|CDD\|223497
NC_010001.1\|WP_012199270.1\|1562953_1564849_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224055
NC_010001.1\|WP_012199276.1\|1569429_1571748_+\|FtsX-like-permease-family-protein	unknown	unknown	gnl\|CDD\|226957
NC_010001.1\|WP_012199271.1\|1565059_1566136_+\|two-component-sensor-histidine-kinase	unknown	unknown	gnl\|CDD\|226951
NC_010001.1\|WP_012199268.1\|1560164_1560710_+\|hydrolase	unknown	unknown	gnl\|CDD\|225198
NC_010001.1\|WP_012199282.1\|1579430_1580060_+\|histidine-phosphatase-family-protein	unknown	unknown	gnl\|CDD\|366010
NC_010001.1\|WP_012199283.1\|1580099_1580870_-\|Cof-type-HAD-IIB-family-hydrolase	unknown	unknown	gnl\|CDD\|369792
NC_010001.1\|WP_012199281.1\|1578133_1579018_-\|dipicolinate-synthase-subunit-DpsA	unknown	unknown	gnl\|CDD\|181371
NC_010001.1\|WP_012199278.1\|1573126_1576243_+\|SMC-family-ATPase	unknown	unknown	gnl\|CDD\|223496
NC_010001.1\|WP_012199275.1\|1568747_1569437_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|213222
NC_010001.1\|WP_012199280.1\|1577526_1578117_-\|dipicolinate-synthase-subunit-B	unknown	unknown	gnl\|CDD\|181370
NC_010001.1\|WP_012199266.1\|1557320_1558700_+\|FAD-binding-protein	unknown	unknown	gnl\|CDD\|273050

Protein	Function_ID	Function_description	E-value
NC_010001.1\|WP_012199264.1\|1555389_1556349_+\|L-lactate-dehydrogenase	gnl\|CDD\|133427	cd05291, HicDH_like, L-2-hydroxyisocapronate dehydrogenases and some bacterial L-lactate dehydrogenases. L-2-hydroxyisocapronate dehydrogenase (HicDH) catalyzes the conversion of a variety of 2-oxo carboxylic acids with medium-sized aliphatic or aromatic side chains. This subfamily is composed of HicDHs and some bacterial L-lactate dehydrogenases (LDH). LDHs catalyze the last step of glycolysis in which pyruvate is converted to L-lactate. Bacterial LDHs can be non-allosteric or may be activated by an allosteric effector such as fructose-1,6-bisphosphate. Members of this subfamily with known structures such as the HicDH of Lactobacillus confusus, the non-allosteric LDH of Lactobacillus pentosus, and the allosteric LDH of Bacillus stearothermophilus, show that they exist as homotetramers. The HicDH-like subfamily is part of the NAD(P)-binding Rossmann fold superfamily, which includes a wide variety of protein families including the NAD(P)-binding domains of alcohol dehydrogenases, tyrosine-dependent oxidoreductases, glyceraldehyde-3-phosphate dehydrogenases, formate/glycerate dehydrogenases, siroheme synthases, 6-phosphogluconate dehydrogenases, aminoacid dehydrogenases, repressor rex, and NAD-binding potassium channel domains, among others.	7.64392e-164
NC_010001.1\|WP_012199273.1\|1566937_1567600_+\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	2.62884e-56
NC_010001.1\|WP_012199267.1\|1558777_1559959_+\|aminotransferase-class-I/II-fold-pyridoxal-phosphate-dependent-enzyme	gnl\|CDD\|181580	PRK08912, PRK08912, aminotransferase.	5.88459e-123
NC_010001.1\|WP_012199272.1\|1566224_1566848_+\|response-regulator-transcription-factor	gnl\|CDD\|225107	COG2197, CitB, Response regulator containing a CheY-like receiver domain and an HTH DNA-binding domain [Signal transduction mechanisms / Transcription].	1.73901e-68
NC_010001.1\|WP_012199284.1\|1581245_1582583_+\|MATE-family-efflux-transporter	gnl\|CDD\|240542	cd13137, MATE_NorM_like, Subfamily of the multidrug and toxic compound extrusion (MATE)-like proteins similar to Thermotoga marina NorM. The integral membrane proteins from the MATE family are involved in exporting metabolites across the cell membrane and are responsible for multidrug resistance (MDR) in many bacteria and animals. A number of family members are involved in the synthesis of peptidoglycan components in bacteria.	1.12783e-102
NC_010001.1\|WP_012199265.1\|1556432_1557260_+\|metal-ABC-transporter-substrate-binding-protein	gnl\|CDD\|224381	COG1464, NlpA, ABC-type metal ion transport system, periplasmic component/surface antigen [Inorganic ion transport and metabolism].	3.03502e-93
NC_010001.1\|WP_041704100.1\|1561218_1562964_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224055	COG1132, MdlB, ABC-type multidrug transport system, ATPase and permease components [Defense mechanisms].	2.93328e-155
NC_010001.1\|WP_012199279.1\|1576392_1577199_-\|phosphotransferase	gnl\|CDD\|162743	TIGR02172, Fb_sc_TIGR02172, Fibrobacter succinogenes paralogous family TIGR02172. This model describes a paralogous family of five proteins, likely to be enzymes, in the rumen bacterium Fibrobacter succinogenes S85. Members show homology to proteins described by pfam01636, a phosphotransferase enzyme family associated with resistance to aminoglycoside antibiotics.	6.66635e-13
NC_010001.1\|WP_012199277.1\|1571955_1573083_+\|exonuclease-SbcCD-subunit-D	gnl\|CDD\|223497	COG0420, SbcD, DNA repair exonuclease [DNA replication, recombination, and repair].	3.30864e-54
NC_010001.1\|WP_012199270.1\|1562953_1564849_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224055	COG1132, MdlB, ABC-type multidrug transport system, ATPase and permease components [Defense mechanisms].	4.15051e-163
NC_010001.1\|WP_012199276.1\|1569429_1571748_+\|FtsX-like-permease-family-protein	gnl\|CDD\|226957	COG4591, LolE, ABC-type transport system, involved in lipoprotein release, permease component [Cell envelope biogenesis, outer membrane].	1.45169e-07
NC_010001.1\|WP_012199271.1\|1565059_1566136_+\|two-component-sensor-histidine-kinase	gnl\|CDD\|226951	COG4585, COG4585, Signal transduction histidine kinase [Signal transduction mechanisms].	3.88579e-35
NC_010001.1\|WP_012199268.1\|1560164_1560710_+\|hydrolase	gnl\|CDD\|225198	COG2316, COG2316, Predicted hydrolase (HD superfamily) [General function prediction only].	2.62556e-40
NC_010001.1\|WP_012199282.1\|1579430_1580060_+\|histidine-phosphatase-family-protein	gnl\|CDD\|366010	pfam00300, His_Phos_1, Histidine phosphatase superfamily (branch 1). The histidine phosphatase superfamily is so named because catalysis centers on a conserved His residue that is transiently phosphorylated during the catalytic cycle. Other conserved residues contribute to a 'phosphate pocket' and interact with the phospho group of substrate before, during and after its transfer to the His residue. Structure and sequence analyses show that different families contribute different additional residues to the 'phosphate pocket' and, more surprisingly, differ in the position, in sequence and in three dimensions, of a catalytically essential acidic residue. The superfamily may be divided into two main branches. The larger branch 1 contains a wide variety of catalytic functions, the best known being fructose 2,6-bisphosphatase (found in a bifunctional protein with 2-phosphofructokinase) and cofactor-dependent phosphoglycerate mutase. The latter is an unusual example of a mutase activity in the superfamily: the vast majority of members appear to be phosphatases. The bacterial regulatory protein phosphatase SixA is also in branch 1 and has a minimal, and possible ancestral-like structure, lacking the large domain insertions that contribute to binding of small molecules in branch 1 members.	5.26059e-54
NC_010001.1\|WP_012199283.1\|1580099_1580870_-\|Cof-type-HAD-IIB-family-hydrolase	gnl\|CDD\|369792	pfam08282, Hydrolase_3, haloacid dehalogenase-like hydrolase. This family contains haloacid dehalogenase-like hydrolase enzymes.	1.64804e-58
NC_010001.1\|WP_012199281.1\|1578133_1579018_-\|dipicolinate-synthase-subunit-DpsA	gnl\|CDD\|181371	PRK08306, PRK08306, dipicolinate synthase subunit DpsA.	2.76244e-138
NC_010001.1\|WP_012199278.1\|1573126_1576243_+\|SMC-family-ATPase	gnl\|CDD\|223496	COG0419, SbcC, ATPase involved in DNA repair [DNA replication, recombination, and repair].	9.31084e-65
NC_010001.1\|WP_012199275.1\|1568747_1569437_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|213222	cd03255, ABC_MJ0796_LolCDE_FtsE, ATP-binding cassette domain of the transporters involved in export of lipoprotein and macrolide, and cell division protein. This family is comprised of MJ0796 ATP-binding cassette, macrolide-specific ABC-type efflux carrier (MacAB), and proteins involved in cell division (FtsE), and release of lipoproteins from the cytoplasmic membrane (LolCDE). They are clustered together phylogenetically. MacAB is an exporter that confers resistance to macrolides, while the LolCDE system is not a transporter at all. An FtsE null mutants showed filamentous growth and appeared viable on high salt medium only, indicating a role for FtsE in cell division and/or salt transport. The LolCDE complex catalyzes the release of lipoproteins from the cytoplasmic membrane prior to their targeting to the outer membrane.	1.08574e-109
NC_010001.1\|WP_012199280.1\|1577526_1578117_-\|dipicolinate-synthase-subunit-B	gnl\|CDD\|181370	PRK08305, spoVFB, dipicolinate synthase subunit B; Reviewed.	1.49051e-120
NC_010001.1\|WP_012199266.1\|1557320_1558700_+\|FAD-binding-protein	gnl\|CDD\|273050	TIGR00387, Glycolate_oxidase_subunit_glcD., glycolate oxidase, subunit GlcD. This protein, the glycolate oxidase GlcD subunit, is similar in sequence to that of several D-lactate dehydrogenases, including that of E. coli. The glycolate oxidase has been found to have some D-lactate dehydrogenase activity. [Energy metabolism, Other].	1.1998e-115

>NC_010001.1|WP_012199273.1|1566937_1567600_+|response-regulator-transcription-factor
MNHILVVEDDEKLRNGLVLSLSSNNQEVKAAPSIKSAKELLKIHKFDLLILDCNLPDGNGIEFCREISGATEIPIIFLTVNDTEIDIVSAFRVGATDYVTKPFSIMVLRERVKAALRRNKCRDDIYKDDYYYFNFTALEYKIEGVEVILSVVEQKIIKLLVCNKNKIIPRERLIDLVWSCNEEFIDDNALTMAIKRLRFKIGNEAIKTVYGLGYMWVGKI
>NC_010001.1|WP_012199272.1|1566224_1566848_+|response-regulator-transcription-factor
MRIVIVDDDRLVCSSLKVILEMDSEIKVEAIGNDGREAITLYEKYTPDVLLMDIRMSTMSGIDAAEKILVKHKDAKILFLTTFSDDEYIVKALKIGAKGYLLKQDYDSIQPALKAVSMGQSVFGSDVITKLPDLMQKKKEFPYGAYQLTKKEYELLTMVAEGLSNKEIADVMFLSEGTVRNYLSNLMLKLDVRDRTQAAIFYYKQMQ
>NC_010001.1|WP_012199271.1|1565059_1566136_+|two-component-sensor-histidine-kinase
MNSIYDRLLILICCSFFLDINTNIKYAVIALLVAMAISEFNYVMEKELFLYGSYICYFLLCFFMPQFFAFLPLLLYEAVCFRKKTLSIAVVFTAGYQLVQFDSTFKCLFFIMLHIISVTFAVRTMKQSQLKAQLFKLQDTTKESNMELEARNQELIRQQDTEIYLATLKERNRIAREIHDNVGHMLSRSILIVGAAIAVNKNEESNELLCGLKDTLSDAMNSIRLSVHDLHDGAIDLRTSVEQLVNDFSFCKVELDYDMGNVVNRNVKYCFLTILKESFSNMIKHSNATKVEVLLREHPGMYQLLIKDNGTGGKKTSEEGIGLMNMKDRVNALGGNITITSEKGFRIFVMIPKTQEEK
>NC_010001.1|WP_012199270.1|1562953_1564849_+|ABC-transporter-ATP-binding-protein
MQNKPVIKRKGVLKRLIKTLFEFYPVMLPIVVVCIVFNAVISSIPSIFMQNIISSVESTWQTGDWKSVSGHIAGLVGLLATCYVLSLAASFAFNRMMAIITQGSLKKLRVKMFHGMQNLPIQYFDTHNHGDIMSYYTNDIDTLRQMVSQSIPQLMTSGIIAITVFCIMLYFSVWMTLVVLVGVFFMYKITKKVGGGSAKYFIRQQAALGKVEGYVEETMNGQKVVKVFCHEEECKAGFDEINDALFADAERANKYANTLGPILNNIGNILYVIVALFGGFLLLTDAPNVSISGFAISISIVVPFLNMTKQFSGNINQVSHQINAVVMGLAGASRIFELIDELPEEDEGNVTLVNAREENGAIVECKERTGIWAWKYPHDDGTVSYTKLTGDVRMFDVDFGYVENKTILHNITLYAEPGQKIAFVGATGAGKTTITNLINRFYDIADGKIRYDGININKIKKSDLRRSLGVVLQDTNLFTGTVMDNIRYGKLDATDGECIEAAKLAGAHDFITRLPDGYQTPLTSNGSNLSQGQRQLLAIARAAVADPPVMILDEATSSIDTRTEAIVQRGMDALMKGRTVFVIAHRLSTVKNSDVIMVLEQGHIVERGNHDQLIAEKGKYYQLYTGAFELE
>NC_010001.1|WP_041704100.1|1561218_1562964_+|ABC-transporter-ATP-binding-protein
MYKVLAKSIREFKKHSIKAPVFVSFEVMMECTIPFITAKLVNQIKAGCDFGVIARYGLLLVVMALLSLMFGTIAGTACATASTGFARNLRKDLFYRIQTYSFENIDRFSASSLVTRLTTDVSNVQNAYMMIIRTAIRCPLMLIFSFTMAFVMGGKMAFIFLFVVPVLGFGLFFIIRKVMPLFKKVFRKYDVLNNSIQENVKGMRVVKSYVREDYEKSKFEVAAGDVCADFTRAEKILAFNNPLMQFCLYTVMVFVLYFGSYTIITSRGLDLDVGQFSALLTYSFQILSSLMMLSMVFVMITIASESASRIVEVLQEESTLTSPELSLKEVKNGSIDFEQVSFKYSKKAERMSLEEINLHIKSGETIGIIGGTGSSKSSLIQLIPRLYDATKGVVKVGGEDVKKYDLDSLRNQVAVVLQKNVLFSGTIKENLRWGNKEATEEELVEACKLAGADEFISRFPDGYDTYIEQGGANVSGGQKQRLCIARALLKNPKILIMDDSTSAVDMKTDALIRKSLKEFIPETTKIIIAQRTASVEDADRIIVMEGGTINAIGTHAELIRSNNIYQEVYLSQNKVGDQDAE
>NC_010001.1|WP_012199268.1|1560164_1560710_+|hydrolase
MKREEAWKLLTEFNKEEFHLEHAQIVEQTMKYFAKKLGYNEEEDFWGIVGLLHDLDFEQFPDEHCIKEQEIMRERGVDERIIHAAASHGYGITVDIKPEHEMEKILYAVDELTGLIGAVVIMRPSKSVQDLELKSVKKKYKSKGFAAGCSREVIERGADILGWTLDELLQETIDALKTFRD
>NC_010001.1|WP_012199267.1|1558777_1559959_+|aminotransferase-class-I/II-fold-pyridoxal-phosphate-dependent-enzyme
MKPLSERTANFSDSVIRRMTRISNQYDAINLSQGFPDFNPPKEITDRLANIAGEGPHQYALTWGAENFRYALAKKQEQFSGMKINPDTEIVVTCGSTEAMMAAMMTVTNPGDKVIIFSPFYENYGADVILSGAEPIYVPLKPPAFSFDANELEDAFKKGVKALILCNPSNPCGKVFTYDELKIIADLAIKYDTYVITDEVYEHIIYEPNQHIYMATLPGMRERTIICSSLSKTYSITGWRLGYVIASPFVIERVKKVHDFLTVGAAAPLMEAAVVGLNFGEEYYKELQKHYTQKKDLFIGGLSDLKLNFTDPQGAYYVLVDVSEFNVKDDVRFCEWLAREVGVGAVPGSSFFKEEVNHLIRLHFAKKDETLIGALDRLTDLRKKAIQSNGYFK
>NC_010001.1|WP_012199266.1|1557320_1558700_+|FAD-binding-protein
MAEVNVKILNSIINDGDRILIDKIDDSYLSDALGRIKGHADVVLFPVNVDEVSKIMRYAWENQIPVTPRGAGTNLVGSTVPVEGGIVLDLTRMNQIIEFDEETMTATVEAGVVLADFQEYVEAKGCFYPPDPGEKTATIGGNISTNAGGMRAVKYGVTRDYVRGLEVVLANGEILWVGSKNVKDASGLSLKNLIVGSEGTLAIITKCILKIIPKPEVTLSVLLPYRDVKTAIPGVLTIIKENANPTAIEFIERDVIKLGEDYTGLSFPYPKAGAYILMTFDGRSLELEGNVERVKKSAIKQGALDVLILDSEELLMNVWKIRGCFVKAVEAVSEQEPVDLVVPVNKIVEFISYVSEYEKKSGMRMIRFGHAGDGNIHLCMVRGNRSDDKWEKELQEHLNAIYQKAFLLGGLTSGEHGIGLSKRIFYLKETAPQNLELMRQMKRAFDEREILNRHKTYLA
>NC_010001.1|WP_012199265.1|1556432_1557260_+|metal-ABC-transporter-substrate-binding-protein
MRKLKKLGILALGLTLAFAVTGCGKKDAAKDNKVVKVGVVGESNEMWVPVIEELKKEGIEVQLVTFTDYNTPNAALNGGEVDLNAFQHYAYLNKEKDNNGYKIDSIGDTFISAMNIYSKKIDNLSGIKEGDKVAVPNDATNEGRALKVLEAAALIELNKAAGDSPEVKDITANPFNLELVEVDAANVYALLPDVTIAVINCNYALDNGLNPGKDSLFQDSVSIYAGKNYVNLIAARTEDLDNEVYKKIVKAYQSDAVKDVYADTFKGSYLAAWEE
>NC_010001.1|WP_012199264.1|1555389_1556349_+|L-lactate-dehydrogenase
MAKPRKVIIIGAGHVGSHAGYALAEQGLAEEIIFIDIDREKAKAQALDIYDATVYLPHRVKVKSGDYSDAADADLMVIAVGTNPDKNKGETRMSTLTNTALIIKEVAWHIKNSGFDGMIVSISNPADVITHYLQHLLQYSSNKIISTSTVLDSARLRRAIADAVEIDQKSIYGFVLGEHGESQMVAWSTVSIAGKPILELIKEKPEKYGQIDLSKLSDEARAGGWHILTGKGSTEFGIGASLAEVTRAIFSDEKKVLPVSTLLNGEYGQHDVYASVPTVLGIHGVEEIIELNLTPEEKGKFDASCRTMKENFQYALTLS
>NC_010001.1|WP_012199275.1|1568747_1569437_+|ABC-transporter-ATP-binding-protein
MLIEIKNLKKTYGIGETTVHALKGINLSIEQGEFIAIVGTSGSGKSTLLNLIGGLDYPTEGNILINDRDIYALKPDELTIFRRRSIGFVFQSYNLVPILNVYQNIMLPLQLDNVRPDKKFLELIINTLGISEKKNSLPNNLSGGQQQRVAIARALIAHPQVILADEPTGNLDSKTALEVILLLKQLNETYGQTIIMITHDEEIAQIATRRIHIEDGRLISDTKEVFGHE
>NC_010001.1|WP_012199276.1|1569429_1571748_+|FtsX-like-permease-family-protein
MNKGLIVLASHIIKSKKIRTLAISVSIMLTAILFITVGGITSCIYQSLEISKQLATGSNFHAVIDEVPISKKKEIEEHRLVKNSYVVNHLGQATIGSTKTDEYCEIYSCSDSTILNHMFMNIIEGSYPVNDSQILIDEEYLLKHNIPLNVGSEIYLYNIYSEETRYILSGYYQSTADNTATRPAFTISNDDKETTIYLLLNNPINIEGKIKKIISDVQLVPNYQVNEAFNLAKTHFFNVQSVSIIIFVFLVILSCGFLAIYNIYYIALTGEIKFYGLLETLGTTTKQLKKLVFYQVTMIYCFSFPIGLLLGYFIGWKIISPIFMSLSGKEYIYSFHFSIFIFTVLFTYLTIIISAILPIKRITNMSCISALNEEGIKNCNNSRILMKDRISLWYFAIKNLKRNLKKAIISIISIAISIILFLFTMSMANILLEDSRVQTYDFCIDELKELIDIKKEIHLLLERDLENIQQIPGIKAVIPIYTKKISKGVEDIIIYGIPNEAIEKFKTQWFIGKFDKELFKTGTNAIIYKYEKTSENTTFDTENNIIELDMLKNPYGIQAFEKGNRPILSNFTILNFYSIYDYALYIPFDQFNHEFSDYHIESINIQAEKGYEDIILRQLKSMFDSNIQIRDRREQLSELSERLMALKVTGYSMSVILAFIGILNYLNVTICSLYERRREFALLNIVGMTQKQIFLCLLLECLYYVILAVMISILFGTICFKIIYLIIGMDVKMQFSSIIGMGLILFLTTIFTNFLVYFRMKKILPIEALRSC
>NC_010001.1|WP_012199277.1|1571955_1573083_+|exonuclease-SbcCD-subunit-D
MKFMHLSDLHIGKRVNEFSMIEDQTYILQKILELADEEKPDAVLIAGDVYDKNLPTIEGVNLLDDFLSDLHKRKIPVFMISGNHDSAERLNFASRILRNNEVYIAGTYQGEIARYTLNDGHGPVNIYLLPFVKPAIASVYHEGIESYHDAVKAILAAAKVNKAERNILVAHQFVTAGDISPECCDSENISVGGLDNVDVSVFDDFEYVALGHLHGPQRIGRDTVRYAGSPLKYSFSEAKQKKSVTMVTIDTKGEIKQEYIPLIPLRDMRQLKGPIDELLNPKNYHNGNTKDYIHATLTDEEEIYDAIGRIRSIYPNVMRIEFDNSKTKPNETAKLVAEDVIRKDPLCLFEEFFKNQNNVSMSDEQNEIMKKLLFE
>NC_010001.1|WP_012199278.1|1573126_1576243_+|SMC-family-ATPase
MKPLELAISGFGPFKGEVNVPFEKIGESGLFLISGDTGAGKTTIFDAIAFALFGCASGENRTTDSMRSDYATGDDKTYVKLVFSHKGRRYEVERNPLYQRAKKRGDGFTEEKPNATLIKWDGSVVAGYQPVTNEIMEILSIDYKQFKQIAMIAQGEFMKLLTASSEERGVIFRKVFQTGNYEAMQKKLKSMASELRGECDQLERSMVQYLSGILLSKENEVLEEWKRKPDIHKINDLLELLELDLEEDKSRYDTLEVENKELSGKLVELTTKITLVEEQEKKKQELEQRRLLLEDLRKQSEQIKLNQIDLQNAKKALYQVKPVADAYHKSRVETENLVREIIEQKKRFDIVSEETKKKQAEYHEHEKDKARLEELAIAINQCKEELAQFENLKQLEIKIQSNLKNQDAIVSNEKKIEEQGKLLKGDHSELTKELQGYLSIDQEILECIQIGKDLKSKITKLKSLLDELNRIELESSNLKVLQQEYFKKENSYQTANKEYQTLELAYFREQAGLLAMNLKGEEPCPVCGSTKHPKKAECSKEAPTEAMLNQAKVKLESETVVLNQQSLSVSNQNTKISLMWDNLCVVCEELFEESFGKDKIKDRITEELSRSEEAFLQKNEEYRVLKKNQERRDWCNKRTTEISAALEENVQNIQNLNQEKIAIATVLGQMEGSREQILERRKYATKEECENKHTALLLESNQLRSNLERLEKEFHELRSQWSALKAVIEDNEIKEAKQKVTLEEEEKAYQRKLTETSFDSEESYLACLWTEDKIEQTQKMIEDYEKQVSEQHLMIEKLVNEIKETDSVDIQILKDSRDEINAQKSVCERQKEEVNRRIRNNDQIYKDAKKQLEAKGEIQRKYLSINELSKTANGELTGKVKIAFEQYVQAFYFDTVIEEANKRLRKMTFSQYTLHRADSVNLRSQGGLEIFVLDHYTGKQRTVKSLSGGESFKAALALALGLSDVIQSYAGGIELDSMFIDEGFGSLDSESLEQAIETLISLTSGNRLVGIISHVTELKERIDKKILIHKTMEGSYIK
>NC_010001.1|WP_012199279.1|1576392_1577199_-|phosphotransferase
MEDMLGKLVGSGGTSNVYEWGNNEVIKIYKPRIEENTINNEMYIGQFLNKFSLNIPKCIGSIDYNGKKALIYERIYGNVMAEPLLKGVYDIELANKFAQMHYDIHKKTIEELPSQNEFLKKRILELKDTLGEKATLSLLNLLDDIPNDFKLCHGDYQPLNIIGEANEYIVIDWNGACIGNPILDVAWSYMTLNSPVVEYLLGDLVSDLFSKFAKDYLSYYCKLSGIKQVSVLKCLPIVATRRLYDNNMNDNENSRIEREWLFSFIRKI
>NC_010001.1|WP_012199280.1|1577526_1578117_-|dipicolinate-synthase-subunit-B
MKLSGKNVGVALTGSFCTFAKTIQEIQNIVNEQANVIPIFSFNAQTIDSRFGKAADFMEQITKITGNKPVLTIAGAEPLGPKGMIDIMIIAPCTGNTLAKFCNGITDTPVLMAAKGHLRNQKPLVISLATNDALGINFKNVGYMLNCKNVYFVPFGQDDFNKKPNSMISNTSLIIPTLELAMEGKQIQPIIESPEG
>NC_010001.1|WP_012199281.1|1578133_1579018_-|dipicolinate-synthase-subunit-DpsA
MSQLSKIVFLGGDLRQYYMIKQLMEAGFPVAVYGLDRGEFGDTIYEATTLKEALSFGNIVICPIPVSKNQVDIVSKQTIPDLNLDKLKENLTEGHTLFGGCFNKSMSEFCDKKNIRLYDFMEIESVSIANAIATAEGTIAEAIQRSPVNLHKNECLVLGFGRCAKILADKLKGMGAKVSVGARKEEALAYIDAYGYENIPISELSKHLHRFPFIFNTIPAMVLDSALISYVRKDAVIIDISSKPGGVNFDYCNQLGINASLCLGLPGIYAPKASATILVTALFNCISGSASSKD
>NC_010001.1|WP_012199282.1|1579430_1580060_+|histidine-phosphatase-family-protein
MNIFLIRHGRQSSQLCNVDVDLAVEGREQAKLLGKRLSEYGIDCLYTSDLLRARETAEIAKIYLGNVDYRIRTELREIDFGRMTGNSDEYNNMAFADFKKKRMELSEDLPFPGGECGQDVVDRVRDVLEEMIHSGKQRIAVVTHGGVIRSIVTDILGMPQSKKLLFAVSLENTSITQLRFDRDYQRFYLERFNDFTHLEANNNLLRRNW
>NC_010001.1|WP_012199283.1|1580099_1580870_-|Cof-type-HAD-IIB-family-hydrolase
MIKIIASDMDGTLLLNGCQQVSDRAISIIKQLHDKDILFVAASGRQYPNLYRNFKDVAKHMAFICENGSLVMYQDKVLYKSVMEPKLAKELFQTIYEREGCEVLASGQNTSYLLPKTDSYVHRMKNIVKNNVVVINSFEEIPEDIIKISVYEVDGISHSASYFTSLFGNKLKATISGEQWLDFVNPFVNKGAALSHLLDYLSLSPDEAMAFGDNYNDLEMLSLVSYGYVMDNAVPDIKNRYSYKTSLVEDTLEKLL
>NC_010001.1|WP_012199284.1|1581245_1582583_+|MATE-family-efflux-transporter
MFTKKNLIKLLVPLVIEQLLAVTVGMADTIMIAKRGEEAVSGISAVDAICVLLIGLFSALATGGAVVAAQFIGQKNREKANEAANQLVLSVAFLSVILMVISLIGNEAILHLIYGKLSPLTMQNAKTYFYIVAVSFPFIAIYNAGAALFRAMGNSKISMMTSLWMNIINIVGNSILIFGFGMGVAGAAISTLLSRMIAAIIVIYRLRNQENAICIEYNFRLGYQPEMIRRILKIGIPNGLENSIFQFGKLLVGSLIATYGEVGMTANAIGNSVASFNCIPGSAIGLAMITVVGQCVGAGKLDEAKKYTWKLLKYASISMLVLNIIVLLSINPIVNLFEAQAATKELATKLLIYHCICCIIIWPSAFTLPNALRAANDVKYTMFTSISSMWIFRVGFSFVLAQTFGLGVFGVWVAMTIDWVFRAILFLSRMISGGWKKHARMEHAR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010001_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010001_4

3365564-3365671

Orphan

Consensus_repeat	Method
TAATTCATAATTTCATTACATGAC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010001_4

>merge|NC_010001|4|3365564-3365671|CRISPRCasFinder
TAATTCATAATTTCATTACATGACCGCTGTAACACATCCAGCCTAATATACAATTCTATTATAAGCACGGTAATGAATCCACCCTAATTCATAATTTCATTACATAAC

>NC_010001|4|4|3365564-3365671|CRISPRCasFinder
TAATTCATAATTTCATTACATGAC	CGCTGTAACACATCCAGCCTAATATACAATTCTATTATAAGCACGGTAATGAATCCACCC
TAATTCATAATTTCATTACATAAC

Protein	Signature genes	Signature genes Name	Protein_function
NC_010001.1\|WP_012200782.1\|3374688_3375612_-\|tRNA-pseudouridine(55)-synthase-TruB	unknown	unknown	gnl\|CDD\|178886
NC_010001.1\|WP_012200773.1\|3361897_3362767_-\|sugar-specific-permease-EIIA	unknown	unknown	gnl\|CDD\|376324
NC_010001.1\|WP_041703701.1\|3352390_3352645_+\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200774.1\|3362997_3365094_-\|polyribonucleotide-nucleotidyltransferase	unknown	unknown	gnl\|CDD\|236995
NC_010001.1\|WP_012200768.1\|3353394_3356235_-\|DNA-translocase-FtsK	unknown	unknown	gnl\|CDD\|224588
NC_010001.1\|WP_012200771.1\|3358909_3360187_-\|O-acetylhomoserine-aminocarboxypropyltransferase	unknown	unknown	gnl\|CDD\|225428
NC_010001.1\|WP_012200784.1\|3376672_3377083_-\|30S-ribosome-binding-factor-RbfA	unknown	unknown	gnl\|CDD\|234787
NC_010001.1\|WP_012200776.1\|3367215_3367779_-\|folate-family-ECF-transporter-S-component	unknown	unknown	gnl\|CDD\|275311
NC_010001.1\|WP_012200780.1\|3372247_3373639_-\|PLP-dependent-aminotransferase-family-protein	unknown	unknown	gnl\|CDD\|224089
NC_010001.1\|WP_012200778.1\|3369632_3369899_-\|30S-ribosomal-protein-S15	unknown	unknown	gnl\|CDD\|180170
NC_010001.1\|WP_012200779.1\|3370083_3371748_-\|Na/Pi-cotransporter-family-protein	unknown	unknown	gnl\|CDD\|224202
NC_010001.1\|WP_012200775.1\|3365703_3366978_-\|bifunctional-folylpolyglutamate-synthase/dihydrofolate-synthase	unknown	unknown	gnl\|CDD\|223362
NC_010001.1\|WP_012200781.1\|3373607_3374561_-\|bifunctional-riboflavin-kinase/FAD-synthetase	unknown	unknown	gnl\|CDD\|235536
NC_010001.1\|WP_012200769.1\|3356415_3357237_-\|undecaprenyl-diphosphate-phosphatase	unknown	unknown	gnl\|CDD\|234712
NC_010001.1\|WP_012200783.1\|3375686_3376661_-\|bifunctional-oligoribonuclease/PAP-phosphatase-NrnA	unknown	unknown	gnl\|CDD\|223691
NC_010001.1\|WP_012200766.1\|3351403_3352327_+\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_081428552.1\|3360352_3361735_-\|insulinase-family-protein	unknown	unknown	gnl\|CDD\|223685
NC_010001.1\|WP_012200777.1\|3368014_3369376_-\|MATE-family-efflux-transporter	unknown	unknown	gnl\|CDD\|240539
NC_010001.1\|WP_157668816.1\|3357416_3358253_-\|peptidase-S14	unknown	unknown	gnl\|CDD\|223811
NC_010001.1\|WP_041703702.1\|3352712_3353135_+\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|366181

Protein	Function_ID	Function_description	E-value
NC_010001.1\|WP_012200782.1\|3374688_3375612_-\|tRNA-pseudouridine(55)-synthase-TruB	gnl\|CDD\|178886	PRK00130, truB, tRNA pseudouridine synthase B; Provisional.	1.76022e-117
NC_010001.1\|WP_012200773.1\|3361897_3362767_-\|sugar-specific-permease-EIIA	gnl\|CDD\|376324	pfam00358, PTS_EIIA_1, phosphoenolpyruvate-dependent sugar phosphotransferase system, EIIA 1.	1.03161e-09
NC_010001.1\|WP_012200774.1\|3362997_3365094_-\|polyribonucleotide-nucleotidyltransferase	gnl\|CDD\|236995	PRK11824, PRK11824, polynucleotide phosphorylase/polyadenylase; Provisional.	0
NC_010001.1\|WP_012200768.1\|3353394_3356235_-\|DNA-translocase-FtsK	gnl\|CDD\|224588	COG1674, FtsK, DNA segregation ATPase FtsK/SpoIIIE and related proteins [Cell division and chromosome partitioning].	4.73123e-174
NC_010001.1\|WP_012200771.1\|3358909_3360187_-\|O-acetylhomoserine-aminocarboxypropyltransferase	gnl\|CDD\|225428	COG2873, MET17, O-acetylhomoserine sulfhydrylase [Amino acid transport and metabolism].	0
NC_010001.1\|WP_012200784.1\|3376672_3377083_-\|30S-ribosome-binding-factor-RbfA	gnl\|CDD\|234787	PRK00521, rbfA, 30S ribosome-binding factor RbfA.	2.49982e-45
NC_010001.1\|WP_012200776.1\|3367215_3367779_-\|folate-family-ECF-transporter-S-component	gnl\|CDD\|275311	TIGR04518, conserved_hypothetical_protein, ECF transporter S component, folate family. Members of this model are the multiple membrane-spanning S (specificity) component of ECF (energy coupling factor) type uptake transporters. All seed members were found in the vicinity of the bifunctional enzyme folC, involved in making active cofactor from imported folate. However, some species have multiple members of this family, suggesting some diversity of function. [Transport and binding proteins, Unknown substrate].	2.8608e-43
NC_010001.1\|WP_012200780.1\|3372247_3373639_-\|PLP-dependent-aminotransferase-family-protein	gnl\|CDD\|224089	COG1167, ARO8, Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs [Transcription / Amino acid transport and metabolism].	1.49178e-124
NC_010001.1\|WP_012200778.1\|3369632_3369899_-\|30S-ribosomal-protein-S15	gnl\|CDD\|180170	PRK05626, rpsO, 30S ribosomal protein S15; Reviewed.	7.07444e-53
NC_010001.1\|WP_012200779.1\|3370083_3371748_-\|Na/Pi-cotransporter-family-protein	gnl\|CDD\|224202	COG1283, NptA, Na+/phosphate symporter [Inorganic ion transport and metabolism].	1.01162e-120
NC_010001.1\|WP_012200775.1\|3365703_3366978_-\|bifunctional-folylpolyglutamate-synthase/dihydrofolate-synthase	gnl\|CDD\|223362	COG0285, FolC, Folylpolyglutamate synthase [Coenzyme metabolism].	9.25104e-141
NC_010001.1\|WP_012200781.1\|3373607_3374561_-\|bifunctional-riboflavin-kinase/FAD-synthetase	gnl\|CDD\|235536	PRK05627, PRK05627, bifunctional riboflavin kinase/FAD synthetase.	7.91014e-119
NC_010001.1\|WP_012200783.1\|3375686_3376661_-\|bifunctional-oligoribonuclease/PAP-phosphatase-NrnA	gnl\|CDD\|223691	COG0618, COG0618, Exopolyphosphatase-related proteins [General function prediction only].	3.06041e-58
NC_010001.1\|WP_012200769.1\|3356415_3357237_-\|undecaprenyl-diphosphate-phosphatase	gnl\|CDD\|234712	PRK00281, PRK00281, undecaprenyl-diphosphate phosphatase.	5.03523e-104
NC_010001.1\|WP_081428552.1\|3360352_3361735_-\|insulinase-family-protein	gnl\|CDD\|223685	COG0612, PqqL, Predicted Zn-dependent peptidases [General function prediction only].	3.14289e-91
NC_010001.1\|WP_012200777.1\|3368014_3369376_-\|MATE-family-efflux-transporter	gnl\|CDD\|240539	cd13134, MATE_like_8, Uncharacterized subfamily of the multidrug and toxic compound extrusion (MATE) proteins. The integral membrane proteins from the MATE family are involved in exporting metabolites across the cell membrane and are responsible for multidrug resistance (MDR) in many bacteria and animals. A number of family members are involved in the synthesis of peptidoglycan components in bacteria.	1.29777e-101
NC_010001.1\|WP_157668816.1\|3357416_3358253_-\|peptidase-S14	gnl\|CDD\|223811	COG0740, ClpP, Protease subunit of ATP-dependent Clp proteases [Posttranslational modification, protein turnover, chaperones / Intracellular trafficking and secretion].	9.88977e-27
NC_010001.1\|WP_041703702.1\|3352712_3353135_+\|GNAT-family-N-acetyltransferase	gnl\|CDD\|366181	pfam00583, Acetyltransf_1, Acetyltransferase (GNAT) family. This family contains proteins with N-acetyltransferase functions such as Elp3-related proteins.	3.4745e-14

>NC_010001.1|WP_012200774.1|3362997_3365094_-|polyribonucleotide-nucleotidyltransferase
MYKSFSMELAGRTLSVDVGRVAAQANGAAFMHYGDTVVLSTATASDKPREGIDFFPLSVEYEEKLYAVGKVPGGFNKREGKASENAILTSRVIDRPMRPLFPKDYRNDVTLNNLVMSVDPDCSPELTAMLGSAISVAISDIPFDGPCATTQVGLVDGELVFNPTAAQKAVSDLALTVASTRDKVIMIEAGANEVPEDKMLEAIFAAHEVNQEVIQFIDKIVAEFGKEKHGYISCEIPEEMFAAIKEVVTPEQMEEAVFTDVKQVREENIREIKNKLAEVFEESNPEWLHLIDEAVYKYQKKTVRKMILKDHKRPDGREIHQIRRLAAEVDMLPRVHGSGMFTRGQTQILTVTTLAPLSEAQKLDGLDEAEKSKRYMHHYNFPSYSVGETKPSRGPGRREIGHGALAERALIPVLPSEAEFPYAIRTVSETMESNGSTSQASVCASTLSLMAAGVPIKKQVAGISCGLVTGDTDDDYLVLTDIQGLEDFFGDMDFKVAGTHDGITAIQMDIKIHGLTRAIIEEAIRRTKEAREYIINEVMTPAIAEPRTEVGKYAPKIIQIQIDPQKIGDVVGQRGKTINAIIEQTGVKIDINDEGAVSVCGTDKDMMDKAINMIRTIVTEFEEGQVFEGKVISIKEFGAFLEFAPGKEGMVHISKISKERINHVEDVLTLGDVVKVVCLGKDKMGRISFSIKDYKEEN
>NC_010001.1|WP_012200773.1|3361897_3362767_-|sugar-specific-permease-EIIA
MAQYDYIAIWVGGIALAVLVIMIIAFLIYRKRHVNHHSMKEQKSRKMKDLPAKKKMVKNVQGNDSQTKKITPVVTLDSGNNTSGNQRLDGARISHRRNHPDRVAEESMWKEKKEQEEDEILKKMENERKNKVFMIYSPCNGEMGDAVENVTDAKECGLDYPGVIIAPSDDKVYAPINGRISWKSENPNMVSIQSDTGVEVLLSVLKEDEVLQTEVFTMKTAQGAYIGMGEQLCQFTQGLIRKGNRIYKMKMELSSYQEGQLLLVKRFSYISHGDKIITLKTERNAVETA
>NC_010001.1|WP_081428552.1|3360352_3361735_-|insulinase-family-protein
MGLIMVKVNVLKNGIKVVTEELSYLRTVSFGVWIRVGSAKENKENNGIAHMIEHMLFKGTKTKTAKEIADIIASIGDDVNAFTSKEQTCYYGTTITESLSILVELIADMLCNSLLSEEDLRKEKRVIYEEIDMYEDSADDMVHEILQQNVFKDQPLGYIISGAKKNVRSFKRMQLIDFMAKHYVAENIVISVAGNFSEKELMDQLERCFGGIRGTNPKALNSLTLLKKKKDELLLAPYEEKFQKKHDDIPSYHTCFCQRHKDNEQLHINLAYPSIPLGSDESVVFAVVNSMLGGSNNSRLFQRIREELSLVYSIYTYGSAFEKAGLYHLDITVNPQQAFRVLRETKLVMDEFLTTPITKEELDTHKAQVKTEFILGSESAKARMNSNAKSVLVRGYVKTLDEIIEELNRLSAEDIIRFANKVWGESSASLCVIGAESGVSFRALKKEYQNLFFINPNTKA
>NC_010001.1|WP_012200771.1|3358909_3360187_-|O-acetylhomoserine-aminocarboxypropyltransferase
MEYNKLSTICVQAGYTPKNGEPRVLPIYQSTTFKYDSADTVGKLFDLQEEGFFYTRLANPTVDCVEKKIAALEGGIGAMCTSSGQSATLLAILNICNAGDHIISSSAIYGGTTNLLAVTLKKLGIEVTFVNPDATKEELEVAVKENTKLYFAETLANPSLVVIDIKLWAEVARQNGVPLFIDNTFATPINCRPLEFGANIVIHSTSKYMDGHASALGGVIVDGGNFDWNNGKFLGLTTPDESYHGVIYTEFAGKAAFITKARTQLMRDMGVMPSPNNAFLLNLGLETLHLRVKRHCENALIVAKWLSENDKITWVNYPSLEGNKYYALAKEYMPNGTSGVISFGVRGGREAAMKFMDQLKLAAIVVHVADARTSVLHPASTTHRQLSDEQLISAGVSADLIRMSIGIEDVADIIADINQALDSVE
>NC_010001.1|WP_157668816.1|3357416_3358253_-|peptidase-S14
MLSAENQEVTNKELVKETPLKDDANNTQKKSPTGDKQVKGNIKKEKLEEENLKNENEKLKGQKIQDYGQATLEDNGKNHKIHLLSIIGEIEGHECLSQNAKTTKYEHVLPQLATIEDDTETDGLLILINTVGGDVSCGLALAEMIASLSKPTVSLVIGDSHSIGVPLAVATNYSFIVPTGTMIVHPVRMSGMVIGAPQTYDYFKLIQDRIVGFVSSHSKIKKEKLEQLMLNTGMLSKDLGTILVGDEAVAEGIINEVGGIKQAIEKLHQMIEEKNSNR
>NC_010001.1|WP_012200769.1|3356415_3357237_-|undecaprenyl-diphosphate-phosphatase
MDFIELLKVIFLGIVEGITEWLPISSTGHLLLVDEFLKVNLSKDFMSMFNVVIQLGAILAVVVLFFKKLWPFSKEEKNFIKKDTFTLWFKIVVACIPGIVMIPFDSKIEDLFFNPQTIATTLILYGILFIIIENRNAGKQPKVAKLSDITYQMAFMIGLFQILAMIPGTSRSGATIIGAMLFGASRYVAAEFTFFLAIPTMFGASLLKLLKFGFTFTGAEIVALITGMLTAFIVSIIVIKFLMGYIKKNNFKVFGWYRIVLGAIVAGYFLLAR
>NC_010001.1|WP_012200768.1|3353394_3356235_-|DNA-translocase-FtsK
MASKQTGTRSKQSQRQTSSKPKTSNSKRTNQTKGKPTASRSSKTQRNKQVQEYLAENESIRDEVILIVTALTSFLLLLSNFDLCGPVGKQIKTFFFGLLGHFTYLFPFALFFFIAFAVSNRGSVIARRKIIGSIVLIFTLTSLIQLLEGYNGEMKYFDYYLQSAKNSNGGGLIGGTLVSILCPLFGTIASVIILIVMLLLCFIFITGKALLTLMREKGEQKLNDHRQLRENYAKEFKQLDMEDETYGEERRKPRIVNLQKQANEKVKSFFDQDEDDEDDLKYDEMEDGPVNFLEELKRRGKDKKQNQKKEVVEEPISVFEMTEIKSEQNDGLNSETNFSPSEDMLQEVNSIYEDELNRKFGQNEDNNEVEINTSYEVKNIKPLNANTEFYKDDAVKETKDQNVNVDSNLKDVSAEASVDSSSHMPEGNNDNKAKPKEVKAESGSEDILTVDQKLEPLKKYEFPPIELLGKPKANQRGMSDKDLKETAIKLQKTLESFGVRVTITNISCGPAVTRYELQPEQGVKVSKITGLSDDIKLNLAAADVRIEAPIPGKAAVGIEVPNKENSAVMLRELLESKEFNSHPSDIAFAVGKDIGGQAVVTDIAKMPHLLIAGATGSGKSVCINTLIMNILYKANPADVRLIMVDPKVVELSVYNGIPHLLIPVVTDPKKASAALNWAVMEMTDRYKKFAEYGVRDLKGYNEKVAEIAHLNDPAFTKLPQIVIIVDELADLMMVAPGEVEDAICRLAQMARAAGLHLIIATQRPSVNVITGLIKANVPSRIAFSVSSAIDSRTILDGSGAEKLLGKGDMLFFPSGYPKPVRVQGAFVSDKEVSAVVDFLKSQNHQITYNEEINDKIKNAQVSSAAGGASGGNDRDEYFIEAGKFIIEKDKASIGMLQRVYKIGFNRAARIMEQLSDAGVVGPEEGTKPRKILMSMEEFEQYVDEYV
>NC_010001.1|WP_041703702.1|3352712_3353135_+|GNAT-family-N-acetyltransferase
MRFSLWPHHNENELYNEMLQILEGKTFYKNELSWTVFVAVRENGSLGGFIEITIYPQLDLCDSKPIGYIEGWYVDEDLRNSGVGKRLVDIAQKWAVENECTEIASDVEVDNKVSQLAHQALGFNKYHEANECIFYKKSLI
>NC_010001.1|WP_041703701.1|3352390_3352645_+|hypothetical-protein
MSKFVKGIIAMIFFYIFNMFMTIIGQVIFFGDSFTLSYHLFTYTGLMTLCGVIVVCTCIIIEKLNEIKNLYNRVDIENNTKINE
>NC_010001.1|WP_012200766.1|3351403_3352327_+|hypothetical-protein
MKKRKLLVIFLFCLLALPFPFSLISWIGRSHLETTYQSDMPMLTISEYDIYVDTRTATSAELARSGVSYEAVAAIKSNDIEDELTRLSALPDEELSNRGYNTGQIEILHDYTGERIETNPKLRGIFADVKCNFYQYTANNISLSLKIVWEWTNKPMLSGISITDIVVIRWQGTNTAGLPMNLALNSSGSSCMINYYNPYESYQSQSSVSISTTDPYGHAYAKFPMSNGIANGSSYAKTGTLITKIDRTGTDAIKEAAFVFAYGHTTVALTNPSLSLPDPFGIYFSFGVTTMCKEVIRMNSSGIITRY
>NC_010001.1|WP_012200775.1|3365703_3366978_-|bifunctional-folylpolyglutamate-synthase/dihydrofolate-synthase
MNYQEAIKYLRSYKRNTGELSLKNLNKLLDYMDHPEKKLKFIHVAGTNGKGSTCKMLSSILRCAGLKVGLFTSPFLETENEQIQINGEVISNEDFAKVCKKVKDFTTYLMLDEIPTEFELTTAMAFQYFYDTKCDLVVLEVGLGGELDATNVIETPLVSVLTNIGIDHVDYLGTTLKEIACKKAGIIKENGIVVSYEQEKEVEEVIKLTCEERHNKLVFAEFSELKLHQENLSRQKFSYKQNTNLSLSLIGEHQRKNAAVALEVIAQLQTLGYKISENAISEGMNYVTWPGRFEVLCKQPLVILDGGHNVQCVEAFSEVLKQFIPGKKAIVILGVLADKDYKGMIPYLVPFTKRFIAVTPKNTRALPSEQLAEELSKHHPLVSHNATPVEGIMAALRDAREDDIICVIGSLYMAAEIRDCFIGE
>NC_010001.1|WP_012200776.1|3367215_3367779_-|folate-family-ECF-transporter-S-component
MLNQEKNVKNKDLKKGKKVFTLETFIVLALLVAIEVILTRFLSLKEWNIRFSFGFIPVVIAAILYGPIASATVAACSDFLGAILFPMGAYFPGFTITAFISGIVYGLFLHKKQSLPNIVGAAVVNQFFCGLVINSYWLSIISGKSTFWGLIPIRSIQSAVMSIVIISVTYVISKTIVPIIKKAIVIM
>NC_010001.1|WP_012200777.1|3368014_3369376_-|MATE-family-efflux-transporter
MNLIHEMKQDKAFLKKAAMIAIPIALQGLLNNVLNFVDTLMISRLDTTTVAAVGIANKIFFVVSLLLFGICSGSCILTSQYWGMRDIKNIKRVVGLSMLLGVTSAFLFTLVSFLKPQLVMSIFTNSEPTIIIGAKYLKIVCISYVITAVTQIFMSALRSVNQVKLPVVISLVAIVTNVILNYVLIFGKFGFPELGVEGAAIATLIARIVEVVAMILLVYYKKSPVSISVSHLFFYDKDLYSIYFKTASPVIMNEFMWGLGITMYSLAYGRMGDNAMAAITITQNIEQILQVVFMGISNATAVILGNELGAGKLKDAELHAKFILILQAMVTVVIIALGIVFMNPMIAVFHMEPVVSASIRKCLLVFLAYLFFKVFNTVNIVGILRSGGDTKAALFLDVTGVWLIGIPMAFLGGLVFHFPIEAVYAMVLSEEIYKMILGIPRYRKKKWLRNIVA
>NC_010001.1|WP_012200778.1|3369632_3369899_-|30S-ribosomal-protein-S15
MISKEKKQEIINAYGRNANDTGSPEVQIALLTERIAELTEHLKINKKDHHSRRGLLKMVGQRKGLLEYLKKTNLEGYRELIARLGLRK
>NC_010001.1|WP_012200779.1|3370083_3371748_-|Na/Pi-cotransporter-family-protein
MKMESLLALLAGLGLFLYGMKLMSDGLEKAAGARLRSILEMCTKNQFIGMIVGILFTAVVQSSSATTVLVVSFVNAGLLNLMQATGVILGANIGTTVTAQLIAFNLSAVAPVFLMVGVCMVMFVKKPMVKRIGEVVLGFGMLFFGMSIMSGSMDSLRSSEQVMNLIASMDNPFLGVLVGFVITAIVQSSSATVGIVLVMASQGLIPLNICFYIILGCNMGSCVSALLASIGSKKTAKRAAWIHLLVNIIGSFAIFVILLFFENQIKDFIIAISGGNTNEVVDGVSQTIARQVANTHLIFKVFEVAICFPITKYIAKAATLIVPGEDKKVDNMHLEFITDFTSFQTTAAVPNAINEIVRMAQITFHNLSIALSSLLNSDEKQISEVYETESSINYLSREITNYLVNANQYSLPIDDRKVLASLFHVVNDIERIGDHAENVADFAKQAIEGNLHFSSEAVEEINKMATAVQKLLSYSIEMFENKNREYLEEILKFENSIDDMERRFQKNHVVRLTKNACSAETGMIFSDLLSNLERVADHGTNIAFSILDEDPEDI
>NC_010001.1|WP_012200780.1|3372247_3373639_-|PLP-dependent-aminotransferase-family-protein
MLIIPLNLGNKVPLYEQIYEFIKKEIKTGKLPVATKLPSSRNLAQSLQISRSTVELAYQQLISEGYIESIPKSGYYVQGIADLIQITERKKALGKEKVEKVKRLRYDFSPFAVDLSEFPFHTWRKLSNQCMNDMNQSLFLLGENQGDHSLREAIVAYLHSSRGVKVEASQVIVGAGADYLLVLLSQIFGNDQIIAMENPVYKRAYRIFQGVPYPIQPITVNTDGISIEELMNTDATVVYVTPSHQYPLGAVMPIKRRLELLQWAAKGDNRYIIEDDHDSEFRYKGKPIPSLQGIDENDRVIYLGTFSRAIAPAIRMGFMVLPQRLYQVYKDKYSFYASTVSRIDQAIVCEFLNGGYFERHVNKMRKRYKMKHDLLLHELKSYEDNITITGENAGLHIVVSFHTSLTEEEILKKVRKKEIELYPLSKHYITDYKPTYPTFLMGFANLSEELIIEGVNLLMKELF
>NC_010001.1|WP_012200781.1|3373607_3374561_-|bifunctional-riboflavin-kinase/FAD-synthetase
MEYIYGSTDFKYHNTCVTLGKFDGLHRGHQLLLSELAKFEQQGLTSVMFTFDYHPGNLFSEKEIDLIYTEEEKKELLSRLGPKVLISYPFTEETASMEPEDFIKEVLIGKLDAKAIVIGADYRFGRKRKGDAALLKKYSIMYGYELVICEKLTYHDNVISSTRIREELKNGQMESVNEMLGHPYTIMGTVVTGNKIGRTIGVPTVNLLPAEHKLLPPNGVYASIIKFQENTYYGVTNIGYKPTVGAGQKLGVETHIFGFTGDLYGKIIEVELYRYERPETKFTSIEELKQRVQLDIQNVKEFFARGCYADNTTQSRE
>NC_010001.1|WP_012200782.1|3374688_3375612_-|tRNA-pseudouridine(55)-synthase-TruB
MNGIINVYKEKGFTSFDVCAKLRGILKQKKIGHTGTLDPDAEGVLPVCVGNATKLCDLLTDKDKVYEAVLTLGIITDTEDMTGEVLERRLVTATYDRVLEVVEQFTRTYDQIPPMYSAIKVNGQKLYELARQGKVIERKPRTVTIHAIDILGVTPLEEQPEIVHEVRMRVSCSKGTYIRSLCRDIGEALQCGGCMKSLIRTQVSIFTLENTLRLAEIEECVKNQTLEQVLMPVDKLFLSMPKVVVKKESCKFLYNGNQLVEDNFTWEKVSDQINIDKIRVYDSEDVFTGIYEYDEKKNCYQPVKMFL
>NC_010001.1|WP_012200783.1|3375686_3376661_-|bifunctional-oligoribonuclease/PAP-phosphatase-NrnA
MKRFEEDIRKANRIGITGHVRPDGDCTSSCLALYNYLQENYNADRTKTIDLHLEPIAEPFRFLTSSNCIQSDYKDEEPYDLFFALDCGSLDRLGAAQYYAMQAKKTVNIDHHISNTGFASVTLMVSDSSSTCEVLYDLFDVDKISKATAEALYLGIVHDTGVFKHSNTTEKTMAIAGKLITLGATPNKIIDETFYQKTFVQNQVLGRCLLESILLLDGKIIVSSISKRAQNFYNVVPSDLDGVIDQLRITKGVEVAIFLREDDVQEYKVSMRSNGIVDVSKIAVFFGGGGHILAAGCSMKGSLHDVINNLTIGIEHQLKNAEKC
>NC_010001.1|WP_012200784.1|3376672_3377083_-|30S-ribosome-binding-factor-RbfA
MRKNSIKNTRINQEVQKELSMLISRELKDPRINPMTSIVAVEVAPDLKTAKVYISVLGDELSQKNTLAGLKSAAPFLRGQLARGINLRNTPELLFVVDQSIEYGVSMSKLINEVNAGNHKASDEEESDDKGHEDEQ

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010001_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010001_5

3417248-3417362

Orphan

Consensus_repeat	Method
ATAACGAAGTTTAACTATTGAAACAATTCAG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010001_5

>merge|NC_010001|5|3417248-3417362|CRISPRCasFinder
ATAACGAAGTTTAACTATTGAAACAATTCAGAAGGAAATAATAATTCCGAATTAAGGAGAATGGTAAAATGGAGGCTTTCGAATATAACGAAGTTTAACTATTGAAGCAATTCAG

>NC_010001|5|5|3417248-3417362|CRISPRCasFinder
ATAACGAAGTTTAACTATTGAAACAATTCAG	AAGGAAATAATAATTCCGAATTAAGGAGAATGGTAAAATGGAGGCTTTCGAAT
ATAACGAAGTTTAACTATTGAAGCAATTCAG

Protein	Signature genes	Signature genes Name	Protein_function
NC_010001.1\|WP_012200812.1\|3409246_3411358_-\|cell-division-protein-FtsA	unknown	unknown	gnl\|CDD\|223918
NC_010001.1\|WP_012200810.1\|3406582_3407377_-\|MBL-fold-metallo-hydrolase	unknown	unknown	gnl\|CDD\|293819
NC_010001.1\|WP_012200824.1\|3434216_3435191_-\|glycosyltransferase-family-4-protein	unknown	unknown	gnl\|CDD\|340832
NC_010001.1\|WP_012200821.1\|3429862_3430933_-\|glycosyltransferase-family-2-protein	unknown	unknown	gnl\|CDD\|133005
NC_010001.1\|WP_085953463.1\|3401613_3402696_-\|cell-envelope-like-function-transcriptional-attenuator-common-domain-protein	unknown	unknown	gnl\|CDD\|367673
NC_010001.1\|WP_012200815.1\|3415540_3416119_-\|zf-HC2-domain-containing-protein	unknown	unknown	gnl\|CDD\|379219
NC_010001.1\|WP_012200816.1\|3417679_3418021_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|237171
NC_010001.1\|WP_012200811.1\|3407492_3409214_-\|sensor-domain-containing-diguanylate-cyclase	unknown	unknown	gnl\|CDD\|143635
NC_010001.1\|WP_012200808.1\|3404791_3406156_-\|PFL-family-protein	unknown	unknown	gnl\|CDD\|180009
NC_010001.1\|WP_012200820.1\|3423036_3429723_-\|chromosome-segregation-ATPase-like-protein	unknown	unknown	gnl\|CDD\|224117
NC_010001.1\|WP_012200807.1\|3403223_3404684_-\|aminoacyl-histidine-dipeptidase	unknown	unknown	gnl\|CDD\|349885
NC_010001.1\|WP_012200813.1\|3411738_3412359_-\|dephospho-CoA-kinase	unknown	unknown	gnl\|CDD\|234620
NC_010001.1\|WP_041704515.1\|3412479_3415452_-\|DNA-polymerase-I	unknown	unknown	gnl\|CDD\|235591
NC_010001.1\|WP_012200823.1\|3433802_3434108_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200819.1\|3421709_3422930_-\|alpha-clostripain-like-protein	unknown	unknown	gnl\|CDD\|281416
NC_010001.1\|WP_012200809.1\|3406174_3406447_-\|ACT-domain-containing-protein	unknown	unknown	gnl\|CDD\|178923
NC_010001.1\|WP_012200826.1\|3437021_3437582_+\|ferritin-like-domain-containing-protein	unknown	unknown	gnl\|CDD\|153097
NC_010001.1\|WP_012200818.1\|3420321_3421581_-\|glycosyltransferase	unknown	unknown	gnl\|CDD\|133029
NC_010001.1\|WP_012200825.1\|3435345_3436719_-\|glycosyltransferase	unknown	unknown	gnl\|CDD\|224137
NC_010001.1\|WP_012200817.1\|3419248_3419596_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|378946

Protein	Function_ID	Function_description	E-value
NC_010001.1\|WP_012200812.1\|3409246_3411358_-\|cell-division-protein-FtsA	gnl\|CDD\|223918	COG0849, ftsA, Cell division ATPase FtsA [Cell division and chromosome partitioning].	2.98572e-59
NC_010001.1\|WP_012200810.1\|3406582_3407377_-\|MBL-fold-metallo-hydrolase	gnl\|CDD\|293819	cd07733, YycJ-like_MBL-fold, uncharacterized subgroup which includes Bacillus subtilis YycJ and related proteins; MBL-fold metallo hydrolase domain. Includes the uncharacterized Bacillus subtilis YycJ protein. Members of this subgroup belong to the MBL-fold metallo-hydrolase superfamily which is comprised mainly of hydrolytic enzymes which carry out a variety of biological functions. The class B metal beta-lactamases (MBLs) from which this fold was named are only a small fraction of the activities which are included in this superfamily. Activities carried out by superfamily members include class B beta-lactamases, hydroxyacylglutathione hydrolases, AHL (acyl homoserine lactone) lactonases, persulfide dioxygenases, flavodiiron proteins, cleavage and polyadenylation specificity factors such as the Int9 and Int11 subunits of Integrator, Sdsa1-like and AtsA-like arylsulfatases, 5'-exonucleases human SNM1A and yeast Pso2p, ribonuclease J and ribonuclease Z, cyclic nucleotide phosphodiesterases, insecticide hydrolases, and proteins required for natural transformation competence. Classical members of the superfamily are di-, or less commonly mono-, zinc-ion-dependent hydrolases, however the diversity of biological roles is reflected in variations in the active site metallo-chemistry.	3.54279e-58
NC_010001.1\|WP_012200824.1\|3434216_3435191_-\|glycosyltransferase-family-4-protein	gnl\|CDD\|340832	cd03802, GT4_AviGT4-like, UDP-Glc:tetrahydrobiopterin alpha-glucosyltransferase and similar proteins. This family is most closely related to the GT4 family of glycosyltransferases. aviGT4 in Streptomyces viridochromogenes has been shown to be involved in biosynthesis of oligosaccharide antibiotic avilamycin A. Inactivation of aviGT4 resulted in a mutant that accumulated a novel avilamycin derivative lacking the terminal eurekanate residue.	9.96735e-91
NC_010001.1\|WP_012200821.1\|3429862_3430933_-\|glycosyltransferase-family-2-protein	gnl\|CDD\|133005	cd02511, Beta4Glucosyltransferase, UDP-glucose LOS-beta-1,4 glucosyltransferase is required for biosynthesis of lipooligosaccharide. UDP-glucose: lipooligosaccharide (LOS) beta-1-4-glucosyltransferase catalyzes the addition of the first residue, glucose, of the lacto-N-neotetrase structure to HepI of the LOS inner core. LOS is the major constituent of the outer leaflet of the outer membrane of gram-positive bacteria. It consists of a short oligosaccharide chain of variable composition (alpha chain) attached to a branched inner core which is lined in turn to lipid A. Beta 1,4 glucosyltransferase is required to attach the alpha chain to the inner core.	4.14916e-45
NC_010001.1\|WP_085953463.1\|3401613_3402696_-\|cell-envelope-like-function-transcriptional-attenuator-common-domain-protein	gnl\|CDD\|367673	pfam03816, LytR_cpsA_psr, Cell envelope-related transcriptional attenuator domain.	3.68702e-48
NC_010001.1\|WP_012200815.1\|3415540_3416119_-\|zf-HC2-domain-containing-protein	gnl\|CDD\|379219	pfam13490, zf-HC2, Putative zinc-finger. This is a putative zinc-finger found in some anti-sigma factor proteins.	0.00384379
NC_010001.1\|WP_012200816.1\|3417679_3418021_-\|hypothetical-protein	gnl\|CDD\|237171	PRK12678, PRK12678, transcription termination factor Rho; Provisional.	2.71673e-06
NC_010001.1\|WP_012200811.1\|3407492_3409214_-\|sensor-domain-containing-diguanylate-cyclase	gnl\|CDD\|143635	cd01949, GGDEF, Diguanylate-cyclase (DGC) or GGDEF domain. Diguanylate-cyclase (DGC) or GGDEF domain: Originally named after a conserved residue pattern, and initially described as a domain of unknown function 1 (DUF1). This domain is widely present in bacteria, linked to a wide range of non-homologous domains in a variety of cell signaling proteins. The domain shows homology to the adenylyl cyclase catalytic domain. This correlates with the functional information available on two GGDEF-containing proteins, namely diguanylate cyclase and phosphodiesterase A of Acetobacter xylinum, both of which regulate the turnover of cyclic diguanosine monophosphate. Together with the EAL domain, GGDEF might be involved in regulating cell surface adhesion in bacteria.	1.44146e-51
NC_010001.1\|WP_012200808.1\|3404791_3406156_-\|PFL-family-protein	gnl\|CDD\|180009	PRK05313, PRK05313, hypothetical protein; Provisional.	0
NC_010001.1\|WP_012200820.1\|3423036_3429723_-\|chromosome-segregation-ATPase-like-protein	gnl\|CDD\|224117	COG1196, Smc, Chromosome segregation ATPases [Cell division and chromosome partitioning].	1.55097e-22
NC_010001.1\|WP_012200807.1\|3403223_3404684_-\|aminoacyl-histidine-dipeptidase	gnl\|CDD\|349885	cd03890, M20_pepD, M20 Peptidase D has specificity for beta-alanyl-L-histidine dipeptide. Peptidase M20 family, Peptidase D (PepD, Xaa-His dipeptidase; X-His dipeptidase; aminoacylhistidine dipeptidase; dipeptidase D; Beta-alanyl-histidine dipeptidase; pepD g.p. (Escherichia coli); EC 3.4.13.3) subfamily. PepD is a cytoplasmic enzyme family characterized by its unusual specificity for the dipeptides beta-alanyl-L-histidine (L-carnosine or beta-Ala-His) and gamma-aminobutyryl histidine (L-homocarnosine or gamma-amino-butyl-His). Homocarnosine has been suggested as a precursor for the neurotransmitter gamma-aminobutyric acid (GABA), acting as a GABA reservoir, and may mediate anti-seizure effects of GABAergic therapies. It has also been reported that glucose metabolism could be influenced by L-carnosine. PepD also includes a lid domain that forms a homodimer; however, the physiological function of this extra domain remains unclear.	0
NC_010001.1\|WP_012200813.1\|3411738_3412359_-\|dephospho-CoA-kinase	gnl\|CDD\|234620	PRK00081, coaE, dephospho-CoA kinase; Reviewed.	1.56692e-65
NC_010001.1\|WP_041704515.1\|3412479_3415452_-\|DNA-polymerase-I	gnl\|CDD\|235591	PRK05755, PRK05755, DNA polymerase I; Provisional.	0
NC_010001.1\|WP_012200825.1\|3435345_3436719_-\|glycosyltransferase	gnl\|CDD\|224137	COG1216, COG1216, Predicted glycosyltransferases [General function prediction only].	1.3302e-37
NC_010001.1\|WP_012200819.1\|3421709_3422930_-\|alpha-clostripain-like-protein	gnl\|CDD\|281416	pfam03415, Peptidase_C11, Clostripain family.	6.19969e-05
NC_010001.1\|WP_012200809.1\|3406174_3406447_-\|ACT-domain-containing-protein	gnl\|CDD\|178923	PRK00194, PRK00194, ACT domain-containing protein.	6.31628e-45
NC_010001.1\|WP_012200826.1\|3437021_3437582_+\|ferritin-like-domain-containing-protein	gnl\|CDD\|153097	cd00657, Ferritin_like, Ferritin-like superfamily of diiron-containing four-helix-bundle proteins. Ferritin-like, diiron-carboxylate proteins participate in a range of functions including iron regulation, mono-oxygenation, and reactive radical production. These proteins are characterized by the fact that they catalyze dioxygen-dependent oxidation-hydroxylation reactions within diiron centers; one exception is manganese catalase, which catalyzes peroxide-dependent oxidation-reduction within a dimanganese center. Diiron-carboxylate proteins are further characterized by the presence of duplicate metal ligands, glutamates and histidines (ExxH) and two additional glutamates within a four-helix bundle. Outside of these conserved residues there is little obvious homology. Members include bacterioferritin, ferritin, rubrerythrin, aromatic and alkene monooxygenase hydroxylases (AAMH), ribonucleotide reductase R2 (RNRR2), acyl-ACP-desaturases (Acyl_ACP_Desat), manganese (Mn) catalases, demethoxyubiquinone hydroxylases (DMQH), DNA protecting proteins (DPS), and ubiquinol oxidases (AOX), and the aerobic cyclase system, Fe-containing subunit (ACSF).	4.00924e-20
NC_010001.1\|WP_012200818.1\|3420321_3421581_-\|glycosyltransferase	gnl\|CDD\|133029	cd04186, GT_2_like_c, Subfamily of Glycosyltransferase Family GT2 of unknown function. GT-2 includes diverse families of glycosyltransferases with a common GT-A type structural fold, which has two tightly associated beta/alpha/beta domains that tend to form a continuous central sheet of at least eight beta-strands. These are enzymes that catalyze the transfer of sugar moieties from activated donor molecules to specific acceptor molecules, forming glycosidic bonds. Glycosyltransferases have been classified into more than 90 distinct sequence based families.	1.86879e-26
NC_010001.1\|WP_012200817.1\|3419248_3419596_+\|hypothetical-protein	gnl\|CDD\|378946	pfam12788, YmaF, YmaF family. This family of proteins contain 6 HXH motifs and is named after the B. subtilis YmaF protein. It seems likely that these are involved in metal binding. The function of this protein is unknown.	3.6371e-36

>NC_010001.1|WP_012200815.1|3415540_3416119_-|zf-HC2-domain-containing-protein
MDCLNAQRLITPFIKDELSMTELEGFLAHVKECPVCREELEVYYALLTAIKLLDEDKEMSNNFTEELNRKIRSCEEHIRRNKRNKVNRRIVFMLVVVGVTIVSSLSIRKLTEIPAAPTKPPYILRYSGIPRRYDPMFRIRTDYDTMACEYVKKVKDGRLEFYRKNREEYEIVRQIYVNQRELIEIDNIENSD
>NC_010001.1|WP_041704515.1|3412479_3415452_-|DNA-polymerase-I
MNDIINNKQDSKEGDYLLVIDGSSLLSTQFFGNLPKEIMFAKTMEEKEKYFPKIMQTATGVYTNAVYGFLRVLLKIIKDQKPTYLAVAWDISRNTFRREIYPDYKGNRGETLEPLKDQFKLCQHVLKEMGIVQFMDERYEADDFSGTLCQKFEEEVPIRVMTKDNDYLQLITERTNLWLIHSTAKKTDELYEKYGLSKKELNVPDRTFLFTPELVEKEFGIEPSSVPSLKGIGGDSSDNIKGVPGVGEATAVALIKEYKTVENLYEILNNLDETGKKEINEYWKTLGIKRTPINALLKISDTELVGEKAAILSKTLATIKKDIDLKDLGLEQLRIHINTENAQKCFNELEFKTIKMDNAEVEDSSINNLRFEADKIKITSNLEEVETLFSNLIKLWEKNQKKLKKTKKSRNDKSDSKITIKEIKKPEYASEDAVGIKLIMENKSLVGISVYYGSEASFIIPCEGFITPDFLTSKLNGLLEKKITLAIFDIKKYLPYLNANEESPCFDVTIAGYLLEPDASTYEYQTIAEKYLELDLPSEKEVFSGQTYASLSLLDQDQYKKAACYESYVAHHIYPVLLKLLSERGLLPLFAGIEMPLVYTLYDMEQRGIRVDTNGLKDYSDQLGVSIVELEKQIFELVGVEFNINSPKQLGEILFQRLGLSYGKKTKTGYSTSAEVLEKLSSEHPVIKLILQYRQLTKLKSTYADGLVSYVEGDGRIHGTFNQTIAATGRLSSTEPNLQNIPIRMELGRKIRKVFIPEDGYLFLDADYSQIELRLLAHMSNDARLIEAYRQAQDIHRLTASEVFHTPFDEVTSAQRSNAKAVNFGIVYGISSFSLGQDLDITRKEAEEYINKYFMTYPGVKTYLDGLIEEGKETGVVKTLYGRIRPVPNLTNSNFMKRSAEERIAMNSPIQGTAADIMKLAMIHVNQVLKERKLKSRLLLQIHDELLVETHESEVEEVAKIMKEEMQQAASLSVPLEVEVANGNNWYEAK
>NC_010001.1|WP_012200813.1|3411738_3412359_-|dephospho-CoA-kinase
MERHGYFMKVIGLTGGIGSGKSRVADLLQREFLVYVIYTDDIARDQMKQGGCSYEKVVKQFGTEILDEGGEIDRNKLAKIIFQKEDLVKLLNSLTHPNVHLEVLHQIKEAKSKGKLYSAIIVETALLFEAGYQDFCDEIWYVHAPIGDRMKRLKESRGYSEEKIESIIKKQKSEEFFLKNSTVIIENGNDVLQDELRLQCERYLTT
>NC_010001.1|WP_012200812.1|3409246_3411358_-|cell-division-protein-FtsA
MDAITYPENMVFGLDIGTRSIVGTVGYKQNEHDFIVVSQSVRYHETRAMLDGQIHDINKVAETIREVKKDLEKQLGKKLKEVCIAAAGRVLKTVTVKAEYNLINEGIISEEHIRTLELNGVEKAYEELRKEMNSGDGNFYCVGYSVVHYYLNDYVMTNLEDHKGSKIGVDLLATFLPEEVIEGLYAAVGKAGLEVVNLTLEPIAAINVAIPDKFRLLNIALIDVGAGTSDICITKDGSIIAYGMIPKAGDALTNILMQRYLVDFKTAETMKTSILKKKTVSYKDIMGLSNKVTREEIYEAVRDEIDHITAQIAEQILYLNGGKSVSAVFVVGGGGKLPYFVEALSSKLNLPKERVALRGEEVLNMVQFLQKEIKKDPLLVTPIGICLNYYENRNNFIYAMVNGERIKLYDNSHLTIVDAALAIGFPNELLFPRRGKALHYTINGSERLARGESGEGAIIILNGKQVSLNASITQNDIIQITESTAGADATLMVAKLPEYKSTITFAVNHKEVICPKYALANDILVSDTYQIKDGDRLELLNHYTLEQLLEFMDLPYRKGITINHQSAKPQDRVYENFTIYYPLHEDIAASYEEVAAMISEEDFKEYSLGEDALLKDDFLRDGISEEVDEKKVEKASSISVYVNKTSIILKGKDKFILVDILDVYPFDLSTAHGSKVVLKINGDEAEFTSPLNNQDVIEMYWEK
>NC_010001.1|WP_012200811.1|3407492_3409214_-|sensor-domain-containing-diguanylate-cyclase
MSDDLLVFRKKFSRGLVLVTSVFWLYTLIQLVGNLSEHASFGILVTSGALIIDILAEHTKLFKKRIAWMILRSIELISFSICFFVTIGSINSMFFGIELIAVMLQLLMLTDFLDVYSRAITLTTMSLPAIIYLISIILLKPERQEEFFGMVCAYLSLIFVVMLISELISEVFIATDKRIFEIRRFSEQTKETNEALRNQQEKFRKVNEELGIQKIMLEAAYHKINSANTENQTLYQVIRYISTELEIGNLMKLITEAIYEAMGLDVCTIILEPDIAGNKQVTYEIHSRLGKGFYEQMSNRIEQGCIEEYMKEEGNYIDNQVQPGKYSFLKDRKINSLLIVPLVREKKVIGALLCGHSQFEYFNGNIIFFETVVAQLLVAIHNASLYSKMQQMAIRDSLTGIYNRGQLNVILEQYTKRASEQNKSLSVALLDIDLFKKINDTYGHLFGDEVIKMVASKLQEVANCFHGIAARYGGEEFVIVLPDIGILDFYHIVTSLKETIDTTTLYFNEDEINVKVSVGISSYPETSLSCQQLLNRADGAMYYSKRNGRNSITVDNDIIQDYVRKNKETRGEL
>NC_010001.1|WP_012200810.1|3406582_3407377_-|MBL-fold-metallo-hydrolase
MKMCSIASGSSGNCIYIGSNETNLLVDAGVSGKRIESGLLSAGVDPNSLDGILITHEHSDHIQGIGVLARRYKLPIYGTVETINAMLRLSSVGRIEESQLRFVKPDEALCIGDILVEPFSISHDASNPVCYTFTNGGHKIGMATDLGTYDSYTISKLCGAEVLYLEANHDVNMLMVGSYPYHLKQRILGERGHLSNETSAKLICELLHDDLQHVLLAHMSKENNYAELAFETVRYEVEQSVATSSKMPVITVANRDIPSEMVII
>NC_010001.1|WP_012200809.1|3406174_3406447_-|ACT-domain-containing-protein
MKKTIITVVGHDCVGIIAKVCTYLANNKINILDISQTIVSGYFNMMMIVDTIESSKDFSQLADELEEIGKEIGVVIKAQREDIFDMMHRL
>NC_010001.1|WP_012200808.1|3404791_3406156_-|PFL-family-protein
MINFNEVLETNKMIEQENLDVRTITLGISLLDCISSNLEELNQNIYDKITTVAKDLVTTGKKIERQFGIPVVNKRISVTPIAMIGASACKTPSDFVTIAKTLDRAANTVGVNFIGGYSALVSKGMTSSERLLIESIPEALAVTERVCSSVNVGSTKTGINMDAVKLLGQIMLDTAEYTKEKDSLGCAKLVIFCNAPDDNPFMAGAFHGVTEADAIINVGVSGPGVVKTALESVRGEDFGTLCETIKKTAFKITRVGQLVAMEASKMLNIPFGIVDLSLAPTPAVGDSVAEILQEIGLEYPGAPGTTAALALLNDSVKKGGVMASSYVGGLSGAFIPVSEDQGMIDAVRAGCLTLEKLEAMTCVCSVGLDMIAIPGDTKATTISGIIADEMAIGMINQKTTAVRLIPVIGKKVGDIAEFGGLLGYAPIMPVNNFSCDNFVNRGGRIPAPIHSFKN
>NC_010001.1|WP_012200807.1|3403223_3404684_-|aminoacyl-histidine-dipeptidase
MEGVYQQLSSMDYKNVLKYFVEISAVPRGSGHNEKISEYLVNFAKDHNLKYVQDETLNVIIYKEATPGYENHTPVVIQGHMDMVCLKAEDSNHDFLTEGLELIVEGNSIRANKTTLGGDNGIAIAFGLALLSDENLEHPALEVLITTDEETGMDGAKALNPDHLKGRYMINVDSEEEGTVLVGCAGGLRFYAELPLNFTEKEGKRVKLVIRGLKGGHSGAEIHNNRTNATILLARAIMELKEKYDFLLCDMKGGDKDNAIPSLAQAEAIVSAEEVDAFVASVKELEEKYQKELLASEPNVKFECQIFEEEKAKVIHPSSMMKVLFAILQAPNGVQVMSSEIAGLVESSLNLGIFAIEDDLAIFHYSVRSGKSSYKYFISDKLSFMFGFLGAEYESNADYPAWEYKKDSKLRDLFLNVHKELFNKDAEVMSIHAGLECGLISEKIPDMDIISIGPDMKDIHTPMEQLDIPSTIRVYQTVEKLLQKMK
>NC_010001.1|WP_085953463.1|3401613_3402696_-|cell-envelope-like-function-transcriptional-attenuator-common-domain-protein
MGNNKNNKKNNRKKVLTITFSILGALTLVIGLIVGTPAGRKLIYNAVGGYVSGRIDNVDSENKKPSNIFGDNKDDDIENTDPNLRKEKYVANFLISGIEEIGGGGRTDSMMIVSVNKKDNTIKLTSIMRDCYVEIPGHSPNKLNAAYSLGGMDLLVDTIQQNFKIKIDGYATVNFNAFESIVDILGGVDIELGSAEANYLNTTNYISNPAYRKVRTGMNHLNGNQALGYSRVRKVVTLGGANNDFGRTLRQRRVLNAIFEEYKSKNLFELMSIMDQVLPFVKTDLSGSEISDLLQAVVENRIFTIENHRIPANEYYTAARNERGAVLILDFEANIKELYRVIFLDEEVTPTPEVLIDIPN
>NC_010001.1|WP_012200816.1|3417679_3418021_-|hypothetical-protein
MDRNFENPMERNRIDNERRDEIERRNGFERRNEEERRNGFERRNEEERRNGFERRNEDERRNEFDRRNEPEMREEFRRRMDFDRRHENERRDEFDRRHDFDRRFPFWWLFFVR
>NC_010001.1|WP_012200817.1|3419248_3419596_+|hypothetical-protein
MDNPNQNLSNNAKQTHVHEIQGSVEIAEQNDPHSHRFATISGEAIPYGMDHYHEVSFKTDFFREHYHEFQGHTTTAIPIGNSHLHYLESVTTANAGHKHGFRFATLIDDPTSGQH
>NC_010001.1|WP_012200818.1|3420321_3421581_-|glycosyltransferase
MAYYSFVMVCYNNWNFTVKAVKSFFDYLNPIHQNKGIELIIVNNGSNDETEAGIEEFRIKFKEVSEIKTVHLEKNLGYIAGVNIGLSYCSGEIITLLNNDLIFCPGWFDSLANIFDADLTVGAATPLLTNGSGAENIELEYKNPEMKLAFFKSKETMNYYAEKIMEKNHKAIINSNRLVGTCIAFRKDILLLVGGMDFWFGIGMFDDDDFSIRINLAGYKTVIVGGSFVYHIGSATFSKYTQINNAAVISNKKKFLRKWKIKCTENAEGLYSRDDVHLRTNYIRKKHFIPFEFSQFKKPLEISSAKKTDIKRILFVADWTNLKSGWVKELERNLLHTDAKEEINLWIPSEYFSKNEVENEVNKINSTDSKVNYIEKDINPEDLLEFLSSFDTVIPVTDDFVNRYIIYLAKQLNIEVARL
>NC_010001.1|WP_012200819.1|3421709_3422930_-|alpha-clostripain-like-protein
MQNDQQKEWTILFYLNGNNELQPEMLQSKLFIEKEGSDGTVNIVIQYSFVEKHIIEIIRPKYRFNNDAEGQSGVIRYSAAGPDSTFHEELRNINMADPMCFYNFLEWGITNYPAQKYILVLGGHVFQYIGLMPDYSQDLPYLMGYPEMVNVLNLIKKNIGKKIDLLVLDTCYVNRIEMLYELGKEPDPPVSNVLTYINGGPASGLPYDLLIKTIKKINSTVTDKFLLSKLMENLNYDLIAYEIDHNKLESIKNLYSDLADCRLNFNSSSCSFPYELLTNVDENLPWFDLRKKLQDYMPELTICYNNISRKPFGHFYVSAQTISDQHKIDLYHRLAFAKKNSWSKLLYGLHSPINTSDEAETNVHPTILKSNDLYALISAMNPNLGLNENNEILSKLIEYKGWKWKN
>NC_010001.1|WP_012200820.1|3423036_3429723_-|chromosome-segregation-ATPase-like-protein
MPYNDKYYNKYGLIKNDNDYNDEDDDRHLCHDGNDRYDCGEDDDRYDCHEDDDRYDCHEDDDRYDCDEDDDRYDCHEDNDRYDCHEDDDRYDCDEDDDRYDCDEDDRYDCDKDCDEICDNDECCFLCDTELIICLLTNRKFGLKEIKREVRRIETIVGIIETIVVEIQTQVAVIDTNVARIESTIGEVATQVAIIDTNVARIETSIIEIQTQVAVIDTNVARIESTIGEVATQVAIIDTNVARIETSIIEIQTQVAVIDTNVARIESTIGEVATQVAIIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVAVIETIVGRIETSVVEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVAVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVAVIDTNVAKIETAITEIETQVAVIDTNVAKIESAVAEIETQVSVIDTNVAKIETAITEIQTQVAVIDTNVAKIETAITEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVAVIDTNVAKIETAITEIETQVAVIDTNVAKIESAVAEIETQVSVIDTNVAKIETAITEIQTQVAVIDTNVARIETSITEIETQVAVIDTNVAKIESAVAEIETQVSVIDTNVAKIETAITEIQTQVAVIDTNVAKIETAITEIQTQVAVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVSVIETIVGRIETSVVEIQTQVAVIDTNVARIETSIIEIQTQVAVIDTNVARIESAVAEIETQVSVIDTNVAVIETIVGRIETSVVEIQTQVSVIDTNVARIESAVSEVETQISVIDTNVSVIETIVGRIETSVVEIQTQVSVIDTNVARIETSIIEIQTQVAVIDTNVARIESSVAEIETQVSVIDTNVAVIETILVEIQTQVAVIDTNVARIESAIGEIPTQVATIDTNVATIETIVSRIESSVAEIETQVSVIDTNVAVIETIVGRIETSVVEIQTQVSVIDTNVARIETSVIEIQTQVAVIDTNVARIESSVAEIETQVSVIDTNVAVIETILVEIQTQVAVIDTNVARIESAIGEIPTQVATIDTNVATIETIVSRIESSVAEIETQVSVIDTNVAVIETIVGRIETSVVEIQTQVSVIDTNVARIETSVIEIQTQVAVIDTNVARIESSVAEIETQVSVIDTNVAVIETILVEIQTQVAVIDTNVARIESAIGEIPTQVATIDTNVATIETIVSRIESSVAEIETQVSVIDTNVAVIETILVEIQTQVAVIDTNVARIESAIGEIPTQVATIDTNVATIETIVSRIESSVAEIETQVSVIDTNVAVIETILVEIQTQVAVIDTNVARIESAIGEIPTQVATIDTNVATIETIVSRIESSVAEIETQVSVIDTNVAVIETILVEIQTQVAVIDTNVARIESAIGEIPTQVATIDTNVATIETIVSRIESSVAEIETQVSVIDTNVAVIETILVEIQTQVAVIDTNVARIESAIGEIPTQVATIDTNVATIETIVSRIESSVAEIETQVSVIDTNVAVIETILVEIETQVAVIDTNVARIQTEVSVIDTNVAKIETIVTIIESSVAEIQTQVSVIDTNVAIIETLLGHLNEIETQVAIIDTNVARIETLLGIGSCTRLTTGPVLRDNGTNSIVVKVLNNSIATVTDVSSILFNIETCPKLAVETVVFDPLPPKCSDHFVFGLTENIQDEFEIEFLGVTTEIFVSVAARHESPNAPFTSNSIVEPNSFRFSELSCTNDPQ
>NC_010001.1|WP_012200821.1|3429862_3430933_-|glycosyltransferase-family-2-protein
MITISLCMIVRNEEDNISKCLISVRDIVDEIIIVDTGSTDKTKEIVGLFTNEIYDFEWINDFSAARNFSFSKATKDYILWLDADDVLLEADRIKLKRVKEILDPSIDVVMMNYNYAFDEKGNVLLSHFRERLLKRAKNFLWNDPIHEFISFEGKVVNSDITITHKKSHMNNRRNLNILEAMLAEGKEFSPRNMFYYAREKLNVNEYEGAIEYFNKMLDSEKGLPADCISSCIYLAKAYKAKNDRKNMLKALIRSFEYDTPRAEICCQLGYYYKDIEDYKRAIFWFDLAMKLEKPESKWGPILHEYWGFIPCIELCLCYYKLGNIDEAIKFNDKAAEYKPEHPSVLQNKKAFGNIKN
>NC_010001.1|WP_012200823.1|3433802_3434108_-|hypothetical-protein
MPGPPTTPDAIIILLDINVVGGTFADSTIALTTQVINNGEAPIQIGLRYLLDYMIDFDDGPTFQQLGPNGPILVNETQFVLPTFEDYEIEDNDVSPNHCCL
>NC_010001.1|WP_012200824.1|3434216_3435191_-|glycosyltransferase-family-4-protein
MKIVQVAPDVYPIPPVNYGGIERVMYDLIEELVRRGHEVFLYAPKGSNTSARLIPYQHEKSWSQHEILKYVSATLPEDIDIIHDHTHASIIGRVGLPVPTVCTEHFSANCPVKYPVYASRTVQERYGGNQGFFIHHGIRLEDFEFKESKEDYLFYIGKLDESKGPQFAIKVSERTNKMLILAGPIHDTAYFDKAIAPVIKANPNIIFIGEVGGRRKQDLLKNAACVLFPTLCQESFGLVAIEAMACGTPVLSFPSGAVPEVLQGVPDFICTNVDEMVQKVLSGDYPKPQLLRDYVKNNFSIELMADRYIKVYMQVLALEHLYYS
>NC_010001.1|WP_012200825.1|3435345_3436719_-|glycosyltransferase
MENPVTSIIILAHNNFESLRKCIDSIRKYTTDGTYEIIVVDNHSTDGTAQWLQSQQDIRAIINTDNVGCPRGYNQAINIALGDAVLLMNNDIIVTPNWLKNLIQCLYSADDIGAVGPITNNCPIQQLPVKYSSIEEMFEFAKTYNISNPETWEERLKLISFCLLIKKSAIEKIGLLDEGFTPGNFEDDDLSFSLRIARYKLMLCKDTFIHNFGYITFKDYGSQSLETFKLNQKKFEDKWGFNSLYSTFARQELINFINKPKTQSFAVLDVGCACGNTLLQIKNTYPNSILYGIELNKGASEIAKTVANVTADNIESLDVHFDENYFDYILFGDVLEHLVDPWQVLLNIKRYLKPDGKILASIPNVMHISIVKKLIHGNWTYEDAGILDRTHMRFFTLKEIHKMFRDSGYSDIYVAGKLLMESKEDFELIENLCKLSNPDLSKQFEIYQYLIKASVKP
>NC_010001.1|WP_012200826.1|3437021_3437582_+|ferritin-like-domain-containing-protein
MHYNDYYRYNESRYDYDEPEFYDIRITANNNNNNNTATINEDIYSYPENFSNAIALIEEAIAGEEEDRLFYTYLINNAPTAEDRQIISGIRDNELRHHSLFLKLYSELTGQTAPQLPGERFVPPSSYCEGLQRSIIGEESAVAKYRQILFAMQNRVHINMLTEIITDEIRHGILYTYLYSKNNCNI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010001_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010001_6

3488497-3488597

Orphan

Consensus_repeat	Method
CTATTTTTATCTACTAATCTATTCCTATTTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010001_6

>merge|NC_010001|6|3488497-3488597|CRISPRCasFinder
CTATTTTTATCTACTAATCTATTCCTATTTTTATCTACTAATCTATCCTATTTCTATCTACTAATCTATCCTATTTTTATCTACTAATCTATCCTATTTTA

>NC_010001|6|6|3488497-3488597|CRISPRCasFinder
CTATTTTTATCTACTAATCTATTCCTATTTT	TATCTACTAATCTATCCTATTTCTATCTACTAATCTATC
CTATTTTTATCTACTAATCTATCCTATTTTA

Protein	Signature genes	Signature genes Name	Protein_function
NC_010001.1\|WP_012200848.1\|3463754_3468050_+\|2-hydroxyacyl-CoA-dehydratase	unknown	unknown	gnl\|CDD\|226109
NC_010001.1\|WP_041703710.1\|3490640_3492038_-\|alpha-glucosidase/alpha-galactosidase	unknown	unknown	gnl\|CDD\|133433
NC_010001.1\|WP_012200857.1\|3486358_3488224_+\|hydroxylamine-reductase	unknown	unknown	gnl\|CDD\|235391
NC_010001.1\|WP_012200856.1\|3484851_3486042_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376711
NC_010001.1\|WP_081428555.1\|3468153_3470802_+\|response-regulator	unknown	unknown	gnl\|CDD\|274362
NC_010001.1\|WP_012200851.1\|3471603_3472380_-\|imidazole-glycerol-phosphate-synthase-subunit-HisF	unknown	unknown	gnl\|CDD\|234996
NC_010001.1\|WP_012200861.1\|3493176_3493494_-\|phage-holin	unknown	unknown	gnl\|CDD\|378239
NC_010001.1\|WP_012200867.1\|3504706_3505006_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_157668819.1\|3476823_3478179_-\|aminotransferase-class-V-fold-PLP-dependent-enzyme	unknown	unknown	gnl\|CDD\|99746
NC_010001.1\|WP_012200852.1\|3472388_3473003_-\|imidazole-glycerol-phosphate-synthase-subunit-HisH	unknown	unknown	gnl\|CDD\|237288
NC_010001.1\|WP_012200862.1\|3500320_3500605_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200850.1\|3470924_3471602_-\|uracil-DNA-glycosylase	unknown	unknown	gnl\|CDD\|235376
NC_010001.1\|WP_041703711.1\|3500993_3501404_-\|PH-domain-containing-protein	unknown	unknown	gnl\|CDD\|367615
NC_010001.1\|WP_012200866.1\|3503711_3504386_-\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NC_010001.1\|WP_012200860.1\|3492313_3493177_-\|NLP/P60-protein	unknown	unknown	gnl\|CDD\|366353
NC_010001.1\|WP_012200865.1\|3502212_3503712_-\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|274368
NC_010001.1\|WP_012200858.1\|3488736_3490245_+\|hydroxylamine-reductase	unknown	unknown	gnl\|CDD\|235391
NC_010001.1\|WP_012200864.1\|3501424_3502117_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200854.1\|3475325_3476234_-\|chemotaxis-protein-CheV	unknown	unknown	gnl\|CDD\|223905
NC_010001.1\|WP_012200853.1\|3473424_3475293_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|236545

Protein	Function_ID	Function_description	E-value
NC_010001.1\|WP_012200848.1\|3463754_3468050_+\|2-hydroxyacyl-CoA-dehydratase	gnl\|CDD\|226109	COG3581, COG3581, Uncharacterized protein conserved in bacteria [Function unknown].	2.1405e-151
NC_010001.1\|WP_041703710.1\|3490640_3492038_-\|alpha-glucosidase/alpha-galactosidase	gnl\|CDD\|133433	cd05297, GH4_alpha_glucosidase_galactosidase, Glycoside Hydrolases Family 4; Alpha-glucosidases and alpha-galactosidases. Glucosidases cleave glycosidic bonds to release glucose from oligosaccharides. Alpha-glucosidases and alpha-galactosidases release alpha-D-glucose and alpha-D-galactose, respectively, via the hydrolysis of alpha-glycopyranoside bonds. Some bacteria simultaneously translocate and phosphorylate disaccharides via the phosphoenolpyruvate-dependent phosphotransferase system (PEP-PTS). After translocation, these phospho-disaccharides may be hydrolyzed by the GH4 glycoside hydrolases such as the alpha-glucosidases. Other organsisms (such as archaea and Thermotoga maritima) lack the PEP-PTS system, but have several enzymes normally associated with the PEP-PTS operon. Alpha-glucosidases and alpha-galactosidases are part of the NAD(P)-binding Rossmann fold superfamily, which includes a wide variety of protein families including the NAD(P)-binding domains of alcohol dehydrogenases, tyrosine-dependent oxidoreductases, glyceraldehyde-3-phosphate dehydrogenases, formate/glycerate dehydrogenases, siroheme synthases, 6-phosphogluconate dehydrogenases, aminoacid dehydrogenases, repressor rex, and NAD-binding potassium channel domains, among others.	9.03465e-178
NC_010001.1\|WP_012200857.1\|3486358_3488224_+\|hydroxylamine-reductase	gnl\|CDD\|235391	PRK05290, PRK05290, hybrid cluster protein; Provisional.	0
NC_010001.1\|WP_012200856.1\|3484851_3486042_+\|hypothetical-protein	gnl\|CDD\|376711	pfam01996, F420_ligase, F420-0:Gamma-glutamyl ligase. F420-0:Gamma-glutamyl ligase (EC:6.3.2.-) is an enzyme involved in F420 biosynthesis pathway. It catalyzes the GTP-dependent successive addition of multiple gamma-linked L-glutamates to the L-lactyl phosphodiester of 7,8-didemethyl-8-hydroxy-5-deazariboflavin (F420-0). This reaction produces polyglutamated F420 derivatives. GTP + F420-0 + n L-glutamate -> GDP + phosphate + F420-n.	1.56072e-38
NC_010001.1\|WP_081428555.1\|3468153_3470802_+\|response-regulator	gnl\|CDD\|274362	TIGR02956, sensor_protein_TorS, TMAO reductase sytem sensor TorS. This protein, TorS, is part of a regulatory system for the torCAD operon that encodes the pterin molybdenum cofactor-containing enzyme trimethylamine-N-oxide (TMAO) reductase (TorA), a cognate chaperone (TorD), and a penta-haem cytochrome (TorC). TorS works together with the inducer-binding protein TorT and the response regulator TorR. TorS contains histidine kinase ATPase (pfam02518), HAMP (pfam00672), phosphoacceptor (pfam00512), and phosphotransfer (pfam01627) domains and a response regulator receiver domain (pfam00072). [Signal transduction, Two-component systems].	1.27526e-82
NC_010001.1\|WP_012200851.1\|3471603_3472380_-\|imidazole-glycerol-phosphate-synthase-subunit-HisF	gnl\|CDD\|234996	PRK02083, PRK02083, imidazole glycerol phosphate synthase subunit HisF; Provisional.	1.73185e-173
NC_010001.1\|WP_012200861.1\|3493176_3493494_-\|phage-holin	gnl\|CDD\|378239	pfam09682, Phage_holin_6_1, Bacteriophage holin of superfamily 6 (Holin_LLH). Phage_holin_6_1 or Holin_LLH identifies a family of phage holins from a number of phage and prophage regions of Gram-positive bacteria. Like other holins, it is large for holins (about 100-160 amino acids) with stretches of hydrophobic sequence and is encoded adjacent to lytic enzymes. Holin LLH family is found in phage of Firmicutes and have an N-terminal transmembrane segment.	1.10462e-27
NC_010001.1\|WP_157668819.1\|3476823_3478179_-\|aminotransferase-class-V-fold-PLP-dependent-enzyme	gnl\|CDD\|99746	cd06453, SufS_like, Cysteine desulfurase (SufS)-like. This family belongs to the pyridoxal phosphate (PLP)-dependent aspartate aminotransferase superfamily (fold I). The major groups in this CD correspond to cysteine desulfurase (SufS) and selenocysteine lyase. SufS catalyzes the removal of elemental sulfur and selenium atoms from L-cysteine, L-cystine, L-selenocysteine, and L-selenocystine to produce L-alanine; and selenocysteine lyase catalyzes the decomposition of L-selenocysteine.	8.32434e-100
NC_010001.1\|WP_012200852.1\|3472388_3473003_-\|imidazole-glycerol-phosphate-synthase-subunit-HisH	gnl\|CDD\|237288	PRK13141, hisH, imidazole glycerol phosphate synthase subunit HisH; Provisional.	7.4858e-124
NC_010001.1\|WP_012200850.1\|3470924_3471602_-\|uracil-DNA-glycosylase	gnl\|CDD\|235376	PRK05254, PRK05254, uracil-DNA glycosylase; Provisional.	1.41712e-141
NC_010001.1\|WP_041703711.1\|3500993_3501404_-\|PH-domain-containing-protein	gnl\|CDD\|367615	pfam03703, bPH_2, Bacterial PH domain. Domain found in uncharacterized family of membrane proteins. 1-3 copies found in each protein, with each copy flanked by transmembrane helices. Members of this family have a PH domain like structure.	5.30742e-11
NC_010001.1\|WP_012200866.1\|3503711_3504386_-\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	1.25894e-84
NC_010001.1\|WP_012200860.1\|3492313_3493177_-\|NLP/P60-protein	gnl\|CDD\|366353	pfam00877, NLPC_P60, NlpC/P60 family. The function of this domain is unknown. It is found in several lipoproteins.	2.92759e-07
NC_010001.1\|WP_012200865.1\|3502212_3503712_-\|HAMP-domain-containing-protein	gnl\|CDD\|274368	TIGR02966, Phosphate_regulon_sensor_protein_PhoR, phosphate regulon sensor kinase PhoR. Members of this protein family are the regulatory histidine kinase PhoR associated with the phosphate ABC transporter in most Proteobacteria. Related proteins from Gram-positive organisms are not included in this model. The phoR gene usually is adjacent to the response regulator phoB gene (TIGR02154). [Signal transduction, Two-component systems].	2.52489e-48
NC_010001.1\|WP_012200858.1\|3488736_3490245_+\|hydroxylamine-reductase	gnl\|CDD\|235391	PRK05290, PRK05290, hybrid cluster protein; Provisional.	0
NC_010001.1\|WP_012200854.1\|3475325_3476234_-\|chemotaxis-protein-CheV	gnl\|CDD\|223905	COG0835, CheW, Chemotaxis signal transduction protein [Cell motility and secretion / Signal transduction mechanisms].	9.67907e-38
NC_010001.1\|WP_012200853.1\|3473424_3475293_-\|hypothetical-protein	gnl\|CDD\|236545	PRK09510, tolA, cell envelope integrity inner membrane protein TolA; Provisional.	7.96405e-06

>NC_010001.1|WP_012200857.1|3486358_3488224_+|hydroxylamine-reductase
MSQMFCFQCQETAGNKGCTLNGVCGKTAALANMQDLLIYVSKGLSEVTTKLRLEGGNISSEVNHYITLNLFTTITNANFDDEVFYQRVKETLAMKENLINQLNNKENLSEAALWTLPVDSTKDEIESMIAKSNSDEVGVLATKEEDVRSLRELITYGLKGLSAYVKHANALGYDEEAIAIFMQETLAKLLDDTLTIDELIALTMETGKFGVDGMALLDKANTTTYGNPEITKVNIGVGTNPGILVSGHDLSDLEQLLIQTEGTGIDVYTHSEMLPAHYYPNLKKFKHLKGNYGNAWWKQNEEFEKFNGPILMTTNCIVPPRASYKDRLYTTGAAGYVGCQHIDGESGSKKDFSVIIKHALQCEAPVEIETGEIIGGFAHAQVLALADAVVGAVKSGAIKKFVVMAGCDGRAKSRNYYTDFAKALPNDTVILTAGCAKYKYNKLDLGDIGGIPRVLDAGQCNDSYSLALIALKLKEVFELSDINELPIIYNIAWYEQKAVIVLLSLLYLGVKNIHLGPTLPAFLSPNVANVLVNNFGIAGIQTVEEDMDLFFGKDSSESTSDEITKDTVIGDILKINPESASTLMEAGMHCLGCPASQMETLEEACSVHGIDVEELLNKLNA
>NC_010001.1|WP_012200856.1|3484851_3486042_+|hypothetical-protein
MERKVGTVSRGVRCPIIREGDNLSTIVVNSVLDAAESEGFSLREKDVIALTESIVARAQGNYASVSAIATDVKNKLGGETIGVIFPILSRNRFAICLKGIAMGAKKVVLMLSYPSDEVGNELVSLDQLDEAGVNPYSDVLTLERYRELFGENKHPFTGVDYVDYYSSIIKDAGADVEIVFSNQPKTILEYTKNVLTCDIHTRMRTKRILKAAGAENVIGLDDILTSPIDGNGYNENYGLLGSNKSTEDQIKLFPRECFDLVKDIQTQIKEKTNQHVEVMVYGDGAFKDPVGKIWELADPCVSPAYTEGLEGTPNEVKLKYLADNDFKNLSGDALTEAISERIKHKEDNLVGNMASQGTTPRRLTDLIGSLCDLTSGSGDKGTPVVLIQGYFDNFTN
>NC_010001.1|WP_157668819.1|3476823_3478179_-|aminotransferase-class-V-fold-PLP-dependent-enzyme
MSNSSDNIRNMMFGLDALVELDNNKMVPAINLDNAATTPPFKEVIQEIERQLMYYGSIGRGKGQKSENSTEVYTNGRDIVKDFVGANSDIYTVFYINNATDGINKLASAFIESPEDIVLSTRMEHHANDLPWRERTKTVYAEVDKKGRLIVDDIKRLLKAYNGRIKYVTVTAASNVTGYVNDVHYIAKLAHQYGAKIIVDGAQIVAHRAFNMLGQTLEENIDFFVFSAHKMYSPFGGGAVVGLTDVLNKHIAKFYGGGMVEAVCDYSVRYLPAPDRYEAGSPNYPGVVGMLRAMEVLKCIGFDYIKNHEQILLRRALDGLMKLPGVILYGDNENIADRVGIAVFTLRGIKNEEVANFLAGYRAIAVRHAAFCAHPYVRRLTGGSDTSGSFCYPLEGMVRISFGIYNNETDVDTFLATIKELLYSEYLRHFARVKNNSVQLSDRLCIPYDRA
>NC_010001.1|WP_012200854.1|3475325_3476234_-|chemotaxis-protein-CheV
MENNILLESGTNELEVLEFTIGGNSYGINVAKIKEILPFVSPTPVPNAYPTVEGIYMPRDFIMTIIDLRKTLNLHQETEQDGKDMIIVTNFNNLHVGFHVNKVLGIHRISWGDISKPDATLSHAGMGVATGIIKISNKLILLLDFEKIVADISPETSLKVSEMDLLKNRRRCDLPIIIAEDSHLLNQLLVDCLAKAGYTNITRTENGKEAYDLLVKYKQEGIVDKKVSLIITDIEMPVMDGHHLTKLVKEDTKLSKIPVVIFSSLVNEDMRRKGESLGANAQLSKPEIGQLVAKIDELLLSE
>NC_010001.1|WP_012200853.1|3473424_3475293_-|hypothetical-protein
MNRCKICHAEVKDNSEYCLNCKELGLDHSYFNTLSESMEALHNSEDITGMDENYIPEDYSIFQTESEDLTNNKELQSMLNHKVFEEQEILKYSSNNDEIENETMNPNFIQDTKVENELIQSEDKFLLIEEQDAINSTKQKTDFTLEQELEEDEFDDSVENLIANLSLSEIAATTEEDISEREKMNLSDTLNDNFDNNNYKQAEGEFEVGSTPDFDGNQDILDLLNEINRTPEDNSQEDYASDVLSIDDFMDDEESKVDPMLSLYSESDDLLNSSVNDIGGIYQDALGGISDLEDVGIDEELLKLIPDMPNQDDVQPKEIENLEVKSKKSKKSEKVKNSRKKKNLFARAFGNVKEEYSEEEKEQLKQDIINDAKEKDAKAQELEKEKKATKAKKDADKLAAKKKAKDDSIKAKQAKVEKAKVKKEEKERLSKEVQELIDEIDENEGRINRIGASFVFALFASIALFVVIGTNVYTYVVNIQNATKNFDMQRYNEAYNQVYGLDIRDADIEIYDKIMTVMFVNKQLNSYNNYSAIDMYPQALDSLLKGLERYDKYYDLATKLDIQTDLDYVRDRIISELSSKFYLSVDEAYNIINSPTQLDYSMAVYNVIFEKLDNKLVRKSEK
>NC_010001.1|WP_012200852.1|3472388_3473003_-|imidazole-glycerol-phosphate-synthase-subunit-HisH
MIAIIDYDAGNLRSVQKALQFIGEEVVITRDHDEIMNSGKVILPGVGAFGDAMQKLHSYHLINTIKEVADCGKPLLGICLGQQLMFEGSEESEGIEGLGLLPGKIIRIPEGGGLKIPHIGWNNLNITQGDSLYQDITGTPYVYFVHSYYLKSEDRSIVAATTEYGTLIDASVEKNNIYACQFHPEKSGEIGLKILKNFASLEER
>NC_010001.1|WP_012200851.1|3471603_3472380_-|imidazole-glycerol-phosphate-synthase-subunit-HisF
MHTKRIIPCLDVHNGRVVKGTNFLNLRDAGDPVLVGAEYGQAGADELVFLDITASSDARTIKLDMVRKVAETVFIPFTVGGGIRSIEDFKLILREGADKIAVNTAAIMNPTLISEAADKFGSQCVVVAIDAKCRPDNSGWNIYKNGGRIDMGIDAVEWAMKANELGAGEILLTSMDCDGTKNGYDLELTKQISENVSIPVIASGGAGTKEHFYEALTRGKADAVLAASLFHYKELEINDLKEYLRMKEVSVRLEDRSC
>NC_010001.1|WP_012200850.1|3470924_3471602_-|uracil-DNA-glycosylase
MSMIQNDWLDSIGEEFHKPYYKQLYDFVKEEYSQTTIYPLAENIFNAFHFTPLSKVKVLILGQDPYHNVNQAHGLSFSVLPEQKDIPPSLQNIYKELQSDLGCFIPNNGYLKKWADQGVLLLNTVLTVRAHQANSHQGRGWEQFTNAIIQAVNQQDRPIVYLLWGKPAQSKIPMLTNPKHLILKAPHPSPLSSYRGFFGSKHFSQTNEFFNANGLEPIDWQIENI
>NC_010001.1|WP_081428555.1|3468153_3470802_+|response-regulator
MFSSVKIIFHTAQRTCARMEIIMYSLMLAIQIIALLTNFTVILVLLVKKPFRGQAIFLALCAAVLVQCFGYTLEITSTTLDSAMMSIKIQYLGSAYVNILFLSFLFDYCKLKKSRLLFCLLFLINTLILIAVVTCEYHPYYYTDVQFVQEGSFPHVIFTKGILYHLFKSEVLLINFMILFIVISHYFRQGKERRRQELNFVGACLFPSVTCASYFMSFFKEYDPSSASFVISGLLVLIAIYRHQLFDIIHTARDSVIEVMDEALVVVDADFHLLDFNPAAKKLFPELKIEVLNSPLNKLSNELDCLFHQNQIYEFQKENRTYNAHLNKIYYNDDIVGHSAWIFDITESNNYMKNLIEMREQAEKANSAKSIFLAHMSHEIRTPLNAIIGLTDILLHKDTDFELHNDILNIKHAGGTLLSLINDVLDLTKIESGKLTLVDEPYKLTSVVHEVINIIGVKLMSKPVSLQVSISDQIPKYFYGDELRLRQVLINLMNNAVKFTERGTISLQVELSSFDLDTQTAQLIFHVRDTGLGIAKDDQKRIFHSFEQGSVGSDVLVEGSGLGLTICKRIIESAGGAIKVKSELGVGSDFSFTLPQKVYSQDQLNSSSTLKPGAIYKITPPFTAPNVKALVVDDNRLNLKVASGLLKLFDISVTVALSGAECLKLIQKETYQIIFLDHMMPQMDGLETLREIRSLSSVYYQTVPVIALTANAISGNKEMFLTSGFNDYLSKPIAISHLEALLKRWLPSSLVKLQGSKISEPLYQEVADFDNIDYQSGLVNCANQTDVYLAAVKQFLHDAGTTTEQLANAKDVGDALLFTTVVHGLKSAAKTLGAIELSRISLKLEESGHKQCFDEIEELYPSFKAEYQNAISSFTNFIKEYS
>NC_010001.1|WP_012200848.1|3463754_3468050_+|2-hydroxyacyl-CoA-dehydratase
MLKSNYSLGIDIGSTTVKIAILDINNQMVFSDYERHFANIQGTLADLITRAKSALGDLTVAPVITGSGGLAISKHLNVPFVQEVVAVATSLKDYAPQTDVAIELGGEDAKIIYFTNGIEQRMNGICAGGTGSFIDQMATLLKTDAAGLNEYAKNYQAIYPIAARCGVFAKSDIQPLINEGATKPDLAASIFQAVVNQTISGLACGKPIRGNVAFLGGPLHFLSELKNAFVRTLNLTKEQTIAPEHSHLFAATGSAMNHNPEVTTSLQTLINHLTTGISLDFEVHRMDPLFDNEEAYEMFLHRHNTHTVKKGDLSTYQGNCYLGIDAGSTTTKVALVGEDGSLLYSFYSNNNGSPLKTTIKAIKEIYTLLPENANIVRSCSTGYGEALIKSALMLDEGEVETVAHYYAAAFFDPKVDCILDIGGQDMKCIKIKSGTVDSVQLNEACSSGCGSFIETFAKSLNYEVADFAKIALFAKNPIDLGSRCTVFMNSKVKQAQKEGATVADISAGLAYSVIKNALYKVIKIADPKDLGSHIVVQGGTFYNDAVLRSFELTSGCTAIRPDIAGIMGAFGAALIAREHYSQEETTMLPIERINELKFDSSMARCKGCTNSCLLTINKFTGGRQFISGNRCEKGVGKEKNKDNIPNLYEYKLHRYMDYEPLAKDLAPRGVVGIPRVLNMYENYPFWFTFFTKLGYRVELSPDSTRKIYELGIESIPSESECYPAKIVHGHIMWLIKQGIPYIFYPCVPYERKEIPDAGNHYNCPIVTSYGENIKNNMEEIKSENICYQNPFLSFENKEILTNRLVEYLLAEQRMASQSAFDYTSELACTNNFSNSKITETEIRAAASLAWAELEEAREDMKKQGEQTMEYLRKTGRMGIVLAGRPYHVDPEINHGIPELINSYGVAVLTEDSISHLGTVERPMIVVDQWMYHSRLYTATSYVRTQPNLQLIQLNSFGCGLDAVTTDGVSDILATAGKIYTVLKIDEVNNLGAARIRIRSLLSAVSDRNRKHIETKVESPAYHRVVFTKEMRKDYTLLAPQMSPIHFDFLEPAFNSCGYHLEVLNNDNKAAVDAGLKYVNNDACYPSLMVVGQIMDALLSGKYDPNKVAVMITQTGGGCRATNYIGFIRRALKKAGFEQIPVVSISTSGIEKNPGFEINYDMIVRAVQALVYGDIFMKVVYRTRPYEQVPGSANALHAHWKDICAKSVQNGKWKEFRKNCRGIIEAFDTLPLDESIKKPRVGIVGEILVKFLPAANNYLVDLLEAEGAEAVMPEMVDFFLYCSYDANFKAQYLGKKKIDAFYNNMIIRFLEFARKEARKAFKESKRFNPPKYINELADLAEPIVSIGNQTGEGWFLTSEMVELINSGVPNIVCAQPFACLPNHIVGKGVIKELRHRYPDSNIVAVDYDPGASEVNQLNRIKLMLATAVKNLK
>NC_010001.1|WP_012200858.1|3488736_3490245_+|hydroxylamine-reductase
MGNNMDLEYEMFCYQCEQTAGGKGCTKQGVCGKTAEIANLQDLLVFQIKGISCYAKEMIERGEYIDKSIVILIENILFTTLTNVNFDASVHVELLKETQKVKESLRNHVGEIHNNTAQATYNLPDTKTDMLKDAPLAGIMYDNALDPDIRSLRQTIVYGVKGISAYGHQARSLGYYSDQVDNFYILALEAVTDDKLSVEELIRWTMRIGEMAIEVMKKLDEANTNTYKNPTPHKVNVNIRKGPFIIVSGHDLKDLEMLLIQTKGKGINIYTHGEMIPSHGYPNLKKYPHLVGNFGGAWQDQQKQFDNLPGCILMTTNCLMKPRESYKDRIYSTNVVGWDGVKHIKKDEDGEKDFSEIIQQALELGGFLEDEEPHEILVGFGHHATLSYAEKIVEAVKSGELRHFFLIGGCDGARPGATALADAFQTDVNGLPLSLIVSWYEQKAVADLLALLSLGIKSIYLGPSLPAFLSPNVLQYLVDTFDIRAISTAEDDIKTCLKQSIA
>NC_010001.1|WP_041703710.1|3490640_3492038_-|alpha-glucosidase/alpha-galactosidase
MKYQSNMVSDLQIAYIGGGSRGWAWTFMTDLAREPKLSGTVRLFDIDKSAAEQNMFIGNSITQREDAIGKWNYETKETLEEALTGADFIVISILPGTFDEMESDVHTPERLGIYQSVGDTAGPGGIIRALRTIPMFVDIAEAVKKYAPKAWVINYTNPMTLCVKTLYHVFPEIKAFGCCHEVFGTQKVLKGIAEQVLGIEDIPRNEVHVNVLGINHFTWFDYASYQGIDLFPIYRDYVKEHFEEGFIENDANWANTTFACSHRVKFDLFQKYGLIAAAGDRHLAEFVPGDWYLKDPENVKSWKFGLTTVDWRKEDLKQRLEKSHRLVSGEEKVDLKASGEEGILLIKALCGLERVVSNVNIPNTNRQIPNIPDSVVVETNAIFERDAIRPIIAGEMPDSILHLTIPHIQNHELVLKAALTCDKELVKQAFANDPLVKGRATAEEIDLLVEDMIQGSIKYLPEGWK
>NC_010001.1|WP_012200860.1|3492313_3493177_-|NLP/P60-protein
MTLSEQRQLLVESLKRREYKNTYTQDSKLRLNVYENPRGYGDCSSTMFTTYKMISGINIGSYSSSQAQNKLGIIVDVAKSELPDESNLLPGDLIFFNYEKAKQNSSNWGTWKDRYLHVGHVEMYIGDGKTIGHPSGFGPRIIDMRTYCNRMFKSGETYSISKRFVFNVNSYDAKFTGIESGFYSWCMNLQNEIKVKVDGIPGPEVLSKVPLIKFGTKGKVVELVQQRLIDLGYDIGKYGKNKDGIDGIYGLKCQEAIKSIDQWVLLKNVGTDITVGTDEWKFLLNIA
>NC_010001.1|WP_012200861.1|3493176_3493494_-|phage-holin
MNEILFSAIQIIVVILLGLVSRYVIPWLKVKLDTEKASQILAWIQTAVTAAEQIISGESKGIEKKAFVTEYMNKLLKEKGISITEEQLNLLIESAVKALNTKGGL
>NC_010001.1|WP_012200862.1|3500320_3500605_-|hypothetical-protein
MVEIRIESCPFCGSNEMGWGYQSAQGAVMTGKSGYAGSKVEHLICTECGSIVHSRVAKPELFKNVIKDKAKPRIRRRKAAKVNETNSDVATMDK
>NC_010001.1|WP_041703711.1|3500993_3501404_-|PH-domain-containing-protein
MLVGECNMEVVYKEKKRTKLFGLPLHFVTYRIGPDKINIQSGFLTIVEDDAYMYKVQDVRLTRSFLERVFCLGTVTCYTGDKTHPELKLIHIRKSSSIKDYLMEASEEARRKRRAMHILDGQEQKDVDEDDVEDEY
>NC_010001.1|WP_012200864.1|3501424_3502117_-|hypothetical-protein
MLKKRLLLSLAVVSMFGLTGCASSIRLTENENNIIAEYLSGVLLSQQRSYDQALIEPSPTPIPVATVTPTPSAEKPSTVSNKGNTNGHQTGANIQANSDFTEVIGIKNLTIEYTGYDIVNSFSDEYFSLDASKGKQLMVIKFNVKNTSKNATKLQLTDAGIQYQLDIDMGTILKPQLTFILNDLRYIDLEIGGKETKEAIVIFEVPKKQEMKAANLIISKDEKTAIIKLK
>NC_010001.1|WP_012200865.1|3502212_3503712_-|HAMP-domain-containing-protein
MKHSLRLKITFLLTISLALTIFLCWGLNKSFLTDYYQYSKIKSLDSVFYEVNNTFNESSQKGLTQEQLVMMDSMISKNNASAYISDMDLGLVYRSNGTDRDTQRVKKSMKAYLYGNTPDTLIDKIKWIKTVDNKYDIYIQHDALMQMNYIDLIGILDTGFIVFIRTNMENLQASSAISNNFLAYVGIFVTVVGTIVMYFISRSFTKPILVLENIAKKMSNLDFNAKYEGKSQDEIGQLGNSINMLSEKLEQTISELKVANIELQSDIEDKVQIDEMRKEFLSNVTHELKTPIALIQGYAEGLKDNISEDEQSREFYCEVIIDEAMKMNKMVKKLLSLNQLEFGNNQPEIIRFDIVSLINSVIQSTDILCKQKEIRIIFEEKQPCYVWADEYMIEEVVTNYVSNAINHADGAKIVEIKLIHMENVVRVAVFNTGELIPEEDLEKVWIKFYKVDKARTREYGGNGIGLSIVKAIMNAHNKECGVVNHSNGVEFWFELDITS
>NC_010001.1|WP_012200866.1|3503711_3504386_-|response-regulator-transcription-factor
MERLKVLVVDDESRMRKLVKDFLSRSNYDVLEAENGEQAVDIFFEQKDISLIILDVMMPKMDGWQVCKEIRKYSKVPIIMLTAKSDEKDELLGFELGVDEYISKPFSPKILVARVEAIVRRSIQTLDETMEIGGIVIDKAAHEVKIDDLAIELSVKEFELLTYFITNRGVALSREKILNNVWNYDYFGDARTIDTHVKKLRSKMGDKGDYIKTIWGMGYKFEVV
>NC_010001.1|WP_012200867.1|3504706_3505006_-|hypothetical-protein
MFEFDGYRYATVKEMDLAKKEAESIAYIKGRTDFKDREKLKKLYEGLIEKQSFVTPTGINFLREVQRELNAFSDKAVSPVFVTVPTEMKKGSYVRSTSF

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_010001_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_010001_7

3508360-3508473

Orphan

Consensus_repeat	Method
ATTGACAAGTATGTCACATTGGGGTGATTTAAT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_010001_7

>merge|NC_010001|7|3508360-3508473|CRISPRCasFinder
ATTGACAAGTATGTCACATTGGGGTGATTTAATAATTTCCTTTATGTTTATTTATTTTAGTATATTATTTCTGTCTTGAAAATTGACAAGTATGTCACATTGGGGTGATTTAAT

>NC_010001|7|7|3508360-3508473|CRISPRCasFinder
ATTGACAAGTATGTCACATTGGGGTGATTTAAT	AATTTCCTTTATGTTTATTTATTTTAGTATATTATTTCTGTCTTGAAA
ATTGACAAGTATGTCACATTGGGGTGATTTAAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_010001.1\|WP_012200871.1\|3509559_3509970_-\|response-regulator	unknown	unknown	gnl\|CDD\|225107
NC_010001.1\|WP_012200864.1\|3501424_3502117_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200866.1\|3503711_3504386_-\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NC_010001.1\|WP_012200867.1\|3504706_3505006_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200861.1\|3493176_3493494_-\|phage-holin	unknown	unknown	gnl\|CDD\|378239
NC_010001.1\|WP_041703711.1\|3500993_3501404_-\|PH-domain-containing-protein	unknown	unknown	gnl\|CDD\|367615
NC_010001.1\|WP_157668820.1\|3505059_3505851_-\|peptidylprolyl-isomerase	unknown	unknown	gnl\|CDD\|238194
NC_010001.1\|WP_012200874.1\|3512762_3512966_+\|cold-shock-protein	unknown	unknown	gnl\|CDD\|224197
NC_010001.1\|WP_012200879.1\|3518397_3519942_-\|2,3-bisphosphoglycerate-independent-phosphoglycerate-mutase	unknown	unknown	gnl\|CDD\|235463
NC_010001.1\|WP_012200869.1\|3506209_3506770_+\|thymidine-kinase	unknown	unknown	gnl\|CDD\|235272
NC_010001.1\|WP_012200862.1\|3500320_3500605_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200877.1\|3515368_3517519_-\|ribonuclease-R	unknown	unknown	gnl\|CDD\|273947
NC_010001.1\|WP_012200878.1\|3518072_3518318_-\|preprotein-translocase-subunit-SecG	unknown	unknown	gnl\|CDD\|377143
NC_010001.1\|WP_041703713.1\|3510426_3511002_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377395
NC_010001.1\|WP_012200865.1\|3502212_3503712_-\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|274368
NC_010001.1\|WP_012200876.1\|3514881_3515346_-\|SsrA-binding-protein-SmpB	unknown	unknown	gnl\|CDD\|376590
NC_010001.1\|WP_012200873.1\|3511057_3512362_-\|signal-transduction-histidine-kinase	unknown	unknown	gnl\|CDD\|340412
NC_010001.1\|WP_157668730.1\|3508121_3508274_-\|hypothetical-protein	unknown	unknown	unknown
NC_010001.1\|WP_012200875.1\|3513221_3514868_-\|putative-manganese-dependent-inorganic-diphosphatase	unknown	unknown	gnl\|CDD\|237843
NC_010001.1\|WP_157668731.1\|3510196_3510319_-\|cyclic-lactone-autoinducer-peptide	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_010001.1\|WP_012200871.1\|3509559_3509970_-\|response-regulator	gnl\|CDD\|225107	COG2197, CitB, Response regulator containing a CheY-like receiver domain and an HTH DNA-binding domain [Signal transduction mechanisms / Transcription].	4.45418e-15
NC_010001.1\|WP_012200865.1\|3502212_3503712_-\|HAMP-domain-containing-protein	gnl\|CDD\|274368	TIGR02966, Phosphate_regulon_sensor_protein_PhoR, phosphate regulon sensor kinase PhoR. Members of this protein family are the regulatory histidine kinase PhoR associated with the phosphate ABC transporter in most Proteobacteria. Related proteins from Gram-positive organisms are not included in this model. The phoR gene usually is adjacent to the response regulator phoB gene (TIGR02154). [Signal transduction, Two-component systems].	2.52489e-48
NC_010001.1\|WP_012200861.1\|3493176_3493494_-\|phage-holin	gnl\|CDD\|378239	pfam09682, Phage_holin_6_1, Bacteriophage holin of superfamily 6 (Holin_LLH). Phage_holin_6_1 or Holin_LLH identifies a family of phage holins from a number of phage and prophage regions of Gram-positive bacteria. Like other holins, it is large for holins (about 100-160 amino acids) with stretches of hydrophobic sequence and is encoded adjacent to lytic enzymes. Holin LLH family is found in phage of Firmicutes and have an N-terminal transmembrane segment.	1.10462e-27
NC_010001.1\|WP_041703711.1\|3500993_3501404_-\|PH-domain-containing-protein	gnl\|CDD\|367615	pfam03703, bPH_2, Bacterial PH domain. Domain found in uncharacterized family of membrane proteins. 1-3 copies found in each protein, with each copy flanked by transmembrane helices. Members of this family have a PH domain like structure.	5.30742e-11
NC_010001.1\|WP_157668820.1\|3505059_3505851_-\|peptidylprolyl-isomerase	gnl\|CDD\|238194	cd00317, cyclophilin, cyclophilin: cyclophilin-type peptidylprolyl cis- trans isomerases. This family contains eukaryotic, bacterial and archeal proteins which exhibit a peptidylprolyl cis- trans isomerases activity (PPIase, Rotamase) and in addition bind the immunosuppressive drug cyclosporin (CsA). Immunosuppression in vertebrates is believed to be the result of the cyclophilin A-cyclosporin protein drug complex binding to and inhibiting the protein-phosphatase calcineurin. PPIase is an enzyme which accelerates protein folding by catalyzing the cis-trans isomerization of the peptide bonds preceding proline residues. Cyclophilins are a diverse family in terms of function and have been implicated in protein folding processes which depend on catalytic /chaperone-like activities. This group contains human cyclophilin 40, a co-chaperone of the hsp90 chaperone system; human cyclophilin A, a chaperone in the HIV-1 infectious process and; human cyclophilin H, a component of the U4/U6 snRNP, whose isomerization or chaperoning activities may play a role in RNA splicing. .	1.52297e-55
NC_010001.1\|WP_012200874.1\|3512762_3512966_+\|cold-shock-protein	gnl\|CDD\|224197	COG1278, CspC, Cold shock proteins [Transcription].	9.89765e-30
NC_010001.1\|WP_012200879.1\|3518397_3519942_-\|2,3-bisphosphoglycerate-independent-phosphoglycerate-mutase	gnl\|CDD\|235463	PRK05434, PRK05434, 2,3-bisphosphoglycerate-independent phosphoglycerate mutase.	0
NC_010001.1\|WP_041703713.1\|3510426_3511002_-\|hypothetical-protein	gnl\|CDD\|377395	pfam04647, AgrB, Accessory gene regulator B. The arg locus consists of two transcripts: RNAII and RNAIII. RNAII encodes four genes (agrA, B, C, and D) whose gene products assemble a quorum sensing system. AgrB and AgrD are essential for the production of the autoinducing peptide which functions as a signal for quorum sensing. AgrB is a transmembrane protein.	3.09143e-12
NC_010001.1\|WP_012200877.1\|3515368_3517519_-\|ribonuclease-R	gnl\|CDD\|273947	TIGR02063, Ribonuclease_R, ribonuclease R. This family consists of an exoribonuclease, ribonuclease R, also called VacB. It is one of the eight exoribonucleases reported in E. coli and is broadly distributed throughout the bacteria. In E. coli, double mutants of this protein and polynucleotide phosphorylase are not viable. Scoring between trusted and noise cutoffs to the model are shorter, divergent forms from the Chlamydiae, and divergent forms from the Campylobacterales (including Helicobacter pylori) and Leptospira interrogans. [Transcription, Degradation of RNA].	0
NC_010001.1\|WP_012200878.1\|3518072_3518318_-\|preprotein-translocase-subunit-SecG	gnl\|CDD\|377143	pfam03840, SecG, Preprotein translocase SecG subunit.	8.77181e-13
NC_010001.1\|WP_012200866.1\|3503711_3504386_-\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	1.25894e-84
NC_010001.1\|WP_012200876.1\|3514881_3515346_-\|SsrA-binding-protein-SmpB	gnl\|CDD\|376590	pfam01668, SmpB, SmpB protein.	1.15714e-87
NC_010001.1\|WP_012200873.1\|3511057_3512362_-\|signal-transduction-histidine-kinase	gnl\|CDD\|340412	cd16935, HATPase_AgrC-ComD-like, Histidine kinase-like ATPase domain of two-component sensor histidine kinases similar to Staphylococcus aureus AgrC and Streptococcus pneumoniae ComD which are involved in quorum sensing. This family includes the histidine kinase-like ATPase (HATPase) domains of various two-component sensor histidine kinase (HKs) including Staphylococcus aureus AgrC which is an HK of the accessory gene regulator (agr) quorum sensing two-component regulatory system (TCS) AgrC-AgrA. The agr system plays a part in the transition from persistent to virulent phenotype. This family also includes Streptococcus pneumoniae ComD HK of the ComD-ComE TCS, involved in quorum sensing and genetic competence.	0.00018049
NC_010001.1\|WP_012200869.1\|3506209_3506770_+\|thymidine-kinase	gnl\|CDD\|235272	PRK04296, PRK04296, thymidine kinase; Provisional.	2.10665e-76
NC_010001.1\|WP_012200875.1\|3513221_3514868_-\|putative-manganese-dependent-inorganic-diphosphatase	gnl\|CDD\|237843	PRK14869, PRK14869, putative manganese-dependent inorganic diphosphatase.	0

>NC_010001.1|WP_157668730.1|3508121_3508274_-|hypothetical-protein
MGKKLLVILSVVVLASNLLCFASVSNETKSTNQIQLCDQAGLIVNLPVKL
>NC_010001.1|WP_012200869.1|3506209_3506770_+|thymidine-kinase
MSKLYFKYGCMNSSKSANLLMIRHNYEEQGFNILLLKPSIDDREGKSIIKSRIGIEAECIMVKPLDSIKDIFQKNPADIIMVDEAQFLTKDQVDELYDISFQNNVLCFGLLTDFQQRLFEGSQRLIELAESLQEIKTVCACGRRATMNVRFDEHGNVITRGEQVDIGGNDKYRAMCKYCYNNLTKK
>NC_010001.1|WP_157668820.1|3505059_3505851_-|peptidylprolyl-isomerase
MILCGAIAISLVGCGLINKGNSEGKSSITQEEPGKEGVVEEPTLTQEAKKLYQFKDVKKGDTIAEINVKDYGTMKIKLFGKEAPKAVENFVTHAKDGYYDGVTFHRIIEEFMIQGGDPLGTGFGGESIYGEPFEDEFSNDLYPFRGALCMANSGSNTNGSQFFIVQADSEQVNLLKDLAKEYYDLSFIDYVQKAYGVKLSSNELNQFITYGGTPWLTRKHTVFGQVIEGFDVLDAIANTEKADDQGTPKNPVVIENIKISEVE
>NC_010001.1|WP_012200867.1|3504706_3505006_-|hypothetical-protein
MFEFDGYRYATVKEMDLAKKEAESIAYIKGRTDFKDREKLKKLYEGLIEKQSFVTPTGINFLREVQRELNAFSDKAVSPVFVTVPTEMKKGSYVRSTSF
>NC_010001.1|WP_012200866.1|3503711_3504386_-|response-regulator-transcription-factor
MERLKVLVVDDESRMRKLVKDFLSRSNYDVLEAENGEQAVDIFFEQKDISLIILDVMMPKMDGWQVCKEIRKYSKVPIIMLTAKSDEKDELLGFELGVDEYISKPFSPKILVARVEAIVRRSIQTLDETMEIGGIVIDKAAHEVKIDDLAIELSVKEFELLTYFITNRGVALSREKILNNVWNYDYFGDARTIDTHVKKLRSKMGDKGDYIKTIWGMGYKFEVV
>NC_010001.1|WP_012200865.1|3502212_3503712_-|HAMP-domain-containing-protein
MKHSLRLKITFLLTISLALTIFLCWGLNKSFLTDYYQYSKIKSLDSVFYEVNNTFNESSQKGLTQEQLVMMDSMISKNNASAYISDMDLGLVYRSNGTDRDTQRVKKSMKAYLYGNTPDTLIDKIKWIKTVDNKYDIYIQHDALMQMNYIDLIGILDTGFIVFIRTNMENLQASSAISNNFLAYVGIFVTVVGTIVMYFISRSFTKPILVLENIAKKMSNLDFNAKYEGKSQDEIGQLGNSINMLSEKLEQTISELKVANIELQSDIEDKVQIDEMRKEFLSNVTHELKTPIALIQGYAEGLKDNISEDEQSREFYCEVIIDEAMKMNKMVKKLLSLNQLEFGNNQPEIIRFDIVSLINSVIQSTDILCKQKEIRIIFEEKQPCYVWADEYMIEEVVTNYVSNAINHADGAKIVEIKLIHMENVVRVAVFNTGELIPEEDLEKVWIKFYKVDKARTREYGGNGIGLSIVKAIMNAHNKECGVVNHSNGVEFWFELDITS
>NC_010001.1|WP_012200864.1|3501424_3502117_-|hypothetical-protein
MLKKRLLLSLAVVSMFGLTGCASSIRLTENENNIIAEYLSGVLLSQQRSYDQALIEPSPTPIPVATVTPTPSAEKPSTVSNKGNTNGHQTGANIQANSDFTEVIGIKNLTIEYTGYDIVNSFSDEYFSLDASKGKQLMVIKFNVKNTSKNATKLQLTDAGIQYQLDIDMGTILKPQLTFILNDLRYIDLEIGGKETKEAIVIFEVPKKQEMKAANLIISKDEKTAIIKLK
>NC_010001.1|WP_041703711.1|3500993_3501404_-|PH-domain-containing-protein
MLVGECNMEVVYKEKKRTKLFGLPLHFVTYRIGPDKINIQSGFLTIVEDDAYMYKVQDVRLTRSFLERVFCLGTVTCYTGDKTHPELKLIHIRKSSSIKDYLMEASEEARRKRRAMHILDGQEQKDVDEDDVEDEY
>NC_010001.1|WP_012200862.1|3500320_3500605_-|hypothetical-protein
MVEIRIESCPFCGSNEMGWGYQSAQGAVMTGKSGYAGSKVEHLICTECGSIVHSRVAKPELFKNVIKDKAKPRIRRRKAAKVNETNSDVATMDK
>NC_010001.1|WP_012200861.1|3493176_3493494_-|phage-holin
MNEILFSAIQIIVVILLGLVSRYVIPWLKVKLDTEKASQILAWIQTAVTAAEQIISGESKGIEKKAFVTEYMNKLLKEKGISITEEQLNLLIESAVKALNTKGGL
>NC_010001.1|WP_012200871.1|3509559_3509970_-|response-regulator
MNILIVDDVAFIRIGIKSSLSKYRNLYMFDAGTYEEAVKILDEEKIDLIFLDLNLNTNSQTKLEHENGLDIVRYLMEKEIDMPYVAILSGTVNESKMREAYNLGITNIVSKPFSTESLMSIIDEVHDVMYQVPLPR
>NC_010001.1|WP_157668731.1|3510196_3510319_-|cyclic-lactone-autoinducer-peptide
MTKLLLLAVTAFVAIAEATSVYPCLIWILGQDEMPEELIE
>NC_010001.1|WP_041703713.1|3510426_3511002_-|hypothetical-protein
MNHFTYNNLEQLLITTKGYEPIRAKRAVYQTKNFLRSLIYSLLIAFIFFWFHCLKEAVLVMIILKLYRGYSGGIHVKNYMLCFFSSLLLVCAIIVITKALPLTIELEIILWLINLILWYRYVPQGTYARPIRKMELKKELKFKFFIAMVLTFSIRFLWMEIYSMCLFSMLLILSLTTPMAYKIFKVQHDRI
>NC_010001.1|WP_012200873.1|3511057_3512362_-|signal-transduction-histidine-kinase
MLHDTIFLLIDCLVLAFFIRSLFRKKGICRLAGFTIVSFGLSYYKLNMDMNLPFYMGEILMIFIPVAVIIILTYCLYQRNLVVSITTGILITVVIVFLQILALLITNFSLYLLSITLSIEIHRDICQILYMLGMLITAYYMWINQDNIYEKVIRYCETKSERTQRYVKYIKFGITLFLMLTFTVLGEGIYDKLGISNESFMLICFTILLAATIFLLTYYESIITSYRNRQIEERNKLNEIHQDFVDNINYFGHSYNNMMQAVNFFVNCEELKIEDVRTVLKDLLEWDEKNKINYKLKYINIPNTVVASILSMKQDYARELGVNLKVIYDGSSNVKINSKIFVDLINIIVDNAIEVAHFTEDKTVYINLIFDDNRFEFTTKNFKNYDKNGKLLKYGTSKHIGLRNIEEMVRKNISINYDIIDGEGEFEIRLIINN
>NC_010001.1|WP_012200874.1|3512762_3512966_+|cold-shock-protein
MNKGTVKWFNAQKGFGFITNSETGEDVFVHFSGIASEGFKSLEEGQNVTFEITKGARGMQATNVSIA
>NC_010001.1|WP_012200875.1|3513221_3514868_-|putative-manganese-dependent-inorganic-diphosphatase
MITNAKKVIVIGHKNPDTDSICSAISYAALKRKLTGNDYVAKRAGQINSETQYILERFKITPPEYVADVKTQVRDIEIRETEGVDDTLSLKKAWSLMRKNNVATLPITEKGKLKGIITTGDITTSYMEVYDNRILAEAKTPYINILETLEGTLLVGDEHTIFEQGKVLIAAANPDLMEDYIEENDLVILGNRYESQLCAIEMKAGCIVVCEGAKVSMTIMKLAKERGCTIISTPHDTYTVARLMNQSMPISQFMIQDNLITFRTDAYVDEIKNVMAKQRNRDFPILDHKGIYRGMISRRNLLNMERKQVIMVDHNEKDQAVDGIEDAEILEIIDHHRLGTIETMKPVFFRNQPLGCTATIVYLMYCENRVEIEPSIAGLLCAAIISDTLMYRSPTCTKFDIEAAEHLAKIAGVDVTEFAGEIFEAGSNLKSKSADEIFYQDYKDFSVGDTTFGVGQINSLNALELSEIKDRLYPYLEKAREEHGVDMIFFMLTNIIRESTELLCVGSMANQVVENAFHVKEVSNGYKLDGVVSRKKQLIPAIVAAMQE
>NC_010001.1|WP_012200876.1|3514881_3515346_-|SsrA-binding-protein-SmpB
MAKEGIKLIANNKKARFDYFIEETYEAGVVLHGTEVKSLRMGKCSIKESFMRIENGEVYVYNMHISPYEKGNIFNKDPLRVKKLLLHKFQINKIVGQIQQKGYTLVPLTIYLKDSLVKMEIGVARGKKLYDKRQDIAKKDQKREAEKDFKVKNL
>NC_010001.1|WP_012200877.1|3515368_3517519_-|ribonuclease-R
MEKEILNNKKELLLQVITDRSYRPMKFRELSSLLQVPKDERDDLKIVMDSLISDGKIMLDGNGRYKETNGNIKTGIFSGTTRGFGFVKIEGEENEEDIFIPESETKGALNKDRVQIAIFEEQSGRRREGAVISILERNVTELVGTFQKSKNFGFVIADNTKFNSDVFIPKEHTKGAVNGHKVLVQLTDYGSETKNPEGKIIKIIGHINDPGVDVVSVILENGLPTEFPDEVMKQVERIGEEVSSADIGGRVDLRNLQTVTIDGEDAKDLDDAITLSKKGDIYQLGVHIADVSNYVTEDSPLDKEALKRGTSVYLVDRVIPMLPHKLSNGICSLNAGSDRLALSCMMEIDEKGNVVGHRIAETVINVDRRMTYTSVKKIIEDHDEAEIEEYKELVPMFELMLELADILREKRRKRGSIDFDFPESKIILDSDGRPTDIKPYERNKATKIIEDFMLIANETVAEDFFWQELPFVYRTHENPDLEKIQKLSVFINNFGYTMRIGQDEIHPKELQKLLIKIDGKPEEALISRLTLRSMKQAKYTTTCDGHFGLSTKYYSHFTSPIRRYPDLQIHRIIKENLRGGLKEKRINHYESILNEVARQSSLAERRADESEREVEKLKKVEYMSQFIGQTFEGVISGVTSWGMYVELPNTVEGMIRLADMHDDYYIYDEEHYLLTGEHTKKIYKLGEAVVIRVEDTDKLMRTINFSIVGRANRIEE
>NC_010001.1|WP_012200878.1|3518072_3518318_-|preprotein-translocase-subunit-SecG
MEILRAIVTVLYVLICLGLVVVVLMQEGKSAGLSGSINGVADTYWGKNKGRSMEGALVKITKLLGALFIVISIVLNMNWGL
>NC_010001.1|WP_012200879.1|3518397_3519942_-|2,3-bisphosphoglycerate-independent-phosphoglycerate-mutase
MSKKPTVLMILDGYGLNEKTEGNAIALAKKPVLDKLMKDYPFVKGNASGMAVGLPEGQMGNSEVGHLNMGAGRIVYQELTRITKEIQDGDFFENTQLIKAVENCKKNNTALHLFGLLSDGGVHSHITHLYGLLELAKRHGLENVYVHAFLDGRDTAPTSGKSFMEALEAKMAELGVGRIASVTGRYYVMDRDNRWDRVEKAYAALVDGEGVEAANAVEAVAASYAEGVNDEFVLPTVVVKDGKAIAPIKANDSIIFFNFRPDRAREITRAFCTDDFDGFVRKSGRLPLTYVCFSEYDVTIPNKSVAFEKVSITNTFGEYLAEHGKTQARIAETEKYAHVTFFFNGGVEAPNEGEDRILVNSPKVATYDLQPEMSANAVADKLVEAITSLKYDVIIVNFANPDMVGHTGISDAAIKAVEAVDACVGRAYDALLSVDGQMFICADHGNAEQLVDYTNGEPFTAHTTNPVPFILINYDDSYTLREGGCLADIIPTLIEMMKMEQPKEMTGKSLLIKK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1006945 : 1019230

Clostridium_phage(54.55%)

plate,tail

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012198813.1\|1006945_1007644_-	ImmA/IrrE family metallo-endopeptidase	A0A2H4JAE0	uncultured_Caudovirales_phage	1.4e-27	40.5
WP_012198814.1\|1007659_1007986_-	helix-turn-helix transcriptional regulator	A0A2H4JFU5	uncultured_Caudovirales_phage	2.5e-35	67.6
WP_012198815.1\|1008211_1008709_+	hypothetical protein	I2E8Y5	Clostridium_phage	6.6e-19	39.2
WP_041703174.1\|1009594_1009774_+	hypothetical protein	NA	NA	NA	NA
WP_012198816.1\|1009794_1010211_+	hypothetical protein	NA	NA	NA	NA
WP_041703176.1\|1010212_1010395_+	hypothetical protein	NA	NA	NA	NA
WP_012198817.1\|1010396_1011677_+	hypothetical protein	X5JAJ1	Clostridium_phage	2.3e-116	49.4
WP_012198818.1\|1011689_1012169_+\|tail	phage tail tube protein	A0A0A8WJ62	Clostridium_phage	7.2e-39	52.6
WP_012198819.1\|1012404_1012833_+	hypothetical protein	S6B9X5	Thermus_phage	5.9e-08	35.8
WP_012198820.1\|1013018_1015619_+	tape measure protein	H7BVH2	unidentified_phage	1.3e-44	25.6
WP_157668773.1\|1015653_1016487_+	LysM peptidoglycan-binding domain-containing protein	X5J9Z8	Clostridium_phage	2.9e-27	38.1
WP_012198822.1\|1016501_1017458_+	hypothetical protein	H7BVH4	unidentified_phage	5.1e-76	46.6
WP_012198823.1\|1017450_1017768_+	DUF2577 domain-containing protein	NA	NA	NA	NA
WP_012198824.1\|1017764_1018157_+	DUF2634 domain-containing protein	A0A0A8WFW6	Clostridium_phage	1.4e-27	51.2
WP_012198825.1\|1018156_1019230_+\|plate	baseplate J/gp47 family protein	A0A0A8WFK0	Clostridium_phage	9.6e-92	48.9

DBSCAN-SWA_2

3592260 : 3637196

Clostridium_phage(55.56%)

plate,portal,transposase,tail,terminase,holin

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_085953448.1\|3592260_3593205_+\|transposase	transposase	NA	NA	NA	NA
WP_085953449.1\|3593117_3593435_+\|transposase	transposase	NA	NA	NA	NA
WP_012200935.1\|3593610_3595572_-	NAD-dependent DNA ligase LigA	Q332J4	Clostridium_botulinum_C_phage	1.7e-163	46.6
WP_012200936.1\|3595763_3597197_-	23S rRNA pseudouridine(2604) synthase RluF	NA	NA	NA	NA
WP_041703716.1\|3597765_3598167_+	hypothetical protein	NA	NA	NA	NA
WP_012200938.1\|3599016_3599754_+	hypothetical protein	NA	NA	NA	NA
WP_041703717.1\|3600050_3600983_-	hypothetical protein	NA	NA	NA	NA
WP_012200940.1\|3601594_3602392_-	hypothetical protein	NA	NA	NA	NA
WP_049762398.1\|3602433_3604092_-	EAL domain-containing protein	G3MA91	Bacillus_virus	1.1e-14	31.6
WP_012200942.1\|3604721_3606101_-	NADPH-dependent glutamate synthase	NA	NA	NA	NA
WP_012200943.1\|3606113_3607004_-	sulfide/dihydroorotate dehydrogenase-like FAD/NAD-binding protein	NA	NA	NA	NA
WP_012200944.1\|3607449_3609303_+	asparagine synthase (glutamine-hydrolyzing)	A0A2I2L3T4	Orpheovirus	9.0e-29	27.0
WP_012200945.1\|3609558_3610320_-	GHKL domain-containing protein	NA	NA	NA	NA
WP_012200946.1\|3610312_3611035_-	response regulator transcription factor	NA	NA	NA	NA
WP_012200947.1\|3611075_3612014_-	SPFH/Band 7/PHB domain protein	A0A0G2YDT0	Acanthamoeba_polyphaga_mimivirus	8.3e-15	28.8
WP_012200948.1\|3612015_3612456_-	NfeD family protein	NA	NA	NA	NA
WP_012200949.1\|3612633_3614100_-	glycoside:cation symporter	NA	NA	NA	NA
WP_041703718.1\|3614304_3615204_+	HAD-IC family P-type ATPase	NA	NA	NA	NA
WP_041703719.1\|3615294_3615507_+	hypothetical protein	A0A1P8BMQ1	Lactococcus_phage	2.1e-19	74.2
WP_012200952.1\|3615542_3616220_-	hypothetical protein	NA	NA	NA	NA
WP_012200953.1\|3616222_3616636_-\|holin	phage holin family protein	A0A2K5B2A2	Erysipelothrix_phage	1.1e-35	56.2
WP_157668734.1\|3616691_3616850_-	hypothetical protein	NA	NA	NA	NA
WP_012200954.1\|3616864_3617200_-	hypothetical protein	NA	NA	NA	NA
WP_012200955.1\|3617199_3618192_-	hypothetical protein	NA	NA	NA	NA
WP_012200956.1\|3618203_3618608_-	hypothetical protein	NA	NA	NA	NA
WP_012200957.1\|3618607_3619150_-	YmfQ family protein	NA	NA	NA	NA
WP_012200958.1\|3619139_3620219_-\|plate	baseplate J/gp47 family protein	A0A0A8WFK0	Clostridium_phage	1.2e-89	48.6
WP_012200959.1\|3620221_3620614_-	DUF2634 domain-containing protein	A0A0A8WFW6	Clostridium_phage	1.9e-29	49.6
WP_012200960.1\|3620613_3620937_-	DUF2577 domain-containing protein	A0A0A7RTW1	Clostridium_phage	3.0e-12	35.0
WP_012200961.1\|3620920_3621877_-	hypothetical protein	H7BVH4	unidentified_phage	1.3e-68	42.7
WP_012200962.1\|3621794_3622733_-	LysM peptidoglycan-binding domain-containing protein	X5J9Z8	Clostridium_phage	2.1e-34	38.9
WP_012200963.1\|3622742_3624881_-	hypothetical protein	H7BVH2	unidentified_phage	1.1e-17	29.9
WP_012200964.1\|3625069_3625501_-	hypothetical protein	S6B9X5	Thermus_phage	4.0e-12	36.4
WP_012200965.1\|3625571_3626045_-\|tail	phage tail tube protein	A0A0A8WJ62	Clostridium_phage	2.3e-53	66.2
WP_012200966.1\|3626063_3627371_-	hypothetical protein	X5JAJ1	Clostridium_phage	1.2e-136	56.9
WP_012200967.1\|3627373_3627553_-	hypothetical protein	X5J9Z6	Clostridium_phage	5.1e-06	54.0
WP_012200968.1\|3627559_3627985_-	hypothetical protein	A0A0A8WJT3	Clostridium_phage	3.6e-26	43.6
WP_012200969.1\|3627981_3628440_-	HK97 gp10 family phage protein	X5JB35	Clostridium_phage	1.9e-28	48.7
WP_012200970.1\|3628439_3628814_-	hypothetical protein	A0A0A7RTV0	Clostridium_phage	9.3e-18	48.2
WP_012200971.1\|3628810_3629158_-	hypothetical protein	A0A0A7RTX9	Clostridium_phage	2.4e-28	55.4
WP_012200972.1\|3629169_3630177_-	hypothetical protein	A0A0A7RVZ1	Clostridium_phage	4.1e-145	77.6
WP_012200973.1\|3630196_3630799_-	hypothetical protein	A0A0A7S0J5	Clostridium_phage	5.6e-73	68.8
WP_012200974.1\|3630956_3631217_-	hypothetical protein	A0A0S2MYE7	Enterococcus_phage	3.2e-25	61.6
WP_049762400.1\|3631396_3631750_-	hypothetical protein	A0A1J1J9Q7	Escherichia_phage	8.2e-16	42.7
WP_012200976.1\|3631803_3632031_-	hypothetical protein	NA	NA	NA	NA
WP_012200978.1\|3633579_3634968_-\|portal	phage portal protein	A0A0A7S0I9	Clostridium_phage	1.4e-172	65.8
WP_041703720.1\|3634973_3635207_-	hypothetical protein	NA	NA	NA	NA
WP_041704576.1\|3635218_3636631_-\|terminase	phage terminase large subunit	A0A090EUA8	Clostridium_phage	1.5e-201	75.3
WP_012200980.1\|3636623_3637196_-	helix-turn-helix domain-containing protein	A0A1S5SAA7	Streptococcus_phage	2.1e-45	48.2

DBSCAN-SWA_3

3649174 : 3659730

uncultured_Caudovirales_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012200995.1\|3649174_3649600_-	single-stranded DNA-binding protein	A0A2H4J8K2	uncultured_Caudovirales_phage	1.1e-25	54.1
WP_085953465.1\|3649599_3650307_-	ERF family protein	A0A1W6JP21	Morganella_phage	5.3e-38	56.9
WP_012200997.1\|3650328_3651438_-	DUF1351 domain-containing protein	NA	NA	NA	NA
WP_012200998.1\|3651440_3652079_-	hypothetical protein	H7BV23	unidentified_phage	4.6e-73	55.7
WP_012200999.1\|3652071_3652677_-	HD domain-containing protein	E7DN85	Pneumococcus_phage	2.8e-16	37.3
WP_157668740.1\|3652666_3652828_-	hypothetical protein	NA	NA	NA	NA
WP_012201000.1\|3652817_3653081_-	AbrB/MazE/SpoVT family DNA-binding domain-containing protein	NA	NA	NA	NA
WP_041703723.1\|3653685_3653877_-	hypothetical protein	NA	NA	NA	NA
WP_157668741.1\|3653916_3654069_-	hypothetical protein	NA	NA	NA	NA
WP_157668821.1\|3654196_3654412_-	DNA-binding protein	Q4ZA66	Staphylococcus_virus	1.5e-07	47.1
WP_012201002.1\|3654602_3654932_+	helix-turn-helix transcriptional regulator	A0A2H4JFU5	uncultured_Caudovirales_phage	2.2e-23	47.2
WP_157668742.1\|3654928_3655618_+	ImmA/IrrE family metallo-endopeptidase	A0A2H4JAE0	uncultured_Caudovirales_phage	4.7e-23	40.1
WP_012201004.1\|3655704_3656382_+	hypothetical protein	NA	NA	NA	NA
WP_012201005.1\|3656561_3657896_+	recombinase family protein	D2IZV7	Enterococcus_phage	1.9e-65	34.8
WP_012201006.1\|3657957_3659730_+	cation-transporting P-type ATPase	A0A1J0FA34	Only_Syngen_Nebraska_virus	3.7e-56	33.0

DBSCAN-SWA_4

3877668 : 3885061

Streptococcus_phage(50.0%)

transposase,tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_012201180.1\|3877668_3878511_+	AraC family transcriptional regulator	D0R0F8	Streptococcus_phage	2.9e-35	35.2
WP_041703741.1\|3878836_3879802_-\|transposase	IS3 family transposase	A0A0C5AEA5	Paenibacillus_phage	4.2e-62	53.6
WP_012200193.1\|3879813_3880500_-	helix-turn-helix domain-containing protein	A0A0C5AJ29	Paenibacillus_phage	1.9e-37	40.7
WP_012201182.1\|3880837_3881785_-\|tRNA	methionyl-tRNA formyltransferase	E3SNR5	Prochlorococcus_phage	1.6e-10	33.0
WP_012201183.1\|3882396_3882762_+	VOC family protein	NA	NA	NA	NA
WP_012201184.1\|3882856_3883609_+	class I SAM-dependent methyltransferase	A0A1X9I669	Streptococcus_phage	3.9e-07	27.7
WP_012201185.1\|3883665_3884091_+	glyoxalase/bleomycin resistance/dioxygenase family protein	NA	NA	NA	NA
WP_012201186.1\|3884182_3885061_+	AraC family transcriptional regulator	A0A1B0RXG1	Streptococcus_phage	8.3e-25	41.7

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_010001

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection