Definition Clostridium botulinum A2 str. Kyoto chromosome, complete genome.
Accession NC_012563
Length 4,155,278

Click here to switch to the map view.

The map label for this gene is 226949154

Identifier: 226949154

GI number: 226949154

Start: 2130648

End: 2133542

Strand: Reverse

Name: 226949154

Synonym: CLM_2072

Alternate gene names: NA

Gene position: 2133542-2130648 (Counterclockwise)

Preceding gene: 226949155

Following gene: 226949153

Centisome position: 51.35

GC content: 25.28

Gene sequence:

>2895_bases
ATGAGAAATAGAAATATAATGATTTTAAATGTACAAGCTAAAGATGTTATGGATGGAGGATATATAGTAGATAAAAAATC
TAAAAAAGATATACATAAATTATGTGAGGAAGAAAAGAGAATATTTAGTAAATATAAAGGTAGTATGGATTATAGTTTAT
TAACTATGTATTTACAAGAAAATCATAAGAAATTTATTAAGGTAAATAAGAAAAAACAGAGATATTATAGTAATGATATG
ATTACAGTTAACTTTGATTATTCTGTAACAGAAGAATATAAAAATAAAAAAGGAAAAACAAAAAAGAAAGTTATTACATC
TACTAAAGAATTAAGAGAAAAATTATATAAAGATGGATTTACCTTGAATGTAAATGGTGTAGATACTAAATATGTAAGAC
TTTATAGATCAAGTGGAAGTGCTAGAAATGGAAAAGTAAATTTTGTGAATGAAAAATACTATGAAGATATATTAAAATAT
TGTATGGCTGGAATTGAATATAAAAATAAGAACGATTTAGATTTACCTTCAATTGAAGCTTATATATCCTTAATAGCTAC
AAGTATTATAGATACGTTTCAAATGAGTCCTAAAAATGTATTATTAATTGATGATATAGAAAGTACATTTCCAGATACGG
TTATGGCTACAGAATTAATTAAGAAAAAATATGATGAAAAAGGAAATGTTAAAAGAGGTGAATTACATACATATGTAGCA
GAAAAAGAAATAACTAATAAATTGACAGATGGTGAAGCTTTGTTATCAAAAGAAATTTTTGAGGAAAATTGTTATGGAGA
CAAAGCTACAATTCAATTAAGAAATAGATTTTATAAAGGTATAGGAATAAACACAGATATACAACAATTTTTTGAGGATA
ATGGTATTACGAATGTAAGTCAGTTGAATGGAAAAACATTAGCTAAGGATATAAAAGATATTAAATTAATAACTACAAAA
TCCTCAATAAAGTATCTAAAAAAAGAATTTAACAAAACTTTTGAAGAGTGGTGTGATATAGCTTTAGATACATGGGGAAT
ATGTAAGACAGATAAAGGTCAACATCATAATTTTAATAATATGGCCTTTACACACTACCAGTTACTTAACACGCTAGGAA
TGTCATATAAAGAAATGGAACAATTTCTCCAACCAACAAAAGAATATATTAAATTATTAAAAAATGATGTATCTGTATTT
AAGCTATATTTAGGATTAATTAAAGATGGAACGCTTAAAGAAATATTAGAAGAGTGTGAAGAAGATACAACAGAATTAGA
AGATTTTACAAGTAATAGCGAATTTGTATTGAATATGTTAAAAATTAATGAAGACTTTATAAATACTAAGATATGTAAAA
AATTTAGAGAAGAAATAATTAATAACTATAAAAAGAATGTTAAGAAAGGTCACGTCTTAATAAATGGTACATATGCAACT
GTTATAAATAATCCATATGAATACTTGTTAGCTAGTATAGGACAATATAAGGGGCTTTCTAAAACGTTACATAAGAGAGA
ATGCTATTGTAAGAAATATAATAATGGTGATGATATATTGGCAGTGCGTTCACCACAGCCTACAATGAGCAATGTTACAA
CTATGATAAATAATACAGAATGTAAAGAATTTGATGAATATTTTAATCCTACAGATAATGTAATATTTATTAGTAGTATA
GGTTGGAACATAATGGAGCTTGAAAGTTCTATGGATTTTGATGGAGACTGTTGCTTAATCACAAATGACCGATTACTCAC
AAGAAAATATAGGAAATTGGATGAAGATATAGCAATTGATGGTAAGACTATTAAAAGATTTTTAGTATCTACTGACTTTA
CATGGAAATCACCTATACCACGATCTTATACTCCTAAAGATTTAGCCAATACAGATATAAATTGTGCTGAAGGAAAAATC
GGAGAGGTTATAAACCTTGTACAAATGCTTAATAGTGTATATTGGGATAAAAAATATAAAGGTGAAAAATTAATAAAGAA
GGGTTTATTAACAAGAGGAAAATTAGAGAAAGAATTATTTGAGTTATATAGGGATATAAGTAATTTAAATATATTGTCTT
GTATTGTTATAGATTCGGCAAAAAAATCTAGTCCAGTTGATGTTACAAAAGAATTAGATAGAATTAGAGCTAAAGGTTAT
CTAGGAAGAGATACTATAAGAGTTTATAATAAAGATACTAGAAAATGGGAAGATAAAGAGGTTGGTATAAGACCATTTTT
CTTTAAATTTTTGGATGGTGGTAAAGATTATAAATTTAATAAATATGATACTGGGATGGATTATTTAATAAGAATTATGA
ATAAAGGTGACGATAGAAAAGATGCAAACGACACAACGATAAATTTAAAGGATTGTTTAATTAAGCAAAAAATGAATGAA
GCTGACAGAAAGAAAATACAAAAATTCACAAACTTAGTTGCGAGGGAACAGTATGAAATATCTAATGTGTATAAGAATGA
TAAATTAGAAGTTAAGGAAGAATATAGACAAGTACAAGATATTAAAGCGGATTTTAAAGAGAAGTTTGATAAAATTACAT
TAAATAAAGTAACTATTTATACAATTATTAAAAGATTGAGTAAGGCTATTAAGATATTAGATAATAATAGAAAGATATTA
AAAAAACAAAAAAAAGATTTAAGGAAAGTTAAAAGATTTCATGAGATAGAGGAGTTAAAAAAACAATTTAATGAAGATAA
TGAAAGTAATATAAAGTTCGTCAGAATTGGAAGAGGAGTATTAAGACATCTTTATGAACTAGATTCTGTATTATTTTTAA
GTTGTTTTAGGGTAAAAGCTAATACAAGTACGATTTATAGAAGTGATAATGGTGATATACATATATATGAAGTTAAATAT
AAAAAGTTAGGATAA

Upstream 100 bases:

>100_bases
GGAAAACTACATATAATAAAATACGAAAATTTGCCAAATCTTCAAAGGAGATGTTAGTAATTCTAATAAATCATAAAAAA
TCAAAAGGGGTGTATGTTAT

Downstream 100 bases:

>100_bases
AAAATTTTGAAAAAATTGCACGACCCATTTTATGTGGACAAGTAATATCAATGAGTACAGAGGGTTTATTTTCACTCTAT
ATGGGAGGGAATAACTCTTC

Product: hypothetical protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 964; Mature: 964

Protein sequence:

>964_residues
MRNRNIMILNVQAKDVMDGGYIVDKKSKKDIHKLCEEEKRIFSKYKGSMDYSLLTMYLQENHKKFIKVNKKKQRYYSNDM
ITVNFDYSVTEEYKNKKGKTKKKVITSTKELREKLYKDGFTLNVNGVDTKYVRLYRSSGSARNGKVNFVNEKYYEDILKY
CMAGIEYKNKNDLDLPSIEAYISLIATSIIDTFQMSPKNVLLIDDIESTFPDTVMATELIKKKYDEKGNVKRGELHTYVA
EKEITNKLTDGEALLSKEIFEENCYGDKATIQLRNRFYKGIGINTDIQQFFEDNGITNVSQLNGKTLAKDIKDIKLITTK
SSIKYLKKEFNKTFEEWCDIALDTWGICKTDKGQHHNFNNMAFTHYQLLNTLGMSYKEMEQFLQPTKEYIKLLKNDVSVF
KLYLGLIKDGTLKEILEECEEDTTELEDFTSNSEFVLNMLKINEDFINTKICKKFREEIINNYKKNVKKGHVLINGTYAT
VINNPYEYLLASIGQYKGLSKTLHKRECYCKKYNNGDDILAVRSPQPTMSNVTTMINNTECKEFDEYFNPTDNVIFISSI
GWNIMELESSMDFDGDCCLITNDRLLTRKYRKLDEDIAIDGKTIKRFLVSTDFTWKSPIPRSYTPKDLANTDINCAEGKI
GEVINLVQMLNSVYWDKKYKGEKLIKKGLLTRGKLEKELFELYRDISNLNILSCIVIDSAKKSSPVDVTKELDRIRAKGY
LGRDTIRVYNKDTRKWEDKEVGIRPFFFKFLDGGKDYKFNKYDTGMDYLIRIMNKGDDRKDANDTTINLKDCLIKQKMNE
ADRKKIQKFTNLVAREQYEISNVYKNDKLEVKEEYRQVQDIKADFKEKFDKITLNKVTIYTIIKRLSKAIKILDNNRKIL
KKQKKDLRKVKRFHEIEELKKQFNEDNESNIKFVRIGRGVLRHLYELDSVLFLSCFRVKANTSTIYRSDNGDIHIYEVKY
KKLG

Sequences:

>Translated_964_residues
MRNRNIMILNVQAKDVMDGGYIVDKKSKKDIHKLCEEEKRIFSKYKGSMDYSLLTMYLQENHKKFIKVNKKKQRYYSNDM
ITVNFDYSVTEEYKNKKGKTKKKVITSTKELREKLYKDGFTLNVNGVDTKYVRLYRSSGSARNGKVNFVNEKYYEDILKY
CMAGIEYKNKNDLDLPSIEAYISLIATSIIDTFQMSPKNVLLIDDIESTFPDTVMATELIKKKYDEKGNVKRGELHTYVA
EKEITNKLTDGEALLSKEIFEENCYGDKATIQLRNRFYKGIGINTDIQQFFEDNGITNVSQLNGKTLAKDIKDIKLITTK
SSIKYLKKEFNKTFEEWCDIALDTWGICKTDKGQHHNFNNMAFTHYQLLNTLGMSYKEMEQFLQPTKEYIKLLKNDVSVF
KLYLGLIKDGTLKEILEECEEDTTELEDFTSNSEFVLNMLKINEDFINTKICKKFREEIINNYKKNVKKGHVLINGTYAT
VINNPYEYLLASIGQYKGLSKTLHKRECYCKKYNNGDDILAVRSPQPTMSNVTTMINNTECKEFDEYFNPTDNVIFISSI
GWNIMELESSMDFDGDCCLITNDRLLTRKYRKLDEDIAIDGKTIKRFLVSTDFTWKSPIPRSYTPKDLANTDINCAEGKI
GEVINLVQMLNSVYWDKKYKGEKLIKKGLLTRGKLEKELFELYRDISNLNILSCIVIDSAKKSSPVDVTKELDRIRAKGY
LGRDTIRVYNKDTRKWEDKEVGIRPFFFKFLDGGKDYKFNKYDTGMDYLIRIMNKGDDRKDANDTTINLKDCLIKQKMNE
ADRKKIQKFTNLVAREQYEISNVYKNDKLEVKEEYRQVQDIKADFKEKFDKITLNKVTIYTIIKRLSKAIKILDNNRKIL
KKQKKDLRKVKRFHEIEELKKQFNEDNESNIKFVRIGRGVLRHLYELDSVLFLSCFRVKANTSTIYRSDNGDIHIYEVKY
KKLG
>Mature_964_residues
MRNRNIMILNVQAKDVMDGGYIVDKKSKKDIHKLCEEEKRIFSKYKGSMDYSLLTMYLQENHKKFIKVNKKKQRYYSNDM
ITVNFDYSVTEEYKNKKGKTKKKVITSTKELREKLYKDGFTLNVNGVDTKYVRLYRSSGSARNGKVNFVNEKYYEDILKY
CMAGIEYKNKNDLDLPSIEAYISLIATSIIDTFQMSPKNVLLIDDIESTFPDTVMATELIKKKYDEKGNVKRGELHTYVA
EKEITNKLTDGEALLSKEIFEENCYGDKATIQLRNRFYKGIGINTDIQQFFEDNGITNVSQLNGKTLAKDIKDIKLITTK
SSIKYLKKEFNKTFEEWCDIALDTWGICKTDKGQHHNFNNMAFTHYQLLNTLGMSYKEMEQFLQPTKEYIKLLKNDVSVF
KLYLGLIKDGTLKEILEECEEDTTELEDFTSNSEFVLNMLKINEDFINTKICKKFREEIINNYKKNVKKGHVLINGTYAT
VINNPYEYLLASIGQYKGLSKTLHKRECYCKKYNNGDDILAVRSPQPTMSNVTTMINNTECKEFDEYFNPTDNVIFISSI
GWNIMELESSMDFDGDCCLITNDRLLTRKYRKLDEDIAIDGKTIKRFLVSTDFTWKSPIPRSYTPKDLANTDINCAEGKI
GEVINLVQMLNSVYWDKKYKGEKLIKKGLLTRGKLEKELFELYRDISNLNILSCIVIDSAKKSSPVDVTKELDRIRAKGY
LGRDTIRVYNKDTRKWEDKEVGIRPFFFKFLDGGKDYKFNKYDTGMDYLIRIMNKGDDRKDANDTTINLKDCLIKQKMNE
ADRKKIQKFTNLVAREQYEISNVYKNDKLEVKEEYRQVQDIKADFKEKFDKITLNKVTIYTIIKRLSKAIKILDNNRKIL
KKQKKDLRKVKRFHEIEELKKQFNEDNESNIKFVRIGRGVLRHLYELDSVLFLSCFRVKANTSTIYRSDNGDIHIYEVKY
KKLG

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 112913; Mature: 112913

Theoretical pI: Translated: 9.44; Mature: 9.44

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.7 %Cys     (Translated Protein)
2.2 %Met     (Translated Protein)
3.8 %Cys+Met (Translated Protein)
1.7 %Cys     (Mature Protein)
2.2 %Met     (Mature Protein)
3.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MRNRNIMILNVQAKDVMDGGYIVDKKSKKDIHKLCEEEKRIFSKYKGSMDYSLLTMYLQE
CCCCCEEEEEEEHHHCCCCCEEEECCCHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHH
NHKKFIKVNKKKQRYYSNDMITVNFDYSVTEEYKNKKGKTKKKVITSTKELREKLYKDGF
CCHHHHEECCHHHHHHCCCEEEEEECCHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHCCC
TLNVNGVDTKYVRLYRSSGSARNGKVNFVNEKYYEDILKYCMAGIEYKNKNDLDLPSIEA
EEEECCCCHHHHHEECCCCCCCCCCEEECHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHH
YISLIATSIIDTFQMSPKNVLLIDDIESTFPDTVMATELIKKKYDEKGNVKRGELHTYVA
HHHHHHHHHHHHHCCCCCCEEEEECCHHCCCHHHHHHHHHHHHHCCCCCCCCCHHHHHHH
EKEITNKLTDGEALLSKEIFEENCYGDKATIQLRNRFYKGIGINTDIQQFFEDNGITNVS
HHHHHHHCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHCCCCCCHH
QLNGKTLAKDIKDIKLITTKSSIKYLKKEFNKTFEEWCDIALDTWGICKTDKGQHHNFNN
HCCCHHHHHHHHHEEEEEEHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCC
MAFTHYQLLNTLGMSYKEMEQFLQPTKEYIKLLKNDVSVFKLYLGLIKDGTLKEILEECE
CHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHH
EDTTELEDFTSNSEFVLNMLKINEDFINTKICKKFREEIINNYKKNVKKGHVLINGTYAT
HHHHHHHHHCCCCHHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHCCCCCEEEEEEEEEE
VINNPYEYLLASIGQYKGLSKTLHKRECYCKKYNNGDDILAVRSPQPTMSNVTTMINNTE
EECCHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCCCCEEEECCCCCCHHHHHHHHCCCH
CKEFDEYFNPTDNVIFISSIGWNIMELESSMDFDGDCCLITNDRLLTRKYRKLDEDIAID
HHHHHHHCCCCCCEEEEECCCCEEEEECCCCCCCCCEEEEECCHHHHHHHHHCCCCCCCC
GKTIKRFLVSTDFTWKSPIPRSYTPKDLANTDINCAEGKIGEVINLVQMLNSVYWDKKYK
HHHHHHHHHHCCCCCCCCCCCCCCCHHHCCCCCCCCCCHHHHHHHHHHHHHHHHCCCCCC
GEKLIKKGLLTRGKLEKELFELYRDISNLNILSCIVIDSAKKSSPVDVTKELDRIRAKGY
HHHHHHHHCCCCCHHHHHHHHHHHHHCCCCEEEEEEEECCCCCCCCHHHHHHHHHHHCCC
LGRDTIRVYNKDTRKWEDKEVGIRPFFFKFLDGGKDYKFNKYDTGMDYLIRIMNKGDDRK
CCCCEEEEECCCCCCCCCCCCCCCHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHCCCCCC
DANDTTINLKDCLIKQKMNEADRKKIQKFTNLVAREQYEISNVYKNDKLEVKEEYRQVQD
CCCCCEEEHHHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHH
IKADFKEKFDKITLNKVTIYTIIKRLSKAIKILDNNRKILKKQKKDLRKVKRFHEIEELK
HHHHHHHHHHCEEECHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHH
KQFNEDNESNIKFVRIGRGVLRHLYELDSVLFLSCFRVKANTSTIYRSDNGDIHIYEVKY
HHHCCCCCCCEEEEEECHHHHHHHHHHHHHHHHHHHHEECCCCEEEECCCCCEEEEEEEE
KKLG
ECCC
>Mature Secondary Structure
MRNRNIMILNVQAKDVMDGGYIVDKKSKKDIHKLCEEEKRIFSKYKGSMDYSLLTMYLQE
CCCCCEEEEEEEHHHCCCCCEEEECCCHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHH
NHKKFIKVNKKKQRYYSNDMITVNFDYSVTEEYKNKKGKTKKKVITSTKELREKLYKDGF
CCHHHHEECCHHHHHHCCCEEEEEECCHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHCCC
TLNVNGVDTKYVRLYRSSGSARNGKVNFVNEKYYEDILKYCMAGIEYKNKNDLDLPSIEA
EEEECCCCHHHHHEECCCCCCCCCCEEECHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHH
YISLIATSIIDTFQMSPKNVLLIDDIESTFPDTVMATELIKKKYDEKGNVKRGELHTYVA
HHHHHHHHHHHHHCCCCCCEEEEECCHHCCCHHHHHHHHHHHHHCCCCCCCCCHHHHHHH
EKEITNKLTDGEALLSKEIFEENCYGDKATIQLRNRFYKGIGINTDIQQFFEDNGITNVS
HHHHHHHCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHCCCCCCHH
QLNGKTLAKDIKDIKLITTKSSIKYLKKEFNKTFEEWCDIALDTWGICKTDKGQHHNFNN
HCCCHHHHHHHHHEEEEEEHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCC
MAFTHYQLLNTLGMSYKEMEQFLQPTKEYIKLLKNDVSVFKLYLGLIKDGTLKEILEECE
CHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHH
EDTTELEDFTSNSEFVLNMLKINEDFINTKICKKFREEIINNYKKNVKKGHVLINGTYAT
HHHHHHHHHCCCCHHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHCCCCCEEEEEEEEEE
VINNPYEYLLASIGQYKGLSKTLHKRECYCKKYNNGDDILAVRSPQPTMSNVTTMINNTE
EECCHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCCCCEEEECCCCCCHHHHHHHHCCCH
CKEFDEYFNPTDNVIFISSIGWNIMELESSMDFDGDCCLITNDRLLTRKYRKLDEDIAID
HHHHHHHCCCCCCEEEEECCCCEEEEECCCCCCCCCEEEEECCHHHHHHHHHCCCCCCCC
GKTIKRFLVSTDFTWKSPIPRSYTPKDLANTDINCAEGKIGEVINLVQMLNSVYWDKKYK
HHHHHHHHHHCCCCCCCCCCCCCCCHHHCCCCCCCCCCHHHHHHHHHHHHHHHHCCCCCC
GEKLIKKGLLTRGKLEKELFELYRDISNLNILSCIVIDSAKKSSPVDVTKELDRIRAKGY
HHHHHHHHCCCCCHHHHHHHHHHHHHCCCCEEEEEEEECCCCCCCCHHHHHHHHHHHCCC
LGRDTIRVYNKDTRKWEDKEVGIRPFFFKFLDGGKDYKFNKYDTGMDYLIRIMNKGDDRK
CCCCEEEEECCCCCCCCCCCCCCCHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHCCCCCC
DANDTTINLKDCLIKQKMNEADRKKIQKFTNLVAREQYEISNVYKNDKLEVKEEYRQVQD
CCCCCEEEHHHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHH
IKADFKEKFDKITLNKVTIYTIIKRLSKAIKILDNNRKILKKQKKDLRKVKRFHEIEELK
HHHHHHHHHHCEEECHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHH
KQFNEDNESNIKFVRIGRGVLRHLYELDSVLFLSCFRVKANTSTIYRSDNGDIHIYEVKY
HHHCCCCCCCEEEEEECHHHHHHHHHHHHHHHHHHHHEECCCCEEEECCCCCEEEEEEEE
KKLG
ECCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA