BacMap

Definition	Clostridium botulinum B str. Eklund 17B, complete genome.
Accession	NC_010674
Length	3,800,327

Click here to switch to the map view.

The map label for this gene is toxA [H]

Identifier: 187934913

GI number: 187934913

Start: 3336467

End: 3338680

Strand: Reverse

Name: toxA [H]

Synonym: CLL_A3205

Alternate gene names: 187934913

Gene position: 3338680-3336467 (Counterclockwise)

Preceding gene: 187932849

Following gene: 187935261

Centisome position: 87.85

GC content: 31.66

Gene sequence:

>2214_bases
TTGAATATTAAAAGTAAAATAGTGTCATTTTTATTTGTATTTGTAATGGCACTAGGTTTTATACCGTCAACTATGGTACA
TGCATCTGTAAAAGATATAAACATAATATCAGAGACAGAAGCTACTGCAAGTGATGCAAAAAAATGGGCAAAAACTAAAG
GTGCAACTGAAGAATTTTTAAGTCTAGCAGATCTTTATTGGAAGTATTCAGAGACTTGCGGAGATGTTAATCCAGCCATT
GCATATGTACAATCAGCAAAAGAAACTGGATTTGGAAGATTTGGAGGGGTATTAGATTCGAGTTTTCGTAATCCATGTGG
AATGAAGACCTCACAAGGTGGATCAGATGGAGATAAAAATGCTCATAAGAAGTTTAATACTTGGGATGAAGGTGTACAAG
CTCACATGGATCATTTAGCACTTTATGCAGGGGCTAATGGTTATCCTAAAAGTGATACATATGATCCAAGACATTTCATA
AGTATAAAAGGAAAATCACCAACTGTTAATTCATTAGGCGGAAAATGGGCCCCAAGTCTTACTTATGGAGAAGAAGTAAA
TAAATATTACATAGAATTATGTAATTATTCAAATATTGCGGTTAATAAAGATGAGCAAAAAGATTATGAAGATAATTTAA
ATGACAATGATGATAATGATTCATCTCATTTTTCACCACCAGGACCGGTTGAAAATAAGCCTAATTCTTTAATAACTGAT
TCTGTAATTATGTTTGATAATTCTTTTGTTGAGCCAACACTTAATAGAGAAACAAATGTTAGTTCAGATATAGGTTGGAA
AGAAGATGATGGAAAGTGGTACTATTATTATTCAGATGAAAGCAAGGCAGCTGGATGGATTAATCCTAATGGAAACTGGT
ACTATTTAAATTCTACAGGGGAGATGTCTGTAGGATGGACGGATTTAGATAATTCTTGGTATTATTTTGATGATGATGGA
ATTATGGTGACTGGTTGGAAGTGTATAAATAATAATTGGTATTACCTAAAGACAAGTGGTATAATGGCAACTGGATTTTT
ACAAAATGCAAATGATTTATATTACCTAGATAAGTCAGGTGTTATGCTTTCAAAAGAAGGTTGGAATTTAATAGATGAAA
AATGGTGCTATGTTGAAAATGGTGGTAACCTAAAATTAGGTTGGCTTTTAGACAATGGAAATAAGTATTATCTTCAAGGC
GATGGAAGTATGGTTACAGGAATAAAGTTAATAGATAATAAAACTTATGTGTTTGATCAAAATGGAATCAACAAAACAGG
TTGGACAAATATAAATAATTATTGGTATTACTTTAATGAAAACTCAGAAATGAGTACAGGATGGCTTAATTTAAATGGAA
CTCATTATTATTTATATGATACTGGGGCTATGGCAACAGGATGGTTAAGTATTGATGATGATTGGTACCATTTTAATAAT
GATGGAAGTAGAAGCTTAGGATGGGTACAAAGTGGTGGATATTACTATTACTTAGACTTACAAAGTGGAAAGCTACTTAA
GAATACAAAAGTTGATGGTTATGAAATAGATAGTAATGGAAGACGAAAATCTGATAAAAATGATGTGATTTCAGGAAATA
CCTCTAATAATGTAATTGTTGTTGATGCAGGTCATAACTTTGGTGGAGATGATGGAGCATATGCTACAAACAATGGAATT
ACTTATTCAGAAAGAGACTTAAATATGGAAGTTGCAGTAAAACTTAAATCAGAACTTGAAAATAGAGGTTATACTGTTGC
TATGACTAGAAATGAATCAGATAGAGAAACATTAGCAGCTATGCAGAGTCTTGATAAAAGAGTTAAATTAGCGAATGATC
TTAATGCTACTTTATTTGTAAGTATACATCATAATTCAGCAGATGCAGTATCTGCAAATGGAGTTGAAGTATTTTATAGT
ACTAATGCTCAAGACGATAGAATGGGTAGGAAATCACCTAATCAATTAAGAATTGAAAAGAGTAAAGCAATGGCAACAAG
TATTGTAAATAATATCTGTAGTAAAACAGGCACTATAAATAGAGGACCTAAAGATGGGAATTTAAATGTTTGTAGAAATA
CTAATATGCCTGCAATACTTATTGAATGTGGATTTATAACTAATGCTAATGAAGCTGCAAGATGTGCTGATTCAAATAAT
CAAACAATTGTAGCAAAAGCAATAGCTGAGGCAATTCAAAATCAATTAAATTAA

Upstream 100 bases:

>100_bases
ATTTACATTAAGAACTTCATGTGATAAAATTAGATTATATTGTAAGAAAAATGGATGATTATGTTAAAAAATGTGACAAC
TAGGAAGGGGGAATACTATT

Downstream 100 bases:

>100_bases
TGATAGAAAATAAGAGAAATTAAACAAAAGAATCTTCTACTTAAACATTAAGTTTAAGTAGAAGATTCTTTTCTTTTTTT
TTCTATGGAAAATGAAACCA

Product: surface protein PspC

Products: Hydrolyzed cell wall glycopeptides; N-acetylmuramoyl residues; L-amino acid residues [C]

Alternate protein names: NA

Number of amino acids: Translated: 737; Mature: 737

Protein sequence:

>737_residues
MNIKSKIVSFLFVFVMALGFIPSTMVHASVKDINIISETEATASDAKKWAKTKGATEEFLSLADLYWKYSETCGDVNPAI
AYVQSAKETGFGRFGGVLDSSFRNPCGMKTSQGGSDGDKNAHKKFNTWDEGVQAHMDHLALYAGANGYPKSDTYDPRHFI
SIKGKSPTVNSLGGKWAPSLTYGEEVNKYYIELCNYSNIAVNKDEQKDYEDNLNDNDDNDSSHFSPPGPVENKPNSLITD
SVIMFDNSFVEPTLNRETNVSSDIGWKEDDGKWYYYYSDESKAAGWINPNGNWYYLNSTGEMSVGWTDLDNSWYYFDDDG
IMVTGWKCINNNWYYLKTSGIMATGFLQNANDLYYLDKSGVMLSKEGWNLIDEKWCYVENGGNLKLGWLLDNGNKYYLQG
DGSMVTGIKLIDNKTYVFDQNGINKTGWTNINNYWYYFNENSEMSTGWLNLNGTHYYLYDTGAMATGWLSIDDDWYHFNN
DGSRSLGWVQSGGYYYYLDLQSGKLLKNTKVDGYEIDSNGRRKSDKNDVISGNTSNNVIVVDAGHNFGGDDGAYATNNGI
TYSERDLNMEVAVKLKSELENRGYTVAMTRNESDRETLAAMQSLDKRVKLANDLNATLFVSIHHNSADAVSANGVEVFYS
TNAQDDRMGRKSPNQLRIEKSKAMATSIVNNICSKTGTINRGPKDGNLNVCRNTNMPAILIECGFITNANEAARCADSNN
QTIVAKAIAEAIQNQLN

Sequences:

>Translated_737_residues
MNIKSKIVSFLFVFVMALGFIPSTMVHASVKDINIISETEATASDAKKWAKTKGATEEFLSLADLYWKYSETCGDVNPAI
AYVQSAKETGFGRFGGVLDSSFRNPCGMKTSQGGSDGDKNAHKKFNTWDEGVQAHMDHLALYAGANGYPKSDTYDPRHFI
SIKGKSPTVNSLGGKWAPSLTYGEEVNKYYIELCNYSNIAVNKDEQKDYEDNLNDNDDNDSSHFSPPGPVENKPNSLITD
SVIMFDNSFVEPTLNRETNVSSDIGWKEDDGKWYYYYSDESKAAGWINPNGNWYYLNSTGEMSVGWTDLDNSWYYFDDDG
IMVTGWKCINNNWYYLKTSGIMATGFLQNANDLYYLDKSGVMLSKEGWNLIDEKWCYVENGGNLKLGWLLDNGNKYYLQG
DGSMVTGIKLIDNKTYVFDQNGINKTGWTNINNYWYYFNENSEMSTGWLNLNGTHYYLYDTGAMATGWLSIDDDWYHFNN
DGSRSLGWVQSGGYYYYLDLQSGKLLKNTKVDGYEIDSNGRRKSDKNDVISGNTSNNVIVVDAGHNFGGDDGAYATNNGI
TYSERDLNMEVAVKLKSELENRGYTVAMTRNESDRETLAAMQSLDKRVKLANDLNATLFVSIHHNSADAVSANGVEVFYS
TNAQDDRMGRKSPNQLRIEKSKAMATSIVNNICSKTGTINRGPKDGNLNVCRNTNMPAILIECGFITNANEAARCADSNN
QTIVAKAIAEAIQNQLN
>Mature_737_residues
MNIKSKIVSFLFVFVMALGFIPSTMVHASVKDINIISETEATASDAKKWAKTKGATEEFLSLADLYWKYSETCGDVNPAI
AYVQSAKETGFGRFGGVLDSSFRNPCGMKTSQGGSDGDKNAHKKFNTWDEGVQAHMDHLALYAGANGYPKSDTYDPRHFI
SIKGKSPTVNSLGGKWAPSLTYGEEVNKYYIELCNYSNIAVNKDEQKDYEDNLNDNDDNDSSHFSPPGPVENKPNSLITD
SVIMFDNSFVEPTLNRETNVSSDIGWKEDDGKWYYYYSDESKAAGWINPNGNWYYLNSTGEMSVGWTDLDNSWYYFDDDG
IMVTGWKCINNNWYYLKTSGIMATGFLQNANDLYYLDKSGVMLSKEGWNLIDEKWCYVENGGNLKLGWLLDNGNKYYLQG
DGSMVTGIKLIDNKTYVFDQNGINKTGWTNINNYWYYFNENSEMSTGWLNLNGTHYYLYDTGAMATGWLSIDDDWYHFNN
DGSRSLGWVQSGGYYYYLDLQSGKLLKNTKVDGYEIDSNGRRKSDKNDVISGNTSNNVIVVDAGHNFGGDDGAYATNNGI
TYSERDLNMEVAVKLKSELENRGYTVAMTRNESDRETLAAMQSLDKRVKLANDLNATLFVSIHHNSADAVSANGVEVFYS
TNAQDDRMGRKSPNQLRIEKSKAMATSIVNNICSKTGTINRGPKDGNLNVCRNTNMPAILIECGFITNANEAARCADSNN
QTIVAKAIAEAIQNQLN

Specific function: Only after the enteral delivery of the enterotoxin A may the characteristic disease called pseudomembranous colitis be induced [H]

COG id: COG5263

COG function: function code R; FOG: Glucan-binding domain (YG repeat)

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 32 cell wall-binding repeats [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR018337
- InterPro:   IPR007577
- InterPro:   IPR020974 [H]

Pfam domain/function: PF01473 CW_binding_1; PF04488 Gly_transf_sug; PF11713 Peptidase_C80 [H]

EC number: 3.5.1.28 [C]

Molecular weight: Translated: 82349; Mature: 82349

Theoretical pI: Translated: 4.70; Mature: 4.70

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.2 %Cys     (Translated Protein)
2.6 %Met     (Translated Protein)
3.8 %Cys+Met (Translated Protein)
1.2 %Cys     (Mature Protein)
2.6 %Met     (Mature Protein)
3.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MNIKSKIVSFLFVFVMALGFIPSTMVHASVKDINIISETEATASDAKKWAKTKGATEEFL
CCHHHHHHHHHHHHHHHHHCCCHHHHHCCCCCEEEEECCCCCHHHHHHHHHCCCCHHHHH
SLADLYWKYSETCGDVNPAIAYVQSAKETGFGRFGGVLDSSFRNPCGMKTSQGGSDGDKN
HHHHHHHHHHHHCCCCCHHHHHHHHHHHCCCCHHCCHHHHCCCCCCCCCCCCCCCCCCCC
AHKKFNTWDEGVQAHMDHLALYAGANGYPKSDTYDPRHFISIKGKSPTVNSLGGKWAPSL
HHHCCCCHHHHHHHHHHHEEEEECCCCCCCCCCCCCCEEEEEECCCCCHHCCCCCCCCCC
TYGEEVNKYYIELCNYSNIAVNKDEQKDYEDNLNDNDDNDSSHFSPPGPVENKPNSLITD
CCHHHHCEEEEEEECCCCEEECCCCCHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCEEEC
SVIMFDNSFVEPTLNRETNVSSDIGWKEDDGKWYYYYSDESKAAGWINPNGNWYYLNSTG
EEEEECCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCCCCCEEECCCCCEEEECCCC
EMSVGWTDLDNSWYYFDDDGIMVTGWKCINNNWYYLKTSGIMATGFLQNANDLYYLDKSG
CEEEEEEECCCCEEEECCCCEEEEEEEEECCCEEEEEECCEEEEEEECCCCCEEEECCCC
VMLSKEGWNLIDEKWCYVENGGNLKLGWLLDNGNKYYLQGDGSMVTGIKLIDNKTYVFDQ
EEEECCCCCCCCCCEEEEECCCCEEEEEEEECCCEEEEEECCCEEEEEEEECCCEEEEEC
NGINKTGWTNINNYWYYFNENSEMSTGWLNLNGTHYYLYDTGAMATGWLSIDDDWYHFNN
CCCCCCCCCCCCCEEEEECCCCCCEEEEEEECCEEEEEEECCCEEEEEEEECCCEEEECC
DGSRSLGWVQSGGYYYYLDLQSGKLLKNTKVDGYEIDSNGRRKSDKNDVISGNTSNNVIV
CCCCCCCEEECCCEEEEEECCCCCEEECCCCCCEEECCCCCCCCCCCCEECCCCCCCEEE
VDAGHNFGGDDGAYATNNGITYSERDLNMEVAVKLKSELENRGYTVAMTRNESDRETLAA
EECCCCCCCCCCCEEECCCCEEECCCCCEEEEEEEHHHHHHCCEEEEEECCCCHHHHHHH
MQSLDKRVKLANDLNATLFVSIHHNSADAVSANGVEVFYSTNAQDDRMGRKSPNQLRIEK
HHHHHHHHHHHCCCCEEEEEEEECCCCCEEECCCEEEEEECCCCHHHCCCCCCCCEEEEH
SKAMATSIVNNICSKTGTINRGPKDGNLNVCRNTNMPAILIECGFITNANEAARCADSNN
HHHHHHHHHHHHHHCCCCCCCCCCCCCEEEEECCCCCEEEEEECEECCCCHHHHHCCCCC
QTIVAKAIAEAIQNQLN
CEEHHHHHHHHHHHHCC
>Mature Secondary Structure
MNIKSKIVSFLFVFVMALGFIPSTMVHASVKDINIISETEATASDAKKWAKTKGATEEFL
CCHHHHHHHHHHHHHHHHHCCCHHHHHCCCCCEEEEECCCCCHHHHHHHHHCCCCHHHHH
SLADLYWKYSETCGDVNPAIAYVQSAKETGFGRFGGVLDSSFRNPCGMKTSQGGSDGDKN
HHHHHHHHHHHHCCCCCHHHHHHHHHHHCCCCHHCCHHHHCCCCCCCCCCCCCCCCCCCC
AHKKFNTWDEGVQAHMDHLALYAGANGYPKSDTYDPRHFISIKGKSPTVNSLGGKWAPSL
HHHCCCCHHHHHHHHHHHEEEEECCCCCCCCCCCCCCEEEEEECCCCCHHCCCCCCCCCC
TYGEEVNKYYIELCNYSNIAVNKDEQKDYEDNLNDNDDNDSSHFSPPGPVENKPNSLITD
CCHHHHCEEEEEEECCCCEEECCCCCHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCEEEC
SVIMFDNSFVEPTLNRETNVSSDIGWKEDDGKWYYYYSDESKAAGWINPNGNWYYLNSTG
EEEEECCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCCCCCEEECCCCCEEEECCCC
EMSVGWTDLDNSWYYFDDDGIMVTGWKCINNNWYYLKTSGIMATGFLQNANDLYYLDKSG
CEEEEEEECCCCEEEECCCCEEEEEEEEECCCEEEEEECCEEEEEEECCCCCEEEECCCC
VMLSKEGWNLIDEKWCYVENGGNLKLGWLLDNGNKYYLQGDGSMVTGIKLIDNKTYVFDQ
EEEECCCCCCCCCCEEEEECCCCEEEEEEEECCCEEEEEECCCEEEEEEEECCCEEEEEC
NGINKTGWTNINNYWYYFNENSEMSTGWLNLNGTHYYLYDTGAMATGWLSIDDDWYHFNN
CCCCCCCCCCCCCEEEEECCCCCCEEEEEEECCEEEEEEECCCEEEEEEEECCCEEEECC
DGSRSLGWVQSGGYYYYLDLQSGKLLKNTKVDGYEIDSNGRRKSDKNDVISGNTSNNVIV
CCCCCCCEEECCCEEEEEECCCCCEEECCCCCCEEECCCCCCCCCCCCEECCCCCCCEEE
VDAGHNFGGDDGAYATNNGITYSERDLNMEVAVKLKSELENRGYTVAMTRNESDRETLAA
EECCCCCCCCCCCEEECCCCEEECCCCCEEEEEEEHHHHHHCCEEEEEECCCCHHHHHHH
MQSLDKRVKLANDLNATLFVSIHHNSADAVSANGVEVFYSTNAQDDRMGRKSPNQLRIEK
HHHHHHHHHHHCCCCEEEEEEEECCCCCEEECCCEEEEEECCCCHHHCCCCCCCCEEEEH
SKAMATSIVNNICSKTGTINRGPKDGNLNVCRNTNMPAILIECGFITNANEAARCADSNN
HHHHHHHHHHHHHHCCCCCCCCCCCCCEEEEECCCCCEEEEEECEECCCCHHHHHCCCCC
QTIVAKAIAEAIQNQLN
CEEHHHHHHHHHHHHCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: cell wall glycopeptides; D-lactyl-L-Ala [C]

Specific reaction: Hydrolyzes the link between N-acetylmuramoyl residues and L-amino acid residues [C]

General reaction: Carboxylic acid amide hydrolysis [C]

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 2109310; 2105276 [H]