BacMap

Definition	Escherichia coli O157:H7 str. EC4115, complete genome.
Accession	NC_011353
Length	5,572,075

Click here to switch to the map view.

The map label for this gene is dmsA [H]

Identifier: 209400103

GI number: 209400103

Start: 1075427

End: 1077871

Strand: Direct

Name: dmsA [H]

Synonym: ECH74115_1056

Alternate gene names: 209400103

Gene position: 1075427-1077871 (Clockwise)

Preceding gene: 209396596

Following gene: 209399354

Centisome position: 19.3

GC content: 52.68

Gene sequence:

>2445_bases
ATGAAAACGAAAATCCCTGATGCGGTATTGGCTGCTGAGGTGAGTCGCCGTGGTTTGGTAAAAACGACAGCGATCGGCGG
CCTGGCAATGGCCAGCAGCGCATTAACATTACCTTTTAGTCGGATTGCGCACGCTGTCGATAGCGCCATTCCAACAAAAT
CAGGCGAAAAGGTTATCTGGAGCGCCTGTACAGTTAACTGTGGTAGTCGCTGCCCGCTACGTATGCACGTCGTGGACGGT
GAAATCAAATATGTCGAAACGGACAATACCGGCGATGACAATTACGACGGCCTGCACCAGGTTCGCGCCTGCCTGCGTGG
GCGTTCCATGCGTCGCCGTGTCTACAATCCGGACCGCCTGAAATATCCGATGAAACGAGTCGGGGCGCGCGGTGAAGGCA
AATTCGAGCGCATTAGCTGGGAAGAAGCCTACGACATCATCGCGACCAATATGCAGCGCCTGATCAAAGAGTACGGCAAC
GAATCCATCTATCTGAACTATGGCACCGGTACGCTGGGTGGCACCATGACCCGCTCCTGGCCGCCGGGAAATACCCTGGT
CGCGCGGCTGATGAACTGCTGCGGCGGCTATCTGAACCATTACGGCGACTACTCCTCCGCGCAAATTGCGGAAGGTCTGA
ACTATACCTACGGCGGCTGGGCAGATGGCAACAGCCCGTCGGATATCGAAAACAGTAAGCTGGTAGTGCTGTTTGGTAAT
AACCCTGGCGAAACGCGAATGAGTGGCGGTGGGGTGACTTACTATCTTGAACAGGCACGCCAGAAATCTAATGCCCGCAT
GATCATCATCGATCCGCGCTATACCGACACCGGTGCCGGGCGCGAAGATGAGTGGATCCCTATTCGTCCGGGAACAGATG
CCGCACTGGTTAACGGTCTGGCGTACGTCATGATCACTGAAAACCTGGTGGATCAGGCATTCCTCGATAAATATTGCGTT
GGCTACGATGAGAAAACCCTGCCAGCCAGTGCGCCGAAAAATGGCCACTATAAAGCTTATATTCTGGGTGAAGGGCCAGA
TGGCGTGGCTAAAACACCGGAATGGGCCTCGCAAATCACCGGTGTTCCGGCAGACAAAATCATCAAACTGGCTCGTGAAA
TCGGCAGTACCAAACCGGCGTTTATCAGCCAGGGATGGGGCCCGCAGCGTCACGCTAACGGTGAAATCGCAACCCGTGCT
ATCTCGATGCTGGCGATTCTGACCGGTAACGTTGGTATTAATGGAGGGAACAGCGGCGCGCGTGAAGGTTCATACAGTTT
ACCGTTTGTCCGTATGCCGACCTTGGAAAACCCGATCCAGACCAGCATTTCGATGTTTATGTGGACCGATGCCATTGAAC
GTGGCCCGGAAATGACGGCGCTACGTGATGGTGTGCGCGGGAAAGATAAGCTGGATGTGCCGATCAAAATGATCTGGAAC
TATGCCGGTAACTGCCTGATTAACCAGCATTCTGAAATCAACCGTACCCATGAAATCCTTCAGGATGATAAGAAGTGCGA
GCTGATTGTGGTTATCGACTGCCACATGACCTCATCGGCGAAATATGCTGACATCCTGCTGCCTGACTGCACCGCTTCCG
AACAGATGGACTTTGCACTGGATGCATCCTGCGGGAATATGTCTTACGTGATTTTCAACGATCAGGTGATTAAACCGCGC
TTTGAATGTAAGACCATCTATGAAATGACCAGCGAACTGGCAAAACGTCTTGGCGTTGAGCAACAGTTTACTGAAGGCCG
TACCCAGGAAGAGTGGATGCGGCATCTGTATGCCCAGTCGCGGGAAGCGATTCCTGAACTGCCAACGTTTGAAGAGTTCC
GCAAGCAGGGGATCTTTAAAAAGCGCGACCCACAAGGGCATCACGTTGCTTATAAAGCCTTCCGTGAAGATCCGCAGGCA
AATCCACTGACCACGCCATCGGGTAAAATTGAGATTTATTCGCAGGCGCTGGCTGACATTGCCGCTACCTGGGAATTGCC
AGAAGGCGATGTGATCGATCCACTGCCGATCTACACGCCGGGCTTTGAAAGTTATCAGGATCCGCTGAACAAACAGTATC
CGCTGCAGCTTACAGGTTTCCACTATAAATCTCGCGTTCACTCAACTTACGGCAACGTTGATGTGCTGAAAGCGGCTTGC
CGTCAGGAAATGTGGATCAACCCGCTTGATGCCCAAAAACGCGGTATCCACAACGGCGATAAAGTCAGGATCTTTAACGA
TCGTGGTGAGGTTCATATTGAGGCGAAAGTGACGCCACGAATGATGCCGGGTGTGGTCGCACTGGGTGAAGGTGCCTGGT
ATGACCCGGATGCAAAACGTGTCGATAAGGGTGGTTGTATTAACGTACTGACCACTCAACGTCCGTCTCCTCTCGCTAAG
GGGAATCCGTCACATACAAACCTTGTTCAGGTTGAAAAGGTGTAA

Upstream 100 bases:

>100_bases
ATTCGATGTATACAAGCCTATATAGCGATCTGCTATAGAAATAATTACACAATACGGTTTGTTACTGGAATCAATCGTGA
GCAAGCTTGAGTGAGCCATT

Downstream 100 bases:

>100_bases
GGAGTAACCGATGACAACCCAGTATGGATTTTTTATTGATTCCAGCCGTTGCACCGGTTGCAAAACCTGCGAGCTGGCTT
GTAAAGACTACAAAGATTTG

Product: anaerobic dimethyl sulfoxide reductase, A subunit

Products: Reduced form of N-Oxide compounds [C]

Alternate protein names: DMSO reductase [H]

Number of amino acids: Translated: 814; Mature: 814

Protein sequence:

>814_residues
MKTKIPDAVLAAEVSRRGLVKTTAIGGLAMASSALTLPFSRIAHAVDSAIPTKSGEKVIWSACTVNCGSRCPLRMHVVDG
EIKYVETDNTGDDNYDGLHQVRACLRGRSMRRRVYNPDRLKYPMKRVGARGEGKFERISWEEAYDIIATNMQRLIKEYGN
ESIYLNYGTGTLGGTMTRSWPPGNTLVARLMNCCGGYLNHYGDYSSAQIAEGLNYTYGGWADGNSPSDIENSKLVVLFGN
NPGETRMSGGGVTYYLEQARQKSNARMIIIDPRYTDTGAGREDEWIPIRPGTDAALVNGLAYVMITENLVDQAFLDKYCV
GYDEKTLPASAPKNGHYKAYILGEGPDGVAKTPEWASQITGVPADKIIKLAREIGSTKPAFISQGWGPQRHANGEIATRA
ISMLAILTGNVGINGGNSGAREGSYSLPFVRMPTLENPIQTSISMFMWTDAIERGPEMTALRDGVRGKDKLDVPIKMIWN
YAGNCLINQHSEINRTHEILQDDKKCELIVVIDCHMTSSAKYADILLPDCTASEQMDFALDASCGNMSYVIFNDQVIKPR
FECKTIYEMTSELAKRLGVEQQFTEGRTQEEWMRHLYAQSREAIPELPTFEEFRKQGIFKKRDPQGHHVAYKAFREDPQA
NPLTTPSGKIEIYSQALADIAATWELPEGDVIDPLPIYTPGFESYQDPLNKQYPLQLTGFHYKSRVHSTYGNVDVLKAAC
RQEMWINPLDAQKRGIHNGDKVRIFNDRGEVHIEAKVTPRMMPGVVALGEGAWYDPDAKRVDKGGCINVLTTQRPSPLAK
GNPSHTNLVQVEKV

Sequences:

>Translated_814_residues
MKTKIPDAVLAAEVSRRGLVKTTAIGGLAMASSALTLPFSRIAHAVDSAIPTKSGEKVIWSACTVNCGSRCPLRMHVVDG
EIKYVETDNTGDDNYDGLHQVRACLRGRSMRRRVYNPDRLKYPMKRVGARGEGKFERISWEEAYDIIATNMQRLIKEYGN
ESIYLNYGTGTLGGTMTRSWPPGNTLVARLMNCCGGYLNHYGDYSSAQIAEGLNYTYGGWADGNSPSDIENSKLVVLFGN
NPGETRMSGGGVTYYLEQARQKSNARMIIIDPRYTDTGAGREDEWIPIRPGTDAALVNGLAYVMITENLVDQAFLDKYCV
GYDEKTLPASAPKNGHYKAYILGEGPDGVAKTPEWASQITGVPADKIIKLAREIGSTKPAFISQGWGPQRHANGEIATRA
ISMLAILTGNVGINGGNSGAREGSYSLPFVRMPTLENPIQTSISMFMWTDAIERGPEMTALRDGVRGKDKLDVPIKMIWN
YAGNCLINQHSEINRTHEILQDDKKCELIVVIDCHMTSSAKYADILLPDCTASEQMDFALDASCGNMSYVIFNDQVIKPR
FECKTIYEMTSELAKRLGVEQQFTEGRTQEEWMRHLYAQSREAIPELPTFEEFRKQGIFKKRDPQGHHVAYKAFREDPQA
NPLTTPSGKIEIYSQALADIAATWELPEGDVIDPLPIYTPGFESYQDPLNKQYPLQLTGFHYKSRVHSTYGNVDVLKAAC
RQEMWINPLDAQKRGIHNGDKVRIFNDRGEVHIEAKVTPRMMPGVVALGEGAWYDPDAKRVDKGGCINVLTTQRPSPLAK
GNPSHTNLVQVEKV
>Mature_814_residues
MKTKIPDAVLAAEVSRRGLVKTTAIGGLAMASSALTLPFSRIAHAVDSAIPTKSGEKVIWSACTVNCGSRCPLRMHVVDG
EIKYVETDNTGDDNYDGLHQVRACLRGRSMRRRVYNPDRLKYPMKRVGARGEGKFERISWEEAYDIIATNMQRLIKEYGN
ESIYLNYGTGTLGGTMTRSWPPGNTLVARLMNCCGGYLNHYGDYSSAQIAEGLNYTYGGWADGNSPSDIENSKLVVLFGN
NPGETRMSGGGVTYYLEQARQKSNARMIIIDPRYTDTGAGREDEWIPIRPGTDAALVNGLAYVMITENLVDQAFLDKYCV
GYDEKTLPASAPKNGHYKAYILGEGPDGVAKTPEWASQITGVPADKIIKLAREIGSTKPAFISQGWGPQRHANGEIATRA
ISMLAILTGNVGINGGNSGAREGSYSLPFVRMPTLENPIQTSISMFMWTDAIERGPEMTALRDGVRGKDKLDVPIKMIWN
YAGNCLINQHSEINRTHEILQDDKKCELIVVIDCHMTSSAKYADILLPDCTASEQMDFALDASCGNMSYVIFNDQVIKPR
FECKTIYEMTSELAKRLGVEQQFTEGRTQEEWMRHLYAQSREAIPELPTFEEFRKQGIFKKRDPQGHHVAYKAFREDPQA
NPLTTPSGKIEIYSQALADIAATWELPEGDVIDPLPIYTPGFESYQDPLNKQYPLQLTGFHYKSRVHSTYGNVDVLKAAC
RQEMWINPLDAQKRGIHNGDKVRIFNDRGEVHIEAKVTPRMMPGVVALGEGAWYDPDAKRVDKGGCINVLTTQRPSPLAK
GNPSHTNLVQVEKV

Specific function: Terminal reductase during anaerobic growth on various sulfoxide and N-oxide compounds. Allows E.coli to grow anaerobically on Me(2)SO as respiratory oxidant [H]

COG id: COG0243

COG function: function code C; Anaerobic dehydrogenases, typically selenocysteine-containing

Gene ontology:

Cell location: Cell membrane; Peripheral membrane protein; Cytoplasmic side [H]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the prokaryotic molybdopterin-containing oxidoreductase family [H]

Homologues:

Organism=Escherichia coli, GI87081797, Length=814, Percent_Identity=99.8771498771499, Blast_Score=1697, Evalue=0.0,
Organism=Escherichia coli, GI1787870, Length=805, Percent_Identity=67.2049689440994, Blast_Score=1150, Evalue=0.0,
Organism=Escherichia coli, GI171474008, Length=818, Percent_Identity=65.5256723716381, Blast_Score=1136, Evalue=0.0,
Organism=Escherichia coli, GI145693196, Length=757, Percent_Identity=32.2324966974901, Blast_Score=307, Evalue=2e-84,
Organism=Escherichia coli, GI1787231, Length=760, Percent_Identity=32.1052631578947, Blast_Score=305, Evalue=7e-84,
Organism=Escherichia coli, GI87081994, Length=752, Percent_Identity=31.3829787234043, Blast_Score=276, Evalue=4e-75,
Organism=Escherichia coli, GI3868721, Length=783, Percent_Identity=25.0319284802043, Blast_Score=155, Evalue=1e-38,
Organism=Escherichia coli, GI3868720, Length=468, Percent_Identity=27.1367521367521, Blast_Score=108, Evalue=1e-24,
Organism=Escherichia coli, GI1788534, Length=850, Percent_Identity=23.1764705882353, Blast_Score=98, Evalue=2e-21,
Organism=Escherichia coli, GI3868719, Length=464, Percent_Identity=25.4310344827586, Blast_Score=92, Evalue=1e-19,
Organism=Escherichia coli, GI1787477, Length=350, Percent_Identity=24.8571428571429, Blast_Score=84, Evalue=4e-17,
Organism=Escherichia coli, GI1787741, Length=309, Percent_Identity=24.5954692556634, Blast_Score=80, Evalue=4e-16,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR011888
- InterPro:   IPR009010
- InterPro:   IPR006657
- InterPro:   IPR006656
- InterPro:   IPR006963
- InterPro:   IPR006655
- InterPro:   IPR006311 [H]

Pfam domain/function: PF04879 Molybdop_Fe4S4; PF00384 Molybdopterin; PF01568 Molydop_binding [H]

EC number: 1.8.99.- [C]

Molecular weight: Translated: 90342; Mature: 90342

Theoretical pI: Translated: 6.96; Mature: 6.96

Prosite motif: PS00551 MOLYBDOPTERIN_PROK_1 ; PS00490 MOLYBDOPTERIN_PROK_2 ; PS00932 MOLYBDOPTERIN_PROK_3

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.8 %Cys     (Translated Protein)
3.1 %Met     (Translated Protein)
4.9 %Cys+Met (Translated Protein)
1.8 %Cys     (Mature Protein)
3.1 %Met     (Mature Protein)
4.9 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MKTKIPDAVLAAEVSRRGLVKTTAIGGLAMASSALTLPFSRIAHAVDSAIPTKSGEKVIW
CCCCCCHHHHHHHHHHCCCEEHHHHCHHHHHCCHHCCCHHHHHHHHHHHCCCCCCCEEEE
SACTVNCGSRCPLRMHVVDGEIKYVETDNTGDDNYDGLHQVRACLRGRSMRRRVYNPDRL
EEEECCCCCCCCEEEEEECCEEEEEECCCCCCCCCHHHHHHHHHHHCHHHHHHCCCCHHH
KYPMKRVGARGEGKFERISWEEAYDIIATNMQRLIKEYGNESIYLNYGTGTLGGTMTRSW
CCCHHHCCCCCCCCEEECCHHHHHHHHHHHHHHHHHHHCCCEEEEECCCCCCCCCCCCCC
PPGNTLVARLMNCCGGYLNHYGDYSSAQIAEGLNYTYGGWADGNSPSDIENSKLVVLFGN
CCCHHHHHHHHHHHHHHHHHCCCCCHHHHHHCCCCCCCCCCCCCCCCCCCCCEEEEEECC
NPGETRMSGGGVTYYLEQARQKSNARMIIIDPRYTDTGAGREDEWIPIRPGTDAALVNGL
CCCCCEECCCCEEHHHHHHHHHCCCEEEEECCCCCCCCCCCCCCEEECCCCCCHHHHCCE
AYVMITENLVDQAFLDKYCVGYDEKTLPASAPKNGHYKAYILGEGPDGVAKTPEWASQIT
EEEEEEHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCEEEEEEECCCCCCCCCCHHHHHHC
GVPADKIIKLAREIGSTKPAFISQGWGPQRHANGEIATRAISMLAILTGNVGINGGNSGA
CCCHHHHHHHHHHHCCCCCCHHCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCCC
REGSYSLPFVRMPTLENPIQTSISMFMWTDAIERGPEMTALRDGVRGKDKLDVPIKMIWN
CCCCCCCCEEECCCCCCHHHHHHHHHHHHHHHHCCCCHHHHHCCCCCCCCCCCHHHHHHH
YAGNCLINQHSEINRTHEILQDDKKCELIVVIDCHMTSSAKYADILLPDCTASEQMDFAL
CCCCEEEECCHHHHHHHHHHCCCCCEEEEEEEEECCCCCCCEEEEECCCCCCCCCCCEEE
DASCGNMSYVIFNDQVIKPRFECKTIYEMTSELAKRLGVEQQFTEGRTQEEWMRHLYAQS
ECCCCCEEEEEECCCEECCCHHHHHHHHHHHHHHHHCCCHHHHHCCCCHHHHHHHHHHHH
REAIPELPTFEEFRKQGIFKKRDPQGHHVAYKAFREDPQANPLTTPSGKIEIYSQALADI
HHCCCCCCCHHHHHHCCCCCCCCCCCCHHHHHHHHCCCCCCCCCCCCCCEEEHHHHHHHH
AATWELPEGDVIDPLPIYTPGFESYQDPLNKQYPLQLTGFHYKSRVHSTYGNVDVLKAAC
HHHCCCCCCCCCCCCCCCCCCHHHHHCCCCCCCCEEEECCHHHHHHHHCCCCHHHHHHHH
RQEMWINPLDAQKRGIHNGDKVRIFNDRGEVHIEAKVTPRMMPGVVALGEGAWYDPDAKR
HHHHCCCCCCHHHCCCCCCCEEEEECCCCCEEEEEEECCCCCCCEEEECCCCCCCCCHHH
VDKGGCINVLTTQRPSPLAKGNPSHTNLVQVEKV
CCCCCEEEEEECCCCCCCCCCCCCCCCEEEEECC
>Mature Secondary Structure
MKTKIPDAVLAAEVSRRGLVKTTAIGGLAMASSALTLPFSRIAHAVDSAIPTKSGEKVIW
CCCCCCHHHHHHHHHHCCCEEHHHHCHHHHHCCHHCCCHHHHHHHHHHHCCCCCCCEEEE
SACTVNCGSRCPLRMHVVDGEIKYVETDNTGDDNYDGLHQVRACLRGRSMRRRVYNPDRL
EEEECCCCCCCCEEEEEECCEEEEEECCCCCCCCCHHHHHHHHHHHCHHHHHHCCCCHHH
KYPMKRVGARGEGKFERISWEEAYDIIATNMQRLIKEYGNESIYLNYGTGTLGGTMTRSW
CCCHHHCCCCCCCCEEECCHHHHHHHHHHHHHHHHHHHCCCEEEEECCCCCCCCCCCCCC
PPGNTLVARLMNCCGGYLNHYGDYSSAQIAEGLNYTYGGWADGNSPSDIENSKLVVLFGN
CCCHHHHHHHHHHHHHHHHHCCCCCHHHHHHCCCCCCCCCCCCCCCCCCCCCEEEEEECC
NPGETRMSGGGVTYYLEQARQKSNARMIIIDPRYTDTGAGREDEWIPIRPGTDAALVNGL
CCCCCEECCCCEEHHHHHHHHHCCCEEEEECCCCCCCCCCCCCCEEECCCCCCHHHHCCE
AYVMITENLVDQAFLDKYCVGYDEKTLPASAPKNGHYKAYILGEGPDGVAKTPEWASQIT
EEEEEEHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCEEEEEEECCCCCCCCCCHHHHHHC
GVPADKIIKLAREIGSTKPAFISQGWGPQRHANGEIATRAISMLAILTGNVGINGGNSGA
CCCHHHHHHHHHHHCCCCCCHHCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCCC
REGSYSLPFVRMPTLENPIQTSISMFMWTDAIERGPEMTALRDGVRGKDKLDVPIKMIWN
CCCCCCCCEEECCCCCCHHHHHHHHHHHHHHHHCCCCHHHHHCCCCCCCCCCCHHHHHHH
YAGNCLINQHSEINRTHEILQDDKKCELIVVIDCHMTSSAKYADILLPDCTASEQMDFAL
CCCCEEEECCHHHHHHHHHHCCCCCEEEEEEEEECCCCCCCEEEEECCCCCCCCCCCEEE
DASCGNMSYVIFNDQVIKPRFECKTIYEMTSELAKRLGVEQQFTEGRTQEEWMRHLYAQS
ECCCCCEEEEEECCCEECCCHHHHHHHHHHHHHHHHCCCHHHHHCCCCHHHHHHHHHHHH
REAIPELPTFEEFRKQGIFKKRDPQGHHVAYKAFREDPQANPLTTPSGKIEIYSQALADI
HHCCCCCCCHHHHHHCCCCCCCCCCCCHHHHHHHHCCCCCCCCCCCCCCEEEHHHHHHHH
AATWELPEGDVIDPLPIYTPGFESYQDPLNKQYPLQLTGFHYKSRVHSTYGNVDVLKAAC
HHHCCCCCCCCCCCCCCCCCCHHHHHCCCCCCCCEEEECCHHHHHHHHCCCCHHHHHHHH
RQEMWINPLDAQKRGIHNGDKVRIFNDRGEVHIEAKVTPRMMPGVVALGEGAWYDPDAKR
HHHHCCCCCCHHHCCCCCCCEEEEECCCCCEEEEEEECCCCCCCEEEECCCCCCCCCHHH
VDKGGCINVLTTQRPSPLAKGNPSHTNLVQVEKV
CCCCCEEEEEECCCCCCCCCCCCCCCCEEEEECC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: May Bind 4Fe-4S Cluster. [C]

Metal ions: Fe; Mo [C]

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: N-Oxide; Sulfoxide Compounds Including Trimethylamine N-Oxide. [C]

Specific reaction: Reduces Various N-Oxide And Sulfoxide Compounds Including Trimethylamine N-Oxide. [C]

General reaction: Oxidoreductases [C]

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 3062312; 8905232; 9278503; 2170332; 8125918; 10801884 [H]