BacMap

Definition	Mycobacterium tuberculosis H37Ra, complete genome.
Accession	NC_009525
Length	4,419,977

Click here to switch to the map view.

The map label for this gene is yyaE [H]

Identifier: 148659961

GI number: 148659961

Start: 233591

End: 235837

Strand: Direct

Name: yyaE [H]

Synonym: MRA_0205

Alternate gene names: 148659961

Gene position: 233591-235837 (Clockwise)

Preceding gene: 148659960

Following gene: 148659963

Centisome position: 5.28

GC content: 66.44

Gene sequence:

>2247_bases
ATGACCAGCTCTGATTGGCTGCCCACCGCGTGCATCCTCTGCGAGTGCAACTGCGGCATCGTCGTGCAAGTCGACGATCG
CCGACTGGCCCGCATCCGGGGCGACAAGGCGCATCCGGGGTCTGCGGGCTACACCTGCAACAAGGCGTTGCGGCTGGACC
ATTACCAGAACAACCGGGCTCGCCTGAGCTCGCCGATGCGCCGCCGAGCCGATGGCACCTACGAGGAGATCGACTGGGAC
ACGGCGATTGTCGAGATTGCCGAGGGATTCAAACAGATCCGTGATACCCACGGCGGGGACAAGATCTTCTACTACGGCGG
CGGCGGACAGGGCAATCACCTCGGCGGCGCCTACAGCGGCGCCTTTCTGAAGGCACTGGGGTCGCGCTACCGGTCGAATG
CGCTGGCGCAGGAGAAGACCGGCGAAGCCTGGGTCGACTTCCAGCTGTACGGCGGTCACACGCGCGGCGAGTTCGAGAAC
GCCGAGGTGTCGGTGTTCGTCGGGAAGAACCCATGGATGTCGCAGAGCTTCCCGCGGGCCCGGGTCGTGCTCAACGAGAT
CGCCAAGGATCCCGGCCGGTCGATGATCGTGATCGATCCCGTCGTCACCGACACCGCGAAGATGGCCGACTTCCATCTAC
GGGTGCAACCGGGTTGCGACGCCTGGTGCTTGGCGGCTTTGGCCGCGGTCTTGGTCCAGGAAAACCTCTGTAACGAAGCC
TTTCTTGCCGCGCACGTGCACGGAGTGGACACCGTGCGCGCCGCCCTGCAAGAGGTCCCGGTCGCCGACTACGCGCAGCG
TTGCGGGGTGGACGAGGAGTTGTTGCGTGCCGCGGCCCGGCGCATCGGCACCGCCGCGAGCGTGTCGGTGTTCGAAGACC
TGGGAATCCAGCAGGCGCCCAACAGCACCGTCTGCTCCTATCTGAACAAGCTGCTGTGGATCCTGACCGGCAACTTCGCG
AAAAAGGGTGGCCAACACCTGCATTCGTCGTTCGCTCCGCTGTTCAGCCAGGTCTCCGGCCGCACACCGGTCACCGGTGC
GCCTATTATCGCGGGCCTGATCCCGGGCAACGTGGTGCCCGAGGAGATCCTGACCGAGCACCCGGATCGGTTTCGGGCGA
TGATCGTAGAGAGGGGCAATCCGGCTCACTCGCTGGCCGATTCAGCCGCCTGCCGGGCGGCATTCCAGGCGCTGGAACTG
ATGGTGGTCGTCGATGTCGCCATGACCGAGACGGCCAGGCTCGCCCACTACGTGCTGCCGGCGGCGTCGCAGTTCGAGAA
GCCGGAAGCCACATTCTTCAATTTCGAGTTTCCACGCAACGGCTTTCAGTTGCGCCGGCCGTTGTTTCCGCCACTGCCCG
GAACACTGCCCGAACCCGAGATTTGGGCGCGGCTGGTGCGGGCACTTGGCGTAGTCGACGAAGCGGACCTGCGGCCGCTG
CGAGAGGCCGCTGCTCAGGGTCGCCAGGCGTATACCGAGGCGTTCCTCGCGGCGGCGGCGACCAATCCCACCGTGGCGAA
ACTGACCGCCTATGTGCTCTATGAAACGCTCGGGCCGACGCTGCCGGACGGTCTGGCCGGGGCGGCCGCGTTGTGGGGAC
TTGCCCAGAAGACGGCGATGGCCTACCCTGACGCCGTCCGCCGCGCCGGCCACGCCGACGGCAACGCGCTGTTCGACGCG
ATTCTCGAGCGCCCCTCCGGGGTCACGTTTACCGTGCACAACTACGAAGACGACTTCGCTTTGATTAGCCACCCCGATCA
CAAGATCGCCCTGGAGATTCCGGAAATGCTGGCAGAGATCCGGTCGCTGACCCAGACCCCGTCGCGGTTGACCACGCCTC
AACTGCCGATCGTGCTGTCGGTGGGCGAGCGCCGCGCGTACACGGCCAACGACATCTTCCGTGACCCGTCCTGGCGCAAA
CGCGACGCCAACGGGGCGCTGCGGGTCAGCGTCGAAGACGCCCAGGCCCTGGGACTGGCCGATGGGTGCCTGGCTCGTAT
CACGACCGCGGCGGGCAGTGCGGAGGCGACGGTGGAGGTCACCGAGACGATGCTGGCCGGACACGCCGCGCTGCCCAACG
GCTTTGGGCTGGACTACACCGGCGACGACGGGCGCACCGTCGTCGCCGGTGTCGCCCCGAACGCACTTACTTCGACGAGA
TGGCGCGACCCCTACGCCGGCACCCCCTGGCACAAGCACGTGCCCGCCGCCATCCGCCGAGCAGACGCAGAATCGCCCAT
TTGGTAG

Upstream 100 bases:

>100_bases
TCTTGCTGGCTCGGGTGCGGCGCGACCTGACGCCGCTGGATCTGGTTCACCGCCAGCTGCGCAACCTGCTGCTGGCCGAG
CTGCCCGAAAGGAGCCGATG

Downstream 100 bases:

>100_bases
CCCAAATGGGCGATTCTGCGTCTGCTCGCGGGGTCTTAGCCTAGTTCCAGATCCGGACCCTGCGCTGCGGGTCCAGAAAC
AGCGCGTCATCCTCGGTGAC

Product: putative oxidoreductase

Products: nitrate; reduced acceptor

Alternate protein names: NA

Number of amino acids: Translated: 748; Mature: 747

Protein sequence:

>748_residues
MTSSDWLPTACILCECNCGIVVQVDDRRLARIRGDKAHPGSAGYTCNKALRLDHYQNNRARLSSPMRRRADGTYEEIDWD
TAIVEIAEGFKQIRDTHGGDKIFYYGGGGQGNHLGGAYSGAFLKALGSRYRSNALAQEKTGEAWVDFQLYGGHTRGEFEN
AEVSVFVGKNPWMSQSFPRARVVLNEIAKDPGRSMIVIDPVVTDTAKMADFHLRVQPGCDAWCLAALAAVLVQENLCNEA
FLAAHVHGVDTVRAALQEVPVADYAQRCGVDEELLRAAARRIGTAASVSVFEDLGIQQAPNSTVCSYLNKLLWILTGNFA
KKGGQHLHSSFAPLFSQVSGRTPVTGAPIIAGLIPGNVVPEEILTEHPDRFRAMIVERGNPAHSLADSAACRAAFQALEL
MVVVDVAMTETARLAHYVLPAASQFEKPEATFFNFEFPRNGFQLRRPLFPPLPGTLPEPEIWARLVRALGVVDEADLRPL
REAAAQGRQAYTEAFLAAAATNPTVAKLTAYVLYETLGPTLPDGLAGAAALWGLAQKTAMAYPDAVRRAGHADGNALFDA
ILERPSGVTFTVHNYEDDFALISHPDHKIALEIPEMLAEIRSLTQTPSRLTTPQLPIVLSVGERRAYTANDIFRDPSWRK
RDANGALRVSVEDAQALGLADGCLARITTAAGSAEATVEVTETMLAGHAALPNGFGLDYTGDDGRTVVAGVAPNALTSTR
WRDPYAGTPWHKHVPAAIRRADAESPIW

Sequences:

>Translated_748_residues
MTSSDWLPTACILCECNCGIVVQVDDRRLARIRGDKAHPGSAGYTCNKALRLDHYQNNRARLSSPMRRRADGTYEEIDWD
TAIVEIAEGFKQIRDTHGGDKIFYYGGGGQGNHLGGAYSGAFLKALGSRYRSNALAQEKTGEAWVDFQLYGGHTRGEFEN
AEVSVFVGKNPWMSQSFPRARVVLNEIAKDPGRSMIVIDPVVTDTAKMADFHLRVQPGCDAWCLAALAAVLVQENLCNEA
FLAAHVHGVDTVRAALQEVPVADYAQRCGVDEELLRAAARRIGTAASVSVFEDLGIQQAPNSTVCSYLNKLLWILTGNFA
KKGGQHLHSSFAPLFSQVSGRTPVTGAPIIAGLIPGNVVPEEILTEHPDRFRAMIVERGNPAHSLADSAACRAAFQALEL
MVVVDVAMTETARLAHYVLPAASQFEKPEATFFNFEFPRNGFQLRRPLFPPLPGTLPEPEIWARLVRALGVVDEADLRPL
REAAAQGRQAYTEAFLAAAATNPTVAKLTAYVLYETLGPTLPDGLAGAAALWGLAQKTAMAYPDAVRRAGHADGNALFDA
ILERPSGVTFTVHNYEDDFALISHPDHKIALEIPEMLAEIRSLTQTPSRLTTPQLPIVLSVGERRAYTANDIFRDPSWRK
RDANGALRVSVEDAQALGLADGCLARITTAAGSAEATVEVTETMLAGHAALPNGFGLDYTGDDGRTVVAGVAPNALTSTR
WRDPYAGTPWHKHVPAAIRRADAESPIW
>Mature_747_residues
TSSDWLPTACILCECNCGIVVQVDDRRLARIRGDKAHPGSAGYTCNKALRLDHYQNNRARLSSPMRRRADGTYEEIDWDT
AIVEIAEGFKQIRDTHGGDKIFYYGGGGQGNHLGGAYSGAFLKALGSRYRSNALAQEKTGEAWVDFQLYGGHTRGEFENA
EVSVFVGKNPWMSQSFPRARVVLNEIAKDPGRSMIVIDPVVTDTAKMADFHLRVQPGCDAWCLAALAAVLVQENLCNEAF
LAAHVHGVDTVRAALQEVPVADYAQRCGVDEELLRAAARRIGTAASVSVFEDLGIQQAPNSTVCSYLNKLLWILTGNFAK
KGGQHLHSSFAPLFSQVSGRTPVTGAPIIAGLIPGNVVPEEILTEHPDRFRAMIVERGNPAHSLADSAACRAAFQALELM
VVVDVAMTETARLAHYVLPAASQFEKPEATFFNFEFPRNGFQLRRPLFPPLPGTLPEPEIWARLVRALGVVDEADLRPLR
EAAAQGRQAYTEAFLAAAATNPTVAKLTAYVLYETLGPTLPDGLAGAAALWGLAQKTAMAYPDAVRRAGHADGNALFDAI
LERPSGVTFTVHNYEDDFALISHPDHKIALEIPEMLAEIRSLTQTPSRLTTPQLPIVLSVGERRAYTANDIFRDPSWRKR
DANGALRVSVEDAQALGLADGCLARITTAAGSAEATVEVTETMLAGHAALPNGFGLDYTGDDGRTVVAGVAPNALTSTRW
RDPYAGTPWHKHVPAAIRRADAESPIW

Specific function: Decomposes Formic Acid To Hydrogen And Carbon Dioxide Under Anaerobic Conditions In The Absence Of Exogenous Electron Acceptors. [C]

COG id: COG0243

COG function: function code C; Anaerobic dehydrogenases, typically selenocysteine-containing

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the prokaryotic molybdopterin-containing oxidoreductase family [H]

Homologues:

Organism=Escherichia coli, GI3868721, Length=458, Percent_Identity=26.6375545851528, Blast_Score=120, Evalue=3e-28,
Organism=Escherichia coli, GI1787870, Length=486, Percent_Identity=25.3086419753086, Blast_Score=104, Evalue=2e-23,
Organism=Escherichia coli, GI171474008, Length=353, Percent_Identity=25.7790368271955, Blast_Score=92, Evalue=1e-19,
Organism=Escherichia coli, GI87081797, Length=807, Percent_Identity=23.543990086741, Blast_Score=92, Evalue=1e-19,
Organism=Escherichia coli, GI1788534, Length=258, Percent_Identity=25.1937984496124, Blast_Score=69, Evalue=1e-12,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR009010
- InterPro:   IPR006657
- InterPro:   IPR006656
- InterPro:   IPR006963 [H]

Pfam domain/function: PF04879 Molybdop_Fe4S4; PF00384 Molybdopterin; PF01568 Molydop_binding [H]

EC number: 1.7.99.4

Molecular weight: Translated: 81035; Mature: 80904

Theoretical pI: Translated: 6.27; Mature: 6.27

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.6 %Cys     (Translated Protein)
1.5 %Met     (Translated Protein)
3.1 %Cys+Met (Translated Protein)
1.6 %Cys     (Mature Protein)
1.3 %Met     (Mature Protein)
2.9 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MTSSDWLPTACILCECNCGIVVQVDDRRLARIRGDKAHPGSAGYTCNKALRLDHYQNNRA
CCCCCCCCCEEEEEECCCCEEEEECCCHHHHHCCCCCCCCCCCCEECHHEEECCCCCCHH
RLSSPMRRRADGTYEEIDWDTAIVEIAEGFKQIRDTHGGDKIFYYGGGGQGNHLGGAYSG
HHHHHHHHHCCCCHHHCCHHHHHHHHHHHHHHHHHCCCCCEEEEECCCCCCCCCCCHHHH
AFLKALGSRYRSNALAQEKTGEAWVDFQLYGGHTRGEFENAEVSVFVGKNPWMSQSFPRA
HHHHHHHHHHHHHHHHHHCCCCEEEEEEEECCCCCCCCCCCEEEEEECCCCCCCCCCCHH
RVVLNEIAKDPGRSMIVIDPVVTDTAKMADFHLRVQPGCDAWCLAALAAVLVQENLCNEA
HHHHHHHHCCCCCEEEEECCCCCCCHHHCEEEEEECCCCCHHHHHHHHHHHHHHHHCCHH
FLAAHVHGVDTVRAALQEVPVADYAQRCGVDEELLRAAARRIGTAASVSVFEDLGIQQAP
HHHHHHCCHHHHHHHHHHCCHHHHHHHCCCCHHHHHHHHHHHCCHHHHHHHHHCCCCCCC
NSTVCSYLNKLLWILTGNFAKKGGQHLHSSFAPLFSQVSGRTPVTGAPIIAGLIPGNVVP
CHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHEECCCCCCCC
EEILTEHPDRFRAMIVERGNPAHSLADSAACRAAFQALELMVVVDVAMTETARLAHYVLP
HHHHHCCCHHHHHHEEECCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC
AASQFEKPEATFFNFEFPRNGFQLRRPLFPPLPGTLPEPEIWARLVRALGVVDEADLRPL
CHHHCCCCCCEEEEEECCCCCHHCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCHHHHHH
REAAAQGRQAYTEAFLAAAATNPTVAKLTAYVLYETLGPTLPDGLAGAAALWGLAQKTAM
HHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHH
AYPDAVRRAGHADGNALFDAILERPSGVTFTVHNYEDDFALISHPDHKIALEIPEMLAEI
CCCHHHHHCCCCCCHHHHHHHHHCCCCCEEEEECCCCCEEEEECCCCEEEEHHHHHHHHH
RSLTQTPSRLTTPQLPIVLSVGERRAYTANDIFRDPSWRKRDANGALRVSVEDAQALGLA
HHHHCCCCCCCCCCCCEEEEECCCCCCCHHHHHCCCCCCCCCCCCEEEEEECCHHHHCCH
DGCLARITTAAGSAEATVEVTETMLAGHAALPNGFGLDYTGDDGRTVVAGVAPNALTSTR
HHHHHHHHHCCCCCCCHHHHHHHHHHCCCCCCCCCCCCEECCCCCEEEEECCCCCCCCCC
WRDPYAGTPWHKHVPAAIRRADAESPIW
CCCCCCCCCCHHHCCHHHHHCCCCCCCC
>Mature Secondary Structure 
TSSDWLPTACILCECNCGIVVQVDDRRLARIRGDKAHPGSAGYTCNKALRLDHYQNNRA
CCCCCCCCEEEEEECCCCEEEEECCCHHHHHCCCCCCCCCCCCEECHHEEECCCCCCHH
RLSSPMRRRADGTYEEIDWDTAIVEIAEGFKQIRDTHGGDKIFYYGGGGQGNHLGGAYSG
HHHHHHHHHCCCCHHHCCHHHHHHHHHHHHHHHHHCCCCCEEEEECCCCCCCCCCCHHHH
AFLKALGSRYRSNALAQEKTGEAWVDFQLYGGHTRGEFENAEVSVFVGKNPWMSQSFPRA
HHHHHHHHHHHHHHHHHHCCCCEEEEEEEECCCCCCCCCCCEEEEEECCCCCCCCCCCHH
RVVLNEIAKDPGRSMIVIDPVVTDTAKMADFHLRVQPGCDAWCLAALAAVLVQENLCNEA
HHHHHHHHCCCCCEEEEECCCCCCCHHHCEEEEEECCCCCHHHHHHHHHHHHHHHHCCHH
FLAAHVHGVDTVRAALQEVPVADYAQRCGVDEELLRAAARRIGTAASVSVFEDLGIQQAP
HHHHHHCCHHHHHHHHHHCCHHHHHHHCCCCHHHHHHHHHHHCCHHHHHHHHHCCCCCCC
NSTVCSYLNKLLWILTGNFAKKGGQHLHSSFAPLFSQVSGRTPVTGAPIIAGLIPGNVVP
CHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHEECCCCCCCC
EEILTEHPDRFRAMIVERGNPAHSLADSAACRAAFQALELMVVVDVAMTETARLAHYVLP
HHHHHCCCHHHHHHEEECCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC
AASQFEKPEATFFNFEFPRNGFQLRRPLFPPLPGTLPEPEIWARLVRALGVVDEADLRPL
CHHHCCCCCCEEEEEECCCCCHHCCCCCCCCCCCCCCCHHHHHHHHHHHCCCCCHHHHHH
REAAAQGRQAYTEAFLAAAATNPTVAKLTAYVLYETLGPTLPDGLAGAAALWGLAQKTAM
HHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHH
AYPDAVRRAGHADGNALFDAILERPSGVTFTVHNYEDDFALISHPDHKIALEIPEMLAEI
CCCHHHHHCCCCCCHHHHHHHHHCCCCCEEEEECCCCCEEEEECCCCEEEEHHHHHHHHH
RSLTQTPSRLTTPQLPIVLSVGERRAYTANDIFRDPSWRKRDANGALRVSVEDAQALGLA
HHHHCCCCCCCCCCCCEEEEECCCCCCCHHHHHCCCCCCCCCCCCEEEEEECCHHHHCCH
DGCLARITTAAGSAEATVEVTETMLAGHAALPNGFGLDYTGDDGRTVVAGVAPNALTSTR
HHHHHHHHHCCCCCCCHHHHHHHHHHCCCCCCCCCCCCEECCCCCEEEEECCCCCCCCCC
WRDPYAGTPWHKHVPAAIRRADAESPIW
CCCCCCCCCCHHHCCHHHHHCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: nitrite; acceptor

Specific reaction: nitrite + acceptor = nitrate + reduced acceptor

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 7584024; 9384377; 1552862 [H]