BacMap

Definition	Escherichia coli O157:H7 str. EC4115, complete genome.
Accession	NC_011353
Length	5,572,075

Click here to switch to the map view.

The map label for this gene is hyaB [H]

Identifier: 209400020

GI number: 209400020

Start: 1217407

End: 1219200

Strand: Direct

Name: hyaB [H]

Synonym: ECH74115_1209

Alternate gene names: 209400020

Gene position: 1217407-1219200 (Clockwise)

Preceding gene: 209397207

Following gene: 209396963

Centisome position: 21.85

GC content: 56.58

Gene sequence:

>1794_bases
ATGAGCACTCAGTACGAAACTCAGGGATACACCATCAATAATGCCGGACGCCGCCTGGTGGTCGACCCGATTACGCGCAT
TGAAGGCCACATGCGCTGCGAAGTGAATATTAACGATCAGAATGTAATCACCAATGCCGTCTCCTGCGGCACCATGTTTC
GCGGGCTGGAGATCATCCTGCAAGGGCGCGACCCGCGCGATGCGTGGGCGTTCGTTGAACGTATCTGCGGCGTCTGTACT
GGCGTACACGCTCTGGCTTCGGTTTACGCCATCGAAGATGCCATCGGTATTAAAGTGCCGGACAACGCCAATATCATCCG
CAACATTATGCTGGCAACGCTCTGGTGCCACGATCATCTGGTGCACTTCTATCAGCTTGCCGGGATGGACTGGATCGATG
TGTTGGATGCGCTGAAAGCCGACCCGCGGAAAACCTCCGAACTGGCGCAAAGTCTCTCCTCTTGGCCGAAATCATCCCCT
GGCTATTTCTTCGACGTACAAAACCGCCTGAAGAAATTCGTTGAAGGCGGGCAGTTGGGGATCTTCCGCAATGGCTACTG
GGGGCACCCGCAGTACAAGTTGCCGCCAGAAGCCAACCTGATGGGCTTTGCCCACTATCTCGAAGCTCTCGATTTCCAGC
GTGAAATTGTCAAAATCCACGCGGTCTTTGGCGGTAAAAACCCGCATCCAAACTGGATTGTCGGCGGGATGCCTTGCGCC
ATTAACATTGACGAAAGCGGCGCGGTCGGGGCGGTCAATATGGAACGCCTGAACCTGGTGCAGTCGATTATCACCCGCAC
GGCAGACTTCATTAACAACGTGATGATCCCCGACGCCTTAGCCATCGGTCAGTTCAACAAACCGTGGAGCGAAATCGGCA
CGGGTCTTTCTGATAAATGTGTCCTCAGCTACGGCGCATTCCCGGATATTGCCAACGACTTTGGTGAGAAAAGTCTGCTG
ATGCCTGGCGGCGCGGTGATTAACGGCGACTTCAACAATGTGCTGCCAGTGGATTTGGTTGATCCGCAGCAGGTGCAGGA
GTTTGTCGATCACGCCTGGTATCGTTATCCCAACGATCAGGTCGGGCGTCATCCGTTCGATGGCATCACCGACCCGTGGT
ACAACCCCGGCGATGTCAAAGGCAGCGATACCAACATTCAGCAGCTGAATGAACAGGAACGCTACTCGTGGATCAAAGCG
CCGCGCTGGCGCGGTAACGCGATGGAAGTGGGGCCGCTGGCACGCACGTTAATCGCTTATCACAAAGGCGATGCTGCGAC
CGTTGAGTCGGTCGATCGCATGATGTCGGCGCTGAACCTGCCGCTTTCCGGTATCCAGTCAACGTTGGGCCGCATTTTGT
GCCGCGCGCACGAAGCACAGTGGGCCGCAGGTAAGTTGCAGTATTTCTTCAACAAGCTGATGACTAACCTGAAAAACGGC
AATCTTGCCACCGCCTCCACGGAAAAATGGGAACCCACAACCTGGCCGACAGAGTGCCGTGGTGTCGGTTTTACCGAAGC
GCCGCGCGGGGCGTTAGGCCACTGGGCCGCCATTCGCGATGGCAAGATTGATCTCTACCAGTGCGTGGTGCCGACCACCT
GGAACGCCAGCCCGCGCGATCCCAAAGGGCAGATTGGCGCTTATGAAGCGGCGCTGATGAACACCAAAATGGCGATCCCC
GAGCAACCGCTGGAGATCCTGCGTACTCTGCACAGCTTTGATCCGTGCCTCGCCTGTTCAACACACGTGCTGGGCGACGA
CGGTAGCGAGCTGATCTCCGTGCAGGTGCGTTAA

Upstream 100 bases:

>100_bases
TTGGTGTGCACGCAGTCGCCAGCGCCGTTGACCAGCGCAGACGTCATAATCAGCAACCTACAGAAACCGAACATCAGCCA
GGCAATGAGGATAAACAGGC

Downstream 100 bases:

>100_bases
CAGCGAAGGAGAATCATCATGCAACAGAAAAGCGACAACGTTGTCAGCCACTATGTCTTTGAAGCGCCAGTGCGTATCTG
GCACTGGCTGACGGTGTTAT

Product: hydrogenase 1 large subunit

Products: NA

Alternate protein names: HYD1; Membrane-bound hydrogenase 1 large subunit; NiFe hydrogenase [H]

Number of amino acids: Translated: 597; Mature: 596

Protein sequence:

>597_residues
MSTQYETQGYTINNAGRRLVVDPITRIEGHMRCEVNINDQNVITNAVSCGTMFRGLEIILQGRDPRDAWAFVERICGVCT
GVHALASVYAIEDAIGIKVPDNANIIRNIMLATLWCHDHLVHFYQLAGMDWIDVLDALKADPRKTSELAQSLSSWPKSSP
GYFFDVQNRLKKFVEGGQLGIFRNGYWGHPQYKLPPEANLMGFAHYLEALDFQREIVKIHAVFGGKNPHPNWIVGGMPCA
INIDESGAVGAVNMERLNLVQSIITRTADFINNVMIPDALAIGQFNKPWSEIGTGLSDKCVLSYGAFPDIANDFGEKSLL
MPGGAVINGDFNNVLPVDLVDPQQVQEFVDHAWYRYPNDQVGRHPFDGITDPWYNPGDVKGSDTNIQQLNEQERYSWIKA
PRWRGNAMEVGPLARTLIAYHKGDAATVESVDRMMSALNLPLSGIQSTLGRILCRAHEAQWAAGKLQYFFNKLMTNLKNG
NLATASTEKWEPTTWPTECRGVGFTEAPRGALGHWAAIRDGKIDLYQCVVPTTWNASPRDPKGQIGAYEAALMNTKMAIP
EQPLEILRTLHSFDPCLACSTHVLGDDGSELISVQVR

Sequences:

>Translated_597_residues
MSTQYETQGYTINNAGRRLVVDPITRIEGHMRCEVNINDQNVITNAVSCGTMFRGLEIILQGRDPRDAWAFVERICGVCT
GVHALASVYAIEDAIGIKVPDNANIIRNIMLATLWCHDHLVHFYQLAGMDWIDVLDALKADPRKTSELAQSLSSWPKSSP
GYFFDVQNRLKKFVEGGQLGIFRNGYWGHPQYKLPPEANLMGFAHYLEALDFQREIVKIHAVFGGKNPHPNWIVGGMPCA
INIDESGAVGAVNMERLNLVQSIITRTADFINNVMIPDALAIGQFNKPWSEIGTGLSDKCVLSYGAFPDIANDFGEKSLL
MPGGAVINGDFNNVLPVDLVDPQQVQEFVDHAWYRYPNDQVGRHPFDGITDPWYNPGDVKGSDTNIQQLNEQERYSWIKA
PRWRGNAMEVGPLARTLIAYHKGDAATVESVDRMMSALNLPLSGIQSTLGRILCRAHEAQWAAGKLQYFFNKLMTNLKNG
NLATASTEKWEPTTWPTECRGVGFTEAPRGALGHWAAIRDGKIDLYQCVVPTTWNASPRDPKGQIGAYEAALMNTKMAIP
EQPLEILRTLHSFDPCLACSTHVLGDDGSELISVQVR
>Mature_596_residues
STQYETQGYTINNAGRRLVVDPITRIEGHMRCEVNINDQNVITNAVSCGTMFRGLEIILQGRDPRDAWAFVERICGVCTG
VHALASVYAIEDAIGIKVPDNANIIRNIMLATLWCHDHLVHFYQLAGMDWIDVLDALKADPRKTSELAQSLSSWPKSSPG
YFFDVQNRLKKFVEGGQLGIFRNGYWGHPQYKLPPEANLMGFAHYLEALDFQREIVKIHAVFGGKNPHPNWIVGGMPCAI
NIDESGAVGAVNMERLNLVQSIITRTADFINNVMIPDALAIGQFNKPWSEIGTGLSDKCVLSYGAFPDIANDFGEKSLLM
PGGAVINGDFNNVLPVDLVDPQQVQEFVDHAWYRYPNDQVGRHPFDGITDPWYNPGDVKGSDTNIQQLNEQERYSWIKAP
RWRGNAMEVGPLARTLIAYHKGDAATVESVDRMMSALNLPLSGIQSTLGRILCRAHEAQWAAGKLQYFFNKLMTNLKNGN
LATASTEKWEPTTWPTECRGVGFTEAPRGALGHWAAIRDGKIDLYQCVVPTTWNASPRDPKGQIGAYEAALMNTKMAIPE
QPLEILRTLHSFDPCLACSTHVLGDDGSELISVQVR

Specific function: This Is One Of Three E.Coli Hydrogenases Synthesized In Response To Different Physiological Conditions. Hyd1 Is Believed To Have A Role In Hydrogen Cycling During Fermentative Growth. [C]

COG id: COG0374

COG function: function code C; Ni,Fe-hydrogenase I large subunit

Gene ontology:

Cell location: Cell membrane; Peripheral membrane protein [H]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the [NiFe]/[NiFeSe] hydrogenase large subunit family [H]

Homologues:

Organism=Escherichia coli, GI1787207, Length=597, Percent_Identity=99.6649916247906, Blast_Score=1243, Evalue=0.0,
Organism=Escherichia coli, GI1789368, Length=591, Percent_Identity=42.4703891708968, Blast_Score=480, Evalue=1e-137,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR001501
- InterPro:   IPR018194 [H]

Pfam domain/function: PF00374 NiFeSe_Hases [H]

EC number: =1.12.99.6 [H]

Molecular weight: Translated: 66283; Mature: 66152

Theoretical pI: Translated: 5.97; Mature: 5.97

Prosite motif: PS00507 NI_HGENASE_L_1 ; PS00508 NI_HGENASE_L_2

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

2.0 %Cys     (Translated Protein)
2.7 %Met     (Translated Protein)
4.7 %Cys+Met (Translated Protein)
2.0 %Cys     (Mature Protein)
2.5 %Met     (Mature Protein)
4.5 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSTQYETQGYTINNAGRRLVVDPITRIEGHMRCEVNINDQNVITNAVSCGTMFRGLEIIL
CCCCCCCCCEEECCCCCEEEECCHHHCCCCEEEEEEECCCHHHHHHHHHHHHHHCHHEEE
QGRDPRDAWAFVERICGVCTGVHALASVYAIEDAIGIKVPDNANIIRNIMLATLWCHDHL
ECCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEECCCCHHHHHHHHHHHHHHHHHH
VHFYQLAGMDWIDVLDALKADPRKTSELAQSLSSWPKSSPGYFFDVQNRLKKFVEGGQLG
HHHHHHCCCCHHHHHHHHCCCCCHHHHHHHHHHHCCCCCCCEEEEHHHHHHHHHCCCCEE
IFRNGYWGHPQYKLPPEANLMGFAHYLEALDFQREIVKIHAVFGGKNPHPNWIVGGMPCA
EEECCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHEEEEEECCCCCCCCEEECCCEEE
INIDESGAVGAVNMERLNLVQSIITRTADFINNVMIPDALAIGQFNKPWSEIGTGLSDKC
EEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCHHCCCCCCCCHHHHCCCCCCCE
VLSYGAFPDIANDFGEKSLLMPGGAVINGDFNNVLPVDLVDPQQVQEFVDHAWYRYPNDQ
EEECCCCCHHHHHHCCCEEECCCCEEEECCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCC
VGRHPFDGITDPWYNPGDVKGSDTNIQQLNEQERYSWIKAPRWRGNAMEVGPLARTLIAY
CCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHCCCCCCCCCEEHHHHHHHHHHH
HKGDAATVESVDRMMSALNLPLSGIQSTLGRILCRAHEAQWAAGKLQYFFNKLMTNLKNG
CCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCC
NLATASTEKWEPTTWPTECRGVGFTEAPRGALGHWAAIRDGKIDLYQCVVPTTWNASPRD
CEEECCCCCCCCCCCCHHHCCCCCCCCCCCCCCCHHEECCCCEEEEEEECCCCCCCCCCC
PKGQIGAYEAALMNTKMAIPEQPLEILRTLHSFDPCLACSTHVLGDDGSELISVQVR
CCCCCCHHHHHHHHCCCCCCCCHHHHHHHHHCCCCHHHHCCCEECCCCCEEEEEEEC
>Mature Secondary Structure 
STQYETQGYTINNAGRRLVVDPITRIEGHMRCEVNINDQNVITNAVSCGTMFRGLEIIL
CCCCCCCCEEECCCCCEEEECCHHHCCCCEEEEEEECCCHHHHHHHHHHHHHHCHHEEE
QGRDPRDAWAFVERICGVCTGVHALASVYAIEDAIGIKVPDNANIIRNIMLATLWCHDHL
ECCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEECCCCHHHHHHHHHHHHHHHHHH
VHFYQLAGMDWIDVLDALKADPRKTSELAQSLSSWPKSSPGYFFDVQNRLKKFVEGGQLG
HHHHHHCCCCHHHHHHHHCCCCCHHHHHHHHHHHCCCCCCCEEEEHHHHHHHHHCCCCEE
IFRNGYWGHPQYKLPPEANLMGFAHYLEALDFQREIVKIHAVFGGKNPHPNWIVGGMPCA
EEECCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHEEEEEECCCCCCCCEEECCCEEE
INIDESGAVGAVNMERLNLVQSIITRTADFINNVMIPDALAIGQFNKPWSEIGTGLSDKC
EEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCHHCCCCCCCCHHHHCCCCCCCE
VLSYGAFPDIANDFGEKSLLMPGGAVINGDFNNVLPVDLVDPQQVQEFVDHAWYRYPNDQ
EEECCCCCHHHHHHCCCEEECCCCEEEECCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCC
VGRHPFDGITDPWYNPGDVKGSDTNIQQLNEQERYSWIKAPRWRGNAMEVGPLARTLIAY
CCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHCCCCCCCCCEEHHHHHHHHHHH
HKGDAATVESVDRMMSALNLPLSGIQSTLGRILCRAHEAQWAAGKLQYFFNKLMTNLKNG
CCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCC
NLATASTEKWEPTTWPTECRGVGFTEAPRGALGHWAAIRDGKIDLYQCVVPTTWNASPRD
CEEECCCCCCCCCCCCHHHCCCCCCCCCCCCCCCHHEECCCCEEEEEEECCCCCCCCCCC
PKGQIGAYEAALMNTKMAIPEQPLEILRTLHSFDPCLACSTHVLGDDGSELISVQVR
CCCCCCHHHHHHHHCCCCCCCCHHHHHHHHHCCCCHHHHCCCEECCCCCEEEEEEEC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: NA