BacMap

Definition	Escherichia coli ED1a chromosome, complete genome.
Accession	NC_011745
Length	5,209,548

Click here to switch to the map view.

The map label for this gene is yfhA [H]

Identifier: 218690669

GI number: 218690669

Start: 2944477

End: 2945811

Strand: Reverse

Name: yfhA [H]

Synonym: ECED1_2981

Alternate gene names: 218690669

Gene position: 2945811-2944477 (Counterclockwise)

Preceding gene: 218690670

Following gene: 218690668

Centisome position: 56.55

GC content: 54.98

Gene sequence:

>1335_bases
ATGAGCCATAAACCTGCGCATTTATTACTGGTCGATGACGATCCGGGATTGCTGAAACTGCTTGGCCTGCGCCTGACCAG
CGAAGGCTACAGTGTGGTCACGGCGGAAAGTGGTGCTGAAGGATTGCGGGTACTGAATCGCGAAAAAGTAGATTTAGTCA
TCAGCGACCTGCGGATGGATGAAATGGACGGTATGCAGCTGTTTGCTGAAATCCAGAAAGTGCAGCCGGGAATGCCAGTA
ATTATTCTTACCGCGCATGGTTCTATTCCTGATGCCGTTGCTGCAACACAGCAGGGCGTGTTCAGTTTTCTCATCAAGCC
TGTCGATAAAGATGCGCTATATCAGGCAATTGACGATGCGCTGGAACAATCCGCGCCAGCCACCGACGAACGTTGGCGCG
AGGCGATTGTCACCCGCAGCCCGCTGATGCTGCGCTTGCTGGAACAGGCGCGGCTGGTGGCACAATCAGACGTTAGCGTT
TTGATTAACGGCCAGAGCGGCACCGGGAAAGAGATTTTCGCCCAGGCTATCCACAACGCCAGCCCGCGCAACAGCAAGCC
ATTTATTGCTATTAACTGTGGCGCATTACCCGAGCAATTGCTGGAGTCGGAGCTGTTTGGTCATGCACGTGGCGCGTTTA
CTGGCGCTGTCAGCAATCGCGAAGGTTTATTCCAGGCGGCGGAAGGCGGTACGCTATTTCTCGATGAGATTGGCGATATG
CCCGCACCGTTGCAGGTCAAACTGCTGCGCGTGTTGCAGGAGCGTAAAGTGCGCCCGCTGGGCAGTAACCGCGATATTGA
TATCGACGTGCGGATTATTTCTGCGACCCACCGCGACCTGCCAAAAGCGATGACGCGCGGGGAATTCCGTGAAGACCTCT
ATTACCGCCTCAACGTTGTCAGCCTGAAAATTCCGGCACTGGCGGAGCGCACAGAAGACATTCCGCTACTGGCAAATCAC
CTGTTGCGCCAGGCGGCAGAGCGACATAAACCGTTTGTCCGCGCGTTCTCCACCGATGCAATGAAACGCCTGATGACTGC
GAGCTGGCCGGGCAACGTGCGCCAGTTGGTCAACGTGATTGAACAGTGCGTGGCGCTGACATCATCTCCGGTAATTAGTG
ATGCGCTGGTGGAGCAGGCGCTGGAGGGCGAAAACACGGCGCTGCCAACCTTTGTTGAGGCGCGTAATCAGTTTGAACTC
AACTATTTGCGTAAGCTGCTGCAAATCACCAAAGGCAACGTCACCCACGCGGCGAGAATGGCGGGGCGCAACCGGACAGA
ATTTTATAAACTGCTTTCCCGACACGAACTGGATGCAAACGATTTCAAGGAATGA

Upstream 100 bases:

>100_bases
GAACGCCAGCTCTCGACCCGCAAACCGGCCGGAAATTTCTCGCCGGATACGCCGCACGAGAGTGAAAAGCCCGCGCCATC
CACCGATGAGGTCACTCCTG

Downstream 100 bases:

>100_bases
ATTGGCGTTATGTGTTACGTTTAGCAGATCAAAAGACAGGCGACCTTTTCAAGGAATAGCATGAAAAAGATTGATGCGAT
TATTAAACCCTTCAAGCTGG

Product: putative DNA-binding response regulator in two-component system

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 444; Mature: 443

Protein sequence:

>444_residues
MSHKPAHLLLVDDDPGLLKLLGLRLTSEGYSVVTAESGAEGLRVLNREKVDLVISDLRMDEMDGMQLFAEIQKVQPGMPV
IILTAHGSIPDAVAATQQGVFSFLIKPVDKDALYQAIDDALEQSAPATDERWREAIVTRSPLMLRLLEQARLVAQSDVSV
LINGQSGTGKEIFAQAIHNASPRNSKPFIAINCGALPEQLLESELFGHARGAFTGAVSNREGLFQAAEGGTLFLDEIGDM
PAPLQVKLLRVLQERKVRPLGSNRDIDIDVRIISATHRDLPKAMTRGEFREDLYYRLNVVSLKIPALAERTEDIPLLANH
LLRQAAERHKPFVRAFSTDAMKRLMTASWPGNVRQLVNVIEQCVALTSSPVISDALVEQALEGENTALPTFVEARNQFEL
NYLRKLLQITKGNVTHAARMAGRNRTEFYKLLSRHELDANDFKE

Sequences:

>Translated_444_residues
MSHKPAHLLLVDDDPGLLKLLGLRLTSEGYSVVTAESGAEGLRVLNREKVDLVISDLRMDEMDGMQLFAEIQKVQPGMPV
IILTAHGSIPDAVAATQQGVFSFLIKPVDKDALYQAIDDALEQSAPATDERWREAIVTRSPLMLRLLEQARLVAQSDVSV
LINGQSGTGKEIFAQAIHNASPRNSKPFIAINCGALPEQLLESELFGHARGAFTGAVSNREGLFQAAEGGTLFLDEIGDM
PAPLQVKLLRVLQERKVRPLGSNRDIDIDVRIISATHRDLPKAMTRGEFREDLYYRLNVVSLKIPALAERTEDIPLLANH
LLRQAAERHKPFVRAFSTDAMKRLMTASWPGNVRQLVNVIEQCVALTSSPVISDALVEQALEGENTALPTFVEARNQFEL
NYLRKLLQITKGNVTHAARMAGRNRTEFYKLLSRHELDANDFKE
>Mature_443_residues
SHKPAHLLLVDDDPGLLKLLGLRLTSEGYSVVTAESGAEGLRVLNREKVDLVISDLRMDEMDGMQLFAEIQKVQPGMPVI
ILTAHGSIPDAVAATQQGVFSFLIKPVDKDALYQAIDDALEQSAPATDERWREAIVTRSPLMLRLLEQARLVAQSDVSVL
INGQSGTGKEIFAQAIHNASPRNSKPFIAINCGALPEQLLESELFGHARGAFTGAVSNREGLFQAAEGGTLFLDEIGDMP
APLQVKLLRVLQERKVRPLGSNRDIDIDVRIISATHRDLPKAMTRGEFREDLYYRLNVVSLKIPALAERTEDIPLLANHL
LRQAAERHKPFVRAFSTDAMKRLMTASWPGNVRQLVNVIEQCVALTSSPVISDALVEQALEGENTALPTFVEARNQFELN
YLRKLLQITKGNVTHAARMAGRNRTEFYKLLSRHELDANDFKE

Specific function: Probable member of a two-component regulatory system yfhA/yfhK [H]

COG id: COG2204

COG function: function code T; Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 sigma-54 factor interaction domain [H]

Homologues:

Organism=Escherichia coli, GI1788905, Length=444, Percent_Identity=99.3243243243243, Blast_Score=900, Evalue=0.0,
Organism=Escherichia coli, GI1790437, Length=446, Percent_Identity=44.8430493273543, Blast_Score=365, Evalue=1e-102,
Organism=Escherichia coli, GI1788550, Length=455, Percent_Identity=40.6593406593407, Blast_Score=322, Evalue=2e-89,
Organism=Escherichia coli, GI1790299, Length=464, Percent_Identity=38.3620689655172, Blast_Score=302, Evalue=3e-83,
Organism=Escherichia coli, GI87082117, Length=232, Percent_Identity=54.7413793103448, Blast_Score=262, Evalue=4e-71,
Organism=Escherichia coli, GI1789087, Length=307, Percent_Identity=46.5798045602606, Blast_Score=253, Evalue=3e-68,
Organism=Escherichia coli, GI1789233, Length=252, Percent_Identity=48.4126984126984, Blast_Score=236, Evalue=3e-63,
Organism=Escherichia coli, GI87082152, Length=316, Percent_Identity=40.1898734177215, Blast_Score=227, Evalue=1e-60,
Organism=Escherichia coli, GI1786524, Length=352, Percent_Identity=39.2045454545455, Blast_Score=213, Evalue=2e-56,
Organism=Escherichia coli, GI87081872, Length=322, Percent_Identity=37.5776397515528, Blast_Score=201, Evalue=1e-52,
Organism=Escherichia coli, GI1787583, Length=239, Percent_Identity=43.0962343096234, Blast_Score=191, Evalue=1e-49,
Organism=Escherichia coli, GI1789828, Length=275, Percent_Identity=36, Blast_Score=165, Evalue=5e-42,
Organism=Escherichia coli, GI87081858, Length=314, Percent_Identity=33.4394904458599, Blast_Score=150, Evalue=2e-37,
Organism=Escherichia coli, GI145693157, Length=110, Percent_Identity=36.3636363636364, Blast_Score=70, Evalue=3e-13,

Paralogues:

None

Copy number: 10-20 Molecules/Cell [C]

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003593
- InterPro:   IPR011006
- InterPro:   IPR009057
- InterPro:   IPR002078
- InterPro:   IPR001789 [H]

Pfam domain/function: PF00072 Response_reg; PF00158 Sigma54_activat [H]

EC number: NA

Molecular weight: Translated: 49192; Mature: 49061

Theoretical pI: Translated: 6.20; Mature: 6.20

Prosite motif: PS50110 RESPONSE_REGULATORY ; PS00675 SIGMA54_INTERACT_1 ; PS00676 SIGMA54_INTERACT_2 ; PS00688 SIGMA54_INTERACT_3 ; PS50045 SIGMA54_INTERACT_4

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.5 %Cys     (Translated Protein)
2.5 %Met     (Translated Protein)
2.9 %Cys+Met (Translated Protein)
0.5 %Cys     (Mature Protein)
2.3 %Met     (Mature Protein)
2.7 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSHKPAHLLLVDDDPGLLKLLGLRLTSEGYSVVTAESGAEGLRVLNREKVDLVISDLRMD
CCCCCCEEEEEECCCCHHHHHHHHCCCCCCEEEEECCCCHHHHHHCCHHHHHHHHHHCCC
EMDGMQLFAEIQKVQPGMPVIILTAHGSIPDAVAATQQGVFSFLIKPVDKDALYQAIDDA
HHHHHHHHHHHHHHCCCCCEEEEEECCCCCHHHHHHHHHHHHHHHCCCCHHHHHHHHHHH
LEQSAPATDERWREAIVTRSPLMLRLLEQARLVAQSDVSVLINGQSGTGKEIFAQAIHNA
HHHCCCCCHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCEEEEECCCCCCHHHHHHHHHCC
SPRNSKPFIAINCGALPEQLLESELFGHARGAFTGAVSNREGLFQAAEGGTLFLDEIGDM
CCCCCCCEEEEECCCCHHHHHHHHHHHHHCCCEECCCCCCCCCEEECCCCEEEHHHHCCC
PAPLQVKLLRVLQERKVRPLGSNRDIDIDVRIISATHRDLPKAMTRGEFREDLYYRLNVV
CCCHHHHHHHHHHHCCCCCCCCCCCEEEEEEEEECHHHHHHHHHHHHHHHHHHHHEEEEE
SLKIPALAERTEDIPLLANHLLRQAAERHKPFVRAFSTDAMKRLMTASWPGNVRQLVNVI
EEECCHHHHCCCCCHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHCCCCCCHHHHHHHH
EQCVALTSSPVISDALVEQALEGENTALPTFVEARNQFELNYLRKLLQITKGNVTHAARM
HHHHHHCCCCHHHHHHHHHHHCCCCCCCCHHHHHCCCCCHHHHHHHHHHHCCCHHHHHHH
AGRNRTEFYKLLSRHELDANDFKE
HCCCHHHHHHHHHHCCCCHHHCCC
>Mature Secondary Structure 
SHKPAHLLLVDDDPGLLKLLGLRLTSEGYSVVTAESGAEGLRVLNREKVDLVISDLRMD
CCCCCEEEEEECCCCHHHHHHHHCCCCCCEEEEECCCCHHHHHHCCHHHHHHHHHHCCC
EMDGMQLFAEIQKVQPGMPVIILTAHGSIPDAVAATQQGVFSFLIKPVDKDALYQAIDDA
HHHHHHHHHHHHHHCCCCCEEEEEECCCCCHHHHHHHHHHHHHHHCCCCHHHHHHHHHHH
LEQSAPATDERWREAIVTRSPLMLRLLEQARLVAQSDVSVLINGQSGTGKEIFAQAIHNA
HHHCCCCCHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCEEEEECCCCCCHHHHHHHHHCC
SPRNSKPFIAINCGALPEQLLESELFGHARGAFTGAVSNREGLFQAAEGGTLFLDEIGDM
CCCCCCCEEEEECCCCHHHHHHHHHHHHHCCCEECCCCCCCCCEEECCCCEEEHHHHCCC
PAPLQVKLLRVLQERKVRPLGSNRDIDIDVRIISATHRDLPKAMTRGEFREDLYYRLNVV
CCCHHHHHHHHHHHCCCCCCCCCCCEEEEEEEEECHHHHHHHHHHHHHHHHHHHHEEEEE
SLKIPALAERTEDIPLLANHLLRQAAERHKPFVRAFSTDAMKRLMTASWPGNVRQLVNVI
EEECCHHHHCCCCCHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHCCCCCCHHHHHHHH
EQCVALTSSPVISDALVEQALEGENTALPTFVEARNQFELNYLRKLLQITKGNVTHAARM
HHHHHHCCCCHHHHHHHHHHHCCCCCCCCHHHHHCCCCCHHHHHHHHHHHCCCHHHHHHH
AGRNRTEFYKLLSRHELDANDFKE
HCCCHHHHHHHHHHCCCCHHHCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: DNA [C]

Specific reaction: Protein + DNA = Protein-DNA [C]

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 11206551; 11258796 [H]