BacMap

Definition	Escherichia coli ED1a chromosome, complete genome.
Accession	NC_011745
Length	5,209,548

Click here to switch to the map view.

The map label for this gene is aroM [H]

Identifier: 218688253

GI number: 218688253

Start: 428396

End: 429073

Strand: Direct

Name: aroM [H]

Synonym: ECED1_0413

Alternate gene names: 218688253

Gene position: 428396-429073 (Clockwise)

Preceding gene: 218688252

Following gene: 218688254

Centisome position: 8.22

GC content: 46.46

Gene sequence:

>678_bases
ATGAGTGCGTCGTTGGCGATCCTGACCATCGGCATTGTACCTATGCAGGAAGTTTTGCCGCTCCTGACAGAATACATTGA
CGAAGATAATATTTCCCATCATAGCCTGCTGGGGAAGTTAAGCCGCGAAGAAGTGATGGCGGAGTACGCGCCAGAAGCAG
GCGAAGACACCATTCTCACATTATTAAATGACAACCAGCTGGCCCATGTTTCGCGTCGTAAAGTGGAACGAGACCTGCAA
GGTGTGGTTGAAGTGCTCGATAATCAGGGTTATGACGTCATTTTATTAATGAGTACAGCAAACATTAGTAGTATGACCGC
GCGTAATACGATCTTTCTTGAGCCGTCGCGGATATTGCCACCGCTGGTTTCCTCTATTGTTGAAGATCATCAGGTGGGGG
TTATCGTACCGGTTGAGGAGTTGCTGACCGTTCAGGCGCAAAAATGGCAAATTTTGCAGAAACCGCCAGTATTTTCATTG
GGTAATCCCATTCATGATTCGGAACAAAAAATCATTGATGCCGGGAAAGAATTACTGGCAAAAGGTGCAGATGTCATCAT
GCTGGATTGTTTGGGATTTAACCAGCGTCATCGCGATTTACTGCAAAAACAGCTCGATGTTCCTGTCTTGCTCTCTAACG
TATTGATTGCACGGCTGGCTGCGGAATTACTGATGTAA

Upstream 100 bases:

>100_bases
TGCTACGCTTTTTGTCATTTGTAGCACAGGTAAGTGTCAGCAGTGGTGCTTAGCGCTTGCCCGGTAATTAACGACGAAAG
AAAAGTAAGGTGGAAGAACA

Downstream 100 bases:

>100_bases
TTTTGCGTGACAGTCAGCGCCTCTGGCCCCTATAGTGAAGTAGATGTTCAACTACCAGACAGGGCCAGTTTATGCTTCAA
AGTAATGAGTACTTTTCCGG

Product: hypothetical protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 225; Mature: 224

Protein sequence:

>225_residues
MSASLAILTIGIVPMQEVLPLLTEYIDEDNISHHSLLGKLSREEVMAEYAPEAGEDTILTLLNDNQLAHVSRRKVERDLQ
GVVEVLDNQGYDVILLMSTANISSMTARNTIFLEPSRILPPLVSSIVEDHQVGVIVPVEELLTVQAQKWQILQKPPVFSL
GNPIHDSEQKIIDAGKELLAKGADVIMLDCLGFNQRHRDLLQKQLDVPVLLSNVLIARLAAELLM

Sequences:

>Translated_225_residues
MSASLAILTIGIVPMQEVLPLLTEYIDEDNISHHSLLGKLSREEVMAEYAPEAGEDTILTLLNDNQLAHVSRRKVERDLQ
GVVEVLDNQGYDVILLMSTANISSMTARNTIFLEPSRILPPLVSSIVEDHQVGVIVPVEELLTVQAQKWQILQKPPVFSL
GNPIHDSEQKIIDAGKELLAKGADVIMLDCLGFNQRHRDLLQKQLDVPVLLSNVLIARLAAELLM
>Mature_224_residues
SASLAILTIGIVPMQEVLPLLTEYIDEDNISHHSLLGKLSREEVMAEYAPEAGEDTILTLLNDNQLAHVSRRKVERDLQG
VVEVLDNQGYDVILLMSTANISSMTARNTIFLEPSRILPPLVSSIVEDHQVGVIVPVEELLTVQAQKWQILQKPPVFSLG
NPIHDSEQKIIDAGKELLAKGADVIMLDCLGFNQRHRDLLQKQLDVPVLLSNVLIARLAAELLM

Specific function: This protein of unknown function is encoded by a gene that cotranscribes with the aroL gene, which codes for shikimate kinase II [H]

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

Organism=Escherichia coli, GI1786589, Length=225, Percent_Identity=97.7777777777778, Blast_Score=439, Evalue=1e-125,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR010843
- ProDom:   PD037589 [H]

Pfam domain/function: PF07302 AroM [H]

EC number: NA

Molecular weight: Translated: 24922; Mature: 24791

Theoretical pI: Translated: 4.48; Mature: 4.48

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.4 %Cys     (Translated Protein)
3.1 %Met     (Translated Protein)
3.6 %Cys+Met (Translated Protein)
0.4 %Cys     (Mature Protein)
2.7 %Met     (Mature Protein)
3.1 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSASLAILTIGIVPMQEVLPLLTEYIDEDNISHHSLLGKLSREEVMAEYAPEAGEDTILT
CCCCEEEEEECCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCEEEE
LLNDNQLAHVSRRKVERDLQGVVEVLDNQGYDVILLMSTANISSMTARNTIFLEPSRILP
EECCCCHHHHHHHHHHHHHHHHHHHHCCCCCEEEEEEECCCCHHHHHCCEEEECCHHHHH
PLVSSIVEDHQVGVIVPVEELLTVQAQKWQILQKPPVFSLGNPIHDSEQKIIDAGKELLA
HHHHHHHHHCCCEEEEEHHHHHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHH
KGADVIMLDCLGFNQRHRDLLQKQLDVPVLLSNVLIARLAAELLM
CCCCEEEEECCCCCHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHC
>Mature Secondary Structure 
SASLAILTIGIVPMQEVLPLLTEYIDEDNISHHSLLGKLSREEVMAEYAPEAGEDTILT
CCCEEEEEECCCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCEEEE
LLNDNQLAHVSRRKVERDLQGVVEVLDNQGYDVILLMSTANISSMTARNTIFLEPSRILP
EECCCCHHHHHHHHHHHHHHHHHHHHCCCCCEEEEEEECCCCHHHHHCCEEEECCHHHHH
PLVSSIVEDHQVGVIVPVEELLTVQAQKWQILQKPPVFSLGNPIHDSEQKIIDAGKELLA
HHHHHHHHHCCCEEEEEHHHHHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHH
KGADVIMLDCLGFNQRHRDLLQKQLDVPVLLSNVLIARLAAELLM
CCCCEEEEECCCCCHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 10.0

TargetDB status: NA

Availability: NA

References: 3001025; 9278503; 8807285 [H]