BacMap

Definition	Escherichia coli ED1a chromosome, complete genome.
Accession	NC_011745
Length	5,209,548

Click here to switch to the map view.

The map label for this gene is ypfI [H]

Identifier: 218690601

GI number: 218690601

Start: 2858065

End: 2860080

Strand: Reverse

Name: ypfI [H]

Synonym: ECED1_2908

Alternate gene names: 218690601

Gene position: 2860080-2858065 (Counterclockwise)

Preceding gene: 218690602

Following gene: 218690600

Centisome position: 54.9

GC content: 54.51

Gene sequence:

>2016_bases
ATGGCTGAACTGACTGCGCTTCACACATTAACAGCGCAAATGAAACGTGAAGGGATCCGCCGCTTGCTGGTGTTGAGCGG
GGAAGAGGGTTGGTGTTTTGATCATGCGCTTAAGTTGCGTGATGCCTTACCTGGCGACTGGCTGTGGATTTCGCCGCAGC
CAGATGCTGAAAACCACTGTTCACCCTCGGCGCTACAAACTTTACTTGGGCGCGAGTTCCGGCATGCGGTATTCGACGCC
CGCCACGGCTTTGATGCCGCTGCCTTTGCGGCACTTAGCGGAACGTTGAAAGCGGGAAGTTGGCTGGTTTTGTTACTCCC
TGTATGGGAAGAGTGGGAAAACCAACCTGATGCCGACTCGCTGCGCTGGAGTGATTGCCCTGACCCTATTGCGACGCCGC
ATTTTGTCCAGCATTTCAAACGCGTACTTACGGCGAATAACGACGCTATCCTCTGGCGGCAAAACCAGCCGTTCTCGTTG
GCGCATTTTACTCCCCGTACTGACTGGCACCCCGCTACCGGCGCACCACAACCAGAACAACAGCAACTCTTACAGCAGCT
ACTGACCATGCCGCCGGGCGTGGCAGCGGTAACTGCTGCGCGTGGGCGCGGTAAGTCGGCGTTGGCAGGGCAACTCATTT
CTCGTATTGCGGGCAGTGCGATTGTCACCGCGCCCGCAAAAGCGGCAACGGATGTACTGGCACAATTTGCGGGCGAGAAG
TTTCGCTTTATTGCGCCGGATGCCTTGTTAGCCAGCGATGAGCAAGCCGACTGGCTGGTGGTCGATGAAGCCGCAGCTAT
ACCTGCGCCGTTGTTGTATCAACTGGTATCGCGTTTTCCTCGAACGTTGTTAACTACTACGGTGCAGGGCTACGAAGGCA
CCGGACGTGGTTTTTTGCTGAAATTTTGCGCTCGCTTTCCGCATTTACACCGTTTTGAACTACAACAGCCGATCCGTTGG
GCGCAGGGATGCCCGCTGGAAAAAATGGTTAGTGAGGCACTGGTTTTTGACGATGAAAACTTCACCCATACACCACAAGG
CAATATCGTTATTTCCGCATTTGAACAGACGTTATGGCGAAGCGAGCCAGAAACGCCGTTAAAGGTTTATCAATTATTGT
CTGGTGCGCACTACCGGACTTCGCCGCTGGATTTACGCCGCATGATGGATGCACCAGGTCAACATTTTTTACAGGCGGCT
GGCGAAAACGAGATTGCCGGAGCGCTGTGTCTGGTGGATGAGGGTGGATTATCTCAAGAACTCAGTCAGGCGGTATGGGC
GGGTTATCGTCGTCCACGGGGCAATCTGGTGGCTCAATCGCTGGCGGCGCACGGCAGCAATCCACTGGCGGCGACATTGC
GCGGACGGCGGGTTAGCCGGATAGCAGTTCATCCGGCTCGTCAGCGGGAAGGCACAGGGCGACAGCTTATTGCTGGTGCT
TTGCAATATATTCATGACCTCGACTATCTTTCGGTGAGTTTTGGTTACACCGAGGAGTTATGGCGTTTCTGGCAACGCTG
CGGTTTTGTGCTGGTGCGAATGGGTAATCATCGTGAAGCCAGCAGCGGTTGCTATACGGCGATGGCGCTGTTACCGATGA
GTGATGCGGGTAAACAGCTGGCTGAACGTGAGCATTACCGTTTACGTCGCGATGCGCAAGCTCTCGCGCAGTGGAATGGC
GAAATGCTTCCTGTTGATCCACTAAACGATGCCGTCCTTTCTGACGACGACTGGCTTGAACTGGCCGGTTTTGCTTTCGC
TCATCGTCCGCTATTAACGTCGTTAGGTTGCTTAATGCGTCTGTTACAAACCAGCGAACTGGCATTACCGGCGCTGCGTG
GGCGTTTACAGAAAAACGCCAGTGACGCGCAGTTATGTACCACACTTAAACTTTCAGGCCGTAAGCTGTTACTGGTCCGT
CAACGCGAAGAAGCCGCGCAGGCGCTATTCGCACTTGATGATGTTTGCACTGAGCGTCTGCGCGATCGCATAACGCAATG
GCAATTTTTTCACTGA

Upstream 100 bases:

>100_bases
CTTCTCAGCAACGCTATAGCTGGTTTAAACGTGGTTTCGACAGCGGCGATCCGGCACAATGCAATACTTTTGGTAAAAGC
ATTTAACTTCCGGGGCAGGG

Downstream 100 bases:

>100_bases
CTCCTTCAATTTTCTCCCATAGTCATTGTGAGTCAGCGGCGTAAAATTAATGACATCAGTTAAGGAGTTCGCCATGAAAC
ATGACCATTTTGTTGTTCAA

Product: putative hydrolase

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 671; Mature: 670

Protein sequence:

>671_residues
MAELTALHTLTAQMKREGIRRLLVLSGEEGWCFDHALKLRDALPGDWLWISPQPDAENHCSPSALQTLLGREFRHAVFDA
RHGFDAAAFAALSGTLKAGSWLVLLLPVWEEWENQPDADSLRWSDCPDPIATPHFVQHFKRVLTANNDAILWRQNQPFSL
AHFTPRTDWHPATGAPQPEQQQLLQQLLTMPPGVAAVTAARGRGKSALAGQLISRIAGSAIVTAPAKAATDVLAQFAGEK
FRFIAPDALLASDEQADWLVVDEAAAIPAPLLYQLVSRFPRTLLTTTVQGYEGTGRGFLLKFCARFPHLHRFELQQPIRW
AQGCPLEKMVSEALVFDDENFTHTPQGNIVISAFEQTLWRSEPETPLKVYQLLSGAHYRTSPLDLRRMMDAPGQHFLQAA
GENEIAGALCLVDEGGLSQELSQAVWAGYRRPRGNLVAQSLAAHGSNPLAATLRGRRVSRIAVHPARQREGTGRQLIAGA
LQYIHDLDYLSVSFGYTEELWRFWQRCGFVLVRMGNHREASSGCYTAMALLPMSDAGKQLAEREHYRLRRDAQALAQWNG
EMLPVDPLNDAVLSDDDWLELAGFAFAHRPLLTSLGCLMRLLQTSELALPALRGRLQKNASDAQLCTTLKLSGRKLLLVR
QREEAAQALFALDDVCTERLRDRITQWQFFH

Sequences:

>Translated_671_residues
MAELTALHTLTAQMKREGIRRLLVLSGEEGWCFDHALKLRDALPGDWLWISPQPDAENHCSPSALQTLLGREFRHAVFDA
RHGFDAAAFAALSGTLKAGSWLVLLLPVWEEWENQPDADSLRWSDCPDPIATPHFVQHFKRVLTANNDAILWRQNQPFSL
AHFTPRTDWHPATGAPQPEQQQLLQQLLTMPPGVAAVTAARGRGKSALAGQLISRIAGSAIVTAPAKAATDVLAQFAGEK
FRFIAPDALLASDEQADWLVVDEAAAIPAPLLYQLVSRFPRTLLTTTVQGYEGTGRGFLLKFCARFPHLHRFELQQPIRW
AQGCPLEKMVSEALVFDDENFTHTPQGNIVISAFEQTLWRSEPETPLKVYQLLSGAHYRTSPLDLRRMMDAPGQHFLQAA
GENEIAGALCLVDEGGLSQELSQAVWAGYRRPRGNLVAQSLAAHGSNPLAATLRGRRVSRIAVHPARQREGTGRQLIAGA
LQYIHDLDYLSVSFGYTEELWRFWQRCGFVLVRMGNHREASSGCYTAMALLPMSDAGKQLAEREHYRLRRDAQALAQWNG
EMLPVDPLNDAVLSDDDWLELAGFAFAHRPLLTSLGCLMRLLQTSELALPALRGRLQKNASDAQLCTTLKLSGRKLLLVR
QREEAAQALFALDDVCTERLRDRITQWQFFH
>Mature_670_residues
AELTALHTLTAQMKREGIRRLLVLSGEEGWCFDHALKLRDALPGDWLWISPQPDAENHCSPSALQTLLGREFRHAVFDAR
HGFDAAAFAALSGTLKAGSWLVLLLPVWEEWENQPDADSLRWSDCPDPIATPHFVQHFKRVLTANNDAILWRQNQPFSLA
HFTPRTDWHPATGAPQPEQQQLLQQLLTMPPGVAAVTAARGRGKSALAGQLISRIAGSAIVTAPAKAATDVLAQFAGEKF
RFIAPDALLASDEQADWLVVDEAAAIPAPLLYQLVSRFPRTLLTTTVQGYEGTGRGFLLKFCARFPHLHRFELQQPIRWA
QGCPLEKMVSEALVFDDENFTHTPQGNIVISAFEQTLWRSEPETPLKVYQLLSGAHYRTSPLDLRRMMDAPGQHFLQAAG
ENEIAGALCLVDEGGLSQELSQAVWAGYRRPRGNLVAQSLAAHGSNPLAATLRGRRVSRIAVHPARQREGTGRQLIAGAL
QYIHDLDYLSVSFGYTEELWRFWQRCGFVLVRMGNHREASSGCYTAMALLPMSDAGKQLAEREHYRLRRDAQALAQWNGE
MLPVDPLNDAVLSDDDWLELAGFAFAHRPLLTSLGCLMRLLQTSELALPALRGRLQKNASDAQLCTTLKLSGRKLLLVRQ
REEAAQALFALDDVCTERLRDRITQWQFFH

Specific function: Catalyzes the formation of N(4)-acetylcytidine (ac(4)C) at the wobble position of tRNA(Met), by using acetyl-CoA as an acetyl donor and ATP (or GTP). It recognizes the wobble base of tRNA(Met), thus distinguishing between tRNA(Met) and the structurally si

COG id: COG1444

COG function: function code R; Predicted P-loop ATPase fused to an acetyltransferase

Gene ontology:

Cell location: Cytoplasm (Potential) [H]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 N-acetyltransferase domain [H]

Homologues:

Organism=Escherichia coli, GI1788818, Length=671, Percent_Identity=95.9761549925484, Blast_Score=1313, Evalue=0.0,
Organism=Caenorhabditis elegans, GI17507621, Length=383, Percent_Identity=25.5874673629243, Blast_Score=86, Evalue=6e-17,
Organism=Saccharomyces cerevisiae, GI6324197, Length=379, Percent_Identity=26.6490765171504, Blast_Score=92, Evalue=2e-19,
Organism=Drosophila melanogaster, GI24640662, Length=455, Percent_Identity=25.2747252747253, Blast_Score=101, Evalue=2e-21,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR000182
- InterPro:   IPR016181
- InterPro:   IPR013562
- InterPro:   IPR007807 [H]

Pfam domain/function: PF08351 DUF1726; PF05127 DUF699 [H]

EC number: NA

Molecular weight: Translated: 74791; Mature: 74660

Theoretical pI: Translated: 6.97; Mature: 6.97

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.6 %Cys     (Translated Protein)
1.6 %Met     (Translated Protein)
3.3 %Cys+Met (Translated Protein)
1.6 %Cys     (Mature Protein)
1.5 %Met     (Mature Protein)
3.1 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MAELTALHTLTAQMKREGIRRLLVLSGEEGWCFDHALKLRDALPGDWLWISPQPDAENHC
CCCHHHHHHHHHHHHHHHHHEEEEEECCCCCHHHHHHHHHHCCCCCEEEECCCCCCCCCC
SPSALQTLLGREFRHAVFDARHGFDAAAFAALSGTLKAGSWLVLLLPVWEEWENQPDADS
CHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHCCCCCCCEEEEEEECHHHHCCCCCCCC
LRWSDCPDPIATPHFVQHFKRVLTANNDAILWRQNQPFSLAHFTPRTDWHPATGAPQPEQ
CCCCCCCCCCCCHHHHHHHHHHHHCCCCEEEEECCCCCEEEECCCCCCCCCCCCCCCHHH
QQLLQQLLTMPPGVAAVTAARGRGKSALAGQLISRIAGSAIVTAPAKAATDVLAQFAGEK
HHHHHHHHCCCCCHHHHHHHCCCCCHHHHHHHHHHHCCCEEEECCHHHHHHHHHHHCCCC
FRFIAPDALLASDEQADWLVVDEAAAIPAPLLYQLVSRFPRTLLTTTVQGYEGTGRGFLL
EEEECCCHHHCCCCCCCEEEEECCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHH
KFCARFPHLHRFELQQPIRWAQGCPLEKMVSEALVFDDENFTHTPQGNIVISAFEQTLWR
HHHHHCCCCCHHHHHHHHHHHCCCCHHHHHHHHHEECCCCCCCCCCCCEEEHHHHHHHHC
SEPETPLKVYQLLSGAHYRTSPLDLRRMMDAPGQHFLQAAGENEIAGALCLVDEGGLSQE
CCCCCHHHHHHHHCCCCCCCCHHHHHHHHCCCHHHHHHHCCCCCCCEEEEEECCCCCHHH
LSQAVWAGYRRPRGNLVAQSLAAHGSNPLAATLRGRRVSRIAVHPARQREGTGRQLIAGA
HHHHHHHHCCCCCCHHHHHHHHHCCCCCCEEHHCCCCEEHEEECCHHHCCCCCHHHHHHH
LQYIHDLDYLSVSFGYTEELWRFWQRCGFVLVRMGNHREASSGCYTAMALLPMSDAGKQL
HHHHHHCCHHEEECCCHHHHHHHHHHCCEEEEEECCCCCCCCCHHHHHHHCCCCHHHHHH
AEREHYRLRRDAQALAQWNGEMLPVDPLNDAVLSDDDWLELAGFAFAHRPLLTSLGCLMR
HHHHHHHHHHHHHHHHHCCCCEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHH
LLQTSELALPALRGRLQKNASDAQLCTTLKLSGRKLLLVRQREEAAQALFALDDVCTERL
HHHHHHHHHHHHHHHHHCCCCHHHHHHHEEECCCEEEEEECHHHHHHHHHHHHHHHHHHH
RDRITQWQFFH
HHHHHHCCCCC
>Mature Secondary Structure 
AELTALHTLTAQMKREGIRRLLVLSGEEGWCFDHALKLRDALPGDWLWISPQPDAENHC
CCHHHHHHHHHHHHHHHHHEEEEEECCCCCHHHHHHHHHHCCCCCEEEECCCCCCCCCC
SPSALQTLLGREFRHAVFDARHGFDAAAFAALSGTLKAGSWLVLLLPVWEEWENQPDADS
CHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHCCCCCCCEEEEEEECHHHHCCCCCCCC
LRWSDCPDPIATPHFVQHFKRVLTANNDAILWRQNQPFSLAHFTPRTDWHPATGAPQPEQ
CCCCCCCCCCCCHHHHHHHHHHHHCCCCEEEEECCCCCEEEECCCCCCCCCCCCCCCHHH
QQLLQQLLTMPPGVAAVTAARGRGKSALAGQLISRIAGSAIVTAPAKAATDVLAQFAGEK
HHHHHHHHCCCCCHHHHHHHCCCCCHHHHHHHHHHHCCCEEEECCHHHHHHHHHHHCCCC
FRFIAPDALLASDEQADWLVVDEAAAIPAPLLYQLVSRFPRTLLTTTVQGYEGTGRGFLL
EEEECCCHHHCCCCCCCEEEEECCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHH
KFCARFPHLHRFELQQPIRWAQGCPLEKMVSEALVFDDENFTHTPQGNIVISAFEQTLWR
HHHHHCCCCCHHHHHHHHHHHCCCCHHHHHHHHHEECCCCCCCCCCCCEEEHHHHHHHHC
SEPETPLKVYQLLSGAHYRTSPLDLRRMMDAPGQHFLQAAGENEIAGALCLVDEGGLSQE
CCCCCHHHHHHHHCCCCCCCCHHHHHHHHCCCHHHHHHHCCCCCCCEEEEEECCCCCHHH
LSQAVWAGYRRPRGNLVAQSLAAHGSNPLAATLRGRRVSRIAVHPARQREGTGRQLIAGA
HHHHHHHHCCCCCCHHHHHHHHHCCCCCCEEHHCCCCEEHEEECCHHHCCCCCHHHHHHH
LQYIHDLDYLSVSFGYTEELWRFWQRCGFVLVRMGNHREASSGCYTAMALLPMSDAGKQL
HHHHHHCCHHEEECCCHHHHHHHHHHCCEEEEEECCCCCCCCCHHHHHHHCCCCHHHHHH
AEREHYRLRRDAQALAQWNGEMLPVDPLNDAVLSDDDWLELAGFAFAHRPLLTSLGCLMR
HHHHHHHHHHHHHHHHHCCCCEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHH
LLQTSELALPALRGRLQKNASDAQLCTTLKLSGRKLLLVRQREEAAQALFALDDVCTERL
HHHHHHHHHHHHHHHHHCCCCHHHHHHHEEECCCEEEEEECHHHHHHHHHHHHHHHHHHH
RDRITQWQFFH
HHHHHHCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 9205837; 9278503 [H]