BacMap

Definition	Escherichia coli ED1a chromosome, complete genome.
Accession	NC_011745
Length	5,209,548

Click here to switch to the map view.

The map label for this gene is ydfE [H]

Identifier: 218688809

GI number: 218688809

Start: 1030335

End: 1032806

Strand: Reverse

Name: ydfE [H]

Synonym: ECED1_0996

Alternate gene names: 218688809

Gene position: 1032806-1030335 (Counterclockwise)

Preceding gene: 218688810

Following gene: 218688808

Centisome position: 19.83

GC content: 49.64

Gene sequence:

>2472_bases
ATGAGTAAAGTCTTTATTTGCGCCGCCATTCCGGACGAACAGGCAATAAAGGAAGAAGGTGCCGTCGCTGTAGCCACTGC
CATTGAAGCCGGTGATGAACGTCGCGCCCGCGCAAAATTTCACTGGCAATTCCTGGAGCATTATCCGGCTGCTCAGGACT
GCGCTTATAAATTTCTTGTCTGCGAGGATAAACCCGGTATACCCCGCCCTGCCCTCGATTCCTGGGATGCTGAATATATG
CAGGAAAACCGCTGGGATGAGGAGTCTGCTTCCTTTGTCCCGGTTGAGACTGAATCCGATCCGATGAACGTCACTTTTGA
CAAGCTGGCCCCTGAAGTACAGAACGCTGTCATGGTTAAGTTCGACACATGTGAAAACATCACCGTTGATATGGTTATTA
GCGCACAGGAATTGTTGCAGGAAGACATGGCAACATTCGACGGACATATCGTTGAAGCGTTGATGAAAATGCCAGAAGTT
AACGCCATGTATCCGGAGCTTAAGTTGCACGCCATTGGGTGGGTTAAGCATAAATGTATTCCTGGTGCTAAATGGCCCGA
AATTCAGGCAGAGATGCGCATCTGGAAAAAACGTCGCGAAGGTGAACGCAAGGAAACCGGAAAATACACGTCTGTTGTTG
ATCTCGCCCGCGCCAGAACCAATCAACAGCACAGTGAAAATTCAACAGGAAAAATCAGCCCGGTCATTGCTGCCATTCAT
CGCGAATACAAGCAGACATGGAAAACACTGGATGACGAACTGGCCTACGCTCTCTGGCCTGGTGATGTGGATGCCGGAAA
CATTGACGGCAGCATCCATCGCTGGGCAAAAAATGAAGTTATCGACAACGACCGCGAAGACTGGAAGCGTATCTCGGCAT
CAATGCGCAAACAGCCTGATGCCCTTCGCTACGACCGCCAGACTATTTTTGGCCTTGTCCGTGAACGTCCGATCGACATT
CACAAAGACCCTGTGGCACTGAACAAATACATTACTGAATACCTGACTACAAAGGGCGTGTTTGAAGATGAAGGAAGAAA
TCAGAGCGCAACTGATACTCTCCCGTCGCCAGTACCAGAAACTGATGCAGTGGAAACGGCAATTCCGGGCAACGAAAAAA
CCGAATGCAAAGTGGAAGTCGAACCATCTGTAGAGCGTGAGGGGCCGTTCTACTTCCTCTTCACCGACAAGGATGGCGAA
AAATACGGTCGCGCAAACAAACTTTCTGGTCTGGAAAAAGCACTAGCCTTGGGAGCTACGGAAATCACAAAAGAGGAATA
CTTCGCACGCAAAAACGGCACATACACAGGTTCACAACAAAATACTGATGCATCTGACACGACCGCACAACCAGACCTGG
TAAAAGTTACCGCTGACGAAGTAAACAAAATTATGCAGGCAGCCAGTATCAGCCAGCCTGACGCCGATAAGTTGCTTGCT
GCCTCTCGCGGAGAATTTGTTGCAGGGATTAGCGACCCGAATGATCCGAAATGGGTAAAGGGGATTGAAACCCGCGATTC
TGTAGACCAGAACCAGCAAGAATCGGAACAGAACGACCAGAAAGCGGAACAAAACAGCCCAAATGCGTTACAAAACGAGC
CAGAAACGAAACAACCTGAACCAGTAGTGCAACAGGAACCGGAAAAGATCTGCACCGCCTGCGGTCAGACCGGCGGCGGC
AACTGCCCTGATTGTGGCGCGGTGATGGGCGACGCAACATACCAGGAAACATTCGATGAAGAGTATCAGGTTGAAGTTCA
GGAAGATGATCCGGAGGAAATGGAAGGCGCTGAACATCCACACAAGGAGAATGCTGGCAGCGCTCAGGATCACGCCAGCG
ATAGTGAAACTGGCGAGACGGCAGATCCCTTAATTACGGTGAACGGTCATCACGTTATCACATCCACCAGCAGGTTGTGG
CACCATCTGATGATTGACCTTGAAACCATGGGAAAAAATCCTGATGCCCCGATCATCTCAATAGGTGCAATATTTTTCGA
TCCGCAAACCGGAGATATGGGACCGGAATTTAGTAAGACTATCGATCTGGAAACTGCTGGCGGGGTCATTGATCGGGACA
CCATTAAATGGTGGCTTAAGCAATCACGCGAAGCGCAATCTGCCATTATGACCGATGAAATCCCGTTAGATGATGCACTG
TTACAATTGCGGGAATTTATCGACGAAAACTCCGGTGAATTTTTTGTTCAGGTCTGGGGAAATGGAGCCAACTTCGACAA
CACGATTTTGCGCCGTTCATACGAACGGCAGGGGATCCCCTGCCCGTGGCGTTACTACAACGATCGCGATGTACGCACAA
TCGTTGAGCTGGGGAAAGCCATAGACTTCGATGCCAGAACTGCTACCCCATTCGAAGGTGAGCGCCATAATGCACTTGAT
GACGCCCGTTATCAGGCAAAATACGTTTCAGCTATCTGGCAAAAACTGATCCCGAGTCAGGCTGATTTTTAA

Upstream 100 bases:

>100_bases
GGATAACCCGCCAGCCATATTAACGCCATACCAACGGATTAAAAATGCCAGCAATGGCAGGGATTCGTTCACCCTGAAAT
CTGTAATGAGGTAAAACAAA

Downstream 100 bases:

>100_bases
TGTTCAACCCATATCGCCGCCCACCAGCTATAGTGGCGGCGGTCATGCTGTAAAGGCACGTGACCACATGTACGAATTAA
CTCTATCTCCAGCAGAGATT

Product: putative exonuclease from phage origin

Products: NA

Alternate protein names: ORF6 [H]

Number of amino acids: Translated: 823; Mature: 822

Protein sequence:

>823_residues
MSKVFICAAIPDEQAIKEEGAVAVATAIEAGDERRARAKFHWQFLEHYPAAQDCAYKFLVCEDKPGIPRPALDSWDAEYM
QENRWDEESASFVPVETESDPMNVTFDKLAPEVQNAVMVKFDTCENITVDMVISAQELLQEDMATFDGHIVEALMKMPEV
NAMYPELKLHAIGWVKHKCIPGAKWPEIQAEMRIWKKRREGERKETGKYTSVVDLARARTNQQHSENSTGKISPVIAAIH
REYKQTWKTLDDELAYALWPGDVDAGNIDGSIHRWAKNEVIDNDREDWKRISASMRKQPDALRYDRQTIFGLVRERPIDI
HKDPVALNKYITEYLTTKGVFEDEGRNQSATDTLPSPVPETDAVETAIPGNEKTECKVEVEPSVEREGPFYFLFTDKDGE
KYGRANKLSGLEKALALGATEITKEEYFARKNGTYTGSQQNTDASDTTAQPDLVKVTADEVNKIMQAASISQPDADKLLA
ASRGEFVAGISDPNDPKWVKGIETRDSVDQNQQESEQNDQKAEQNSPNALQNEPETKQPEPVVQQEPEKICTACGQTGGG
NCPDCGAVMGDATYQETFDEEYQVEVQEDDPEEMEGAEHPHKENAGSAQDHASDSETGETADPLITVNGHHVITSTSRLW
HHLMIDLETMGKNPDAPIISIGAIFFDPQTGDMGPEFSKTIDLETAGGVIDRDTIKWWLKQSREAQSAIMTDEIPLDDAL
LQLREFIDENSGEFFVQVWGNGANFDNTILRRSYERQGIPCPWRYYNDRDVRTIVELGKAIDFDARTATPFEGERHNALD
DARYQAKYVSAIWQKLIPSQADF

Sequences:

>Translated_823_residues
MSKVFICAAIPDEQAIKEEGAVAVATAIEAGDERRARAKFHWQFLEHYPAAQDCAYKFLVCEDKPGIPRPALDSWDAEYM
QENRWDEESASFVPVETESDPMNVTFDKLAPEVQNAVMVKFDTCENITVDMVISAQELLQEDMATFDGHIVEALMKMPEV
NAMYPELKLHAIGWVKHKCIPGAKWPEIQAEMRIWKKRREGERKETGKYTSVVDLARARTNQQHSENSTGKISPVIAAIH
REYKQTWKTLDDELAYALWPGDVDAGNIDGSIHRWAKNEVIDNDREDWKRISASMRKQPDALRYDRQTIFGLVRERPIDI
HKDPVALNKYITEYLTTKGVFEDEGRNQSATDTLPSPVPETDAVETAIPGNEKTECKVEVEPSVEREGPFYFLFTDKDGE
KYGRANKLSGLEKALALGATEITKEEYFARKNGTYTGSQQNTDASDTTAQPDLVKVTADEVNKIMQAASISQPDADKLLA
ASRGEFVAGISDPNDPKWVKGIETRDSVDQNQQESEQNDQKAEQNSPNALQNEPETKQPEPVVQQEPEKICTACGQTGGG
NCPDCGAVMGDATYQETFDEEYQVEVQEDDPEEMEGAEHPHKENAGSAQDHASDSETGETADPLITVNGHHVITSTSRLW
HHLMIDLETMGKNPDAPIISIGAIFFDPQTGDMGPEFSKTIDLETAGGVIDRDTIKWWLKQSREAQSAIMTDEIPLDDAL
LQLREFIDENSGEFFVQVWGNGANFDNTILRRSYERQGIPCPWRYYNDRDVRTIVELGKAIDFDARTATPFEGERHNALD
DARYQAKYVSAIWQKLIPSQADF
>Mature_822_residues
SKVFICAAIPDEQAIKEEGAVAVATAIEAGDERRARAKFHWQFLEHYPAAQDCAYKFLVCEDKPGIPRPALDSWDAEYMQ
ENRWDEESASFVPVETESDPMNVTFDKLAPEVQNAVMVKFDTCENITVDMVISAQELLQEDMATFDGHIVEALMKMPEVN
AMYPELKLHAIGWVKHKCIPGAKWPEIQAEMRIWKKRREGERKETGKYTSVVDLARARTNQQHSENSTGKISPVIAAIHR
EYKQTWKTLDDELAYALWPGDVDAGNIDGSIHRWAKNEVIDNDREDWKRISASMRKQPDALRYDRQTIFGLVRERPIDIH
KDPVALNKYITEYLTTKGVFEDEGRNQSATDTLPSPVPETDAVETAIPGNEKTECKVEVEPSVEREGPFYFLFTDKDGEK
YGRANKLSGLEKALALGATEITKEEYFARKNGTYTGSQQNTDASDTTAQPDLVKVTADEVNKIMQAASISQPDADKLLAA
SRGEFVAGISDPNDPKWVKGIETRDSVDQNQQESEQNDQKAEQNSPNALQNEPETKQPEPVVQQEPEKICTACGQTGGGN
CPDCGAVMGDATYQETFDEEYQVEVQEDDPEEMEGAEHPHKENAGSAQDHASDSETGETADPLITVNGHHVITSTSRLWH
HLMIDLETMGKNPDAPIISIGAIFFDPQTGDMGPEFSKTIDLETAGGVIDRDTIKWWLKQSREAQSAIMTDEIPLDDALL
QLREFIDENSGEFFVQVWGNGANFDNTILRRSYERQGIPCPWRYYNDRDVRTIVELGKAIDFDARTATPFEGERHNALDD
ARYQAKYVSAIWQKLIPSQADF

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

Organism=Escherichia coli, GI1787612, Length=373, Percent_Identity=39.9463806970509, Blast_Score=216, Evalue=5e-57,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 92489; Mature: 92358

Theoretical pI: Translated: 4.37; Mature: 4.37

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.3 %Cys     (Translated Protein)
2.2 %Met     (Translated Protein)
3.5 %Cys+Met (Translated Protein)
1.3 %Cys     (Mature Protein)
2.1 %Met     (Mature Protein)
3.4 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSKVFICAAIPDEQAIKEEGAVAVATAIEAGDERRARAKFHWQFLEHYPAAQDCAYKFLV
CCCEEEEEECCCHHHHHHCCCEEEEEEHHCCCHHHHHHHHHHHHHHHCCCHHHCEEEEEE
CEDKPGIPRPALDSWDAEYMQENRWDEESASFVPVETESDPMNVTFDKLAPEVQNAVMVK
ECCCCCCCCCCCCCCCHHHHHHCCCCCCCCCEEEEECCCCCCCEEHHHHCHHHCCEEEEE
FDTCENITVDMVISAQELLQEDMATFDGHIVEALMKMPEVNAMYPELKLHAIGWVKHKCI
EECCCCCEEEEEECHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEEHHHHHHCC
PGAKWPEIQAEMRIWKKRREGERKETGKYTSVVDLARARTNQQHSENSTGKISPVIAAIH
CCCCCCHHHHHHHHHHHHHCCCHHHCCCHHHHHHHHHHHCCCHHCCCCCCCHHHHHHHHH
REYKQTWKTLDDELAYALWPGDVDAGNIDGSIHRWAKNEVIDNDREDWKRISASMRKQPD
HHHHHHHHHHHHHHEEEECCCCCCCCCCCCHHHHHHHHHHCCCCHHHHHHHHHHHHCCCH
ALRYDRQTIFGLVRERPIDIHKDPVALNKYITEYLTTKGVFEDEGRNQSATDTLPSPVPE
HHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCC
TDAVETAIPGNEKTECKVEVEPSVEREGPFYFLFTDKDGEKYGRANKLSGLEKALALGAT
CCCCCCCCCCCCCCEEEEEECCCCCCCCCEEEEEECCCCHHHCCHHHHHHHHHHHHHCHH
EITKEEYFARKNGTYTGSQQNTDASDTTAQPDLVKVTADEVNKIMQAASISQPDADKLLA
HHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCEEEECHHHHHHHHHHHCCCCCCHHHHHH
ASRGEFVAGISDPNDPKWVKGIETRDSVDQNQQESEQNDQKAEQNSPNALQNEPETKQPE
HCCCCEEEECCCCCCCHHHCCCCCHHHHCCHHHHHHHHHHHHHCCCCCCCCCCCCCCCCC
PVVQQEPEKICTACGQTGGGNCPDCGAVMGDATYQETFDEEYQVEVQEDDPEEMEGAEHP
CHHHCCHHHHHHHCCCCCCCCCCCHHHHHCCCHHHHHCCCCEEEEECCCCHHHHCCCCCC
HKENAGSAQDHASDSETGETADPLITVNGHHVITSTSRLWHHLMIDLETMGKNPDAPIIS
CCCCCCCCHHCCCCCCCCCCCCCEEEECCCEEEECHHHHHHHHHHHHHHHCCCCCCCEEE
IGAIFFDPQTGDMGPEFSKTIDLETAGGVIDRDTIKWWLKQSREAQSAIMTDEIPLDDAL
EEEEEECCCCCCCCCCHHCEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCHHHHH
LQLREFIDENSGEFFVQVWGNGANFDNTILRRSYERQGIPCPWRYYNDRDVRTIVELGKA
HHHHHHHCCCCCEEEEEEECCCCCCHHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHH
IDFDARTATPFEGERHNALDDARYQAKYVSAIWQKLIPSQADF
CCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCC
>Mature Secondary Structure 
SKVFICAAIPDEQAIKEEGAVAVATAIEAGDERRARAKFHWQFLEHYPAAQDCAYKFLV
CCEEEEEECCCHHHHHHCCCEEEEEEHHCCCHHHHHHHHHHHHHHHCCCHHHCEEEEEE
CEDKPGIPRPALDSWDAEYMQENRWDEESASFVPVETESDPMNVTFDKLAPEVQNAVMVK
ECCCCCCCCCCCCCCCHHHHHHCCCCCCCCCEEEEECCCCCCCEEHHHHCHHHCCEEEEE
FDTCENITVDMVISAQELLQEDMATFDGHIVEALMKMPEVNAMYPELKLHAIGWVKHKCI
EECCCCCEEEEEECHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEEHHHHHHCC
PGAKWPEIQAEMRIWKKRREGERKETGKYTSVVDLARARTNQQHSENSTGKISPVIAAIH
CCCCCCHHHHHHHHHHHHHCCCHHHCCCHHHHHHHHHHHCCCHHCCCCCCCHHHHHHHHH
REYKQTWKTLDDELAYALWPGDVDAGNIDGSIHRWAKNEVIDNDREDWKRISASMRKQPD
HHHHHHHHHHHHHHEEEECCCCCCCCCCCCHHHHHHHHHHCCCCHHHHHHHHHHHHCCCH
ALRYDRQTIFGLVRERPIDIHKDPVALNKYITEYLTTKGVFEDEGRNQSATDTLPSPVPE
HHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCC
TDAVETAIPGNEKTECKVEVEPSVEREGPFYFLFTDKDGEKYGRANKLSGLEKALALGAT
CCCCCCCCCCCCCCEEEEEECCCCCCCCCEEEEEECCCCHHHCCHHHHHHHHHHHHHCHH
EITKEEYFARKNGTYTGSQQNTDASDTTAQPDLVKVTADEVNKIMQAASISQPDADKLLA
HHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCEEEECHHHHHHHHHHHCCCCCCHHHHHH
ASRGEFVAGISDPNDPKWVKGIETRDSVDQNQQESEQNDQKAEQNSPNALQNEPETKQPE
HCCCCEEEECCCCCCCHHHCCCCCHHHHCCHHHHHHHHHHHHHCCCCCCCCCCCCCCCCC
PVVQQEPEKICTACGQTGGGNCPDCGAVMGDATYQETFDEEYQVEVQEDDPEEMEGAEHP
CHHHCCHHHHHHHCCCCCCCCCCCHHHHHCCCHHHHHCCCCEEEEECCCCHHHHCCCCCC
HKENAGSAQDHASDSETGETADPLITVNGHHVITSTSRLWHHLMIDLETMGKNPDAPIIS
CCCCCCCCHHCCCCCCCCCCCCCEEEECCCEEEECHHHHHHHHHHHHHHHCCCCCCCEEE
IGAIFFDPQTGDMGPEFSKTIDLETAGGVIDRDTIKWWLKQSREAQSAIMTDEIPLDDAL
EEEEEECCCCCCCCCCHHCEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCHHHHH
LQLREFIDENSGEFFVQVWGNGANFDNTILRRSYERQGIPCPWRYYNDRDVRTIVELGKA
HHHHHHHCCCCCEEEEEEECCCCCCHHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHH
IDFDARTATPFEGERHNALDDARYQAKYVSAIWQKLIPSQADF
CCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 2477663; 9097039; 9278503 [H]