BacMap

Definition	Halothermothrix orenii H 168 chromosome, complete genome.
Accession	NC_011899
Length	2,578,146

Click here to switch to the map view.

The map label for this gene is ilvD

Identifier: 220931923

GI number: 220931923

Start: 1174736

End: 1176391

Strand: Direct

Name: ilvD

Synonym: Hore_10820

Alternate gene names: 220931923

Gene position: 1174736-1176391 (Clockwise)

Preceding gene: 220931922

Following gene: 220931924

Centisome position: 45.57

GC content: 43.3

Gene sequence:

>1656_bases
TTGGGGAGTGAAACAATAACACAAGGTTTTAAGAGGGCCCCCCATAGATCTTTATTATATGCGTTAGGTCTAGATGAAAA
GGAGTTAGAAAAACCAATAATAGGTATTGCCAGCTCTTACAGTGAAATCATACCTGGTCATAAGCACCTTGATAAGATTG
CAGAAGCTGTAAAGTATGGGGTTTACAGTGCCGGTGGGACACCGGTCATTTTTTCTACAATCGGGGTCTGTGATGGTATT
GCTATGGGGCATTCTGGTATGAAATATTCACTGGCCAGTCGAGAAATAATAGCTGATTCAGTGGAAACAGTTGTCAGAGC
CCACCAGTTTGATGGGTTAGTTTTAGTACCCAACTGTGATAAGATTGTTCCTGGAATGTTGATGGCAGCGGCCAGATTAG
ATATTCCAGCTATCGTTGTCAGTGGAGGACCCATGCTTGCCGGTGATTATCAGGGCAAGTCGCTGGATCTTCATAATGTC
TTTGAAGCAGTTGGTGAAGTGAAAGCGGGTAAAATTACAGAAGGAGAACTGGAAAATATAGAAAAAGCGGCCTGTCCCGG
GTGTGGGTCATGTGCCGGAATGTTTACGGCAAATTCAATGAACTGCTTAACAGAAGTGCTGGGGATGGCTTTACCCGGAA
ACGGAACTATTCCTGCAGTTTATGCTGAAAGGATCAGGCTTGCCAAAAAGTCAGGTAGACAGATTATAAATCTTGTCGAA
AAAAATATTAAACCTTCAGATATTATGACCCGGGAGGCTTTTAAAAATGCTATCTGTGTTGATATGGCCCTTGGATGTTC
TACCAATACAGCCCTGCATCTACCGGCAATAGCCCACGAGGCTGGTCTTGATTTAGAACTTGATTTATTTAACGATATAA
GTAGGAAAGTACCTCACATTTGTAGTCTGACACCAGCTGGAATTTATCACATAGAAGACTTATACAGGGTTGGCGGTATT
CCAGCTGTTATGAAAGAACTCAGTGAGAAGGATTTAATACAGCTTGATCAGCTTACCGTAACTGGAGATACTGTTGGCAC
TAACATAAGTAGAGTAGGTTATATTGATCATAAAATTATACGTCCTGTAAGTAATCCCTATCACAATCAGGGAGGGCTGG
CTGTCTTAAAGGGGAATATTGCTCCCGGTGGTTCAGTAGTAAAGCAGGCAGCAGTAGCTGACAGTATGATGGTCCATAGA
GGTCCAGCCCGGGTTTTTAAAGGTGAAGAGGAAGCTGTTGATGCCATCATTAATGGTCAGATCAGCGAAGGGGATGTTGT
AGTTATAACTTACGAAGGTCCCAGGGGCGGACCCGGAATGAGAGAGATGTTAACCCCTACCTCCGCCCTGGCTGGTCTTG
GCCTTGATGATAAAGTTGCCCTTATTACTGATGGGCGTTTTTCCGGTGCTACCCGGGGAGCTGCCATTGGTCATGTTTCT
CCTGAAGCAGCGTCAGGTGGACCTATTGGAATTATCCAGGACGGCGATATTATAGAAATTGATATTCCTGCTAAATCTCT
AAATGTAGACATATCAGAGGAAGAATTTGAGAAGAGAATGAGTAATTTTAATCCTGAATTACCTGACATATCAGGTTATC
TGGGTCGATATGCTAAACATGTTTCTTCTGCAAGTACCGGAGCAGTTTTAGAATGA

Upstream 100 bases:

>100_bases
AATTTAGGCGGATTGCAAATTCTACAGGAGTTACCATTTATCCCAAAAATGAAGTCAGGGTATCATAGAGAGTAGAAAAG
TAGCAAAGGAGGTTGTTTTA

Downstream 100 bases:

>100_bases
TTTATTTAATGGTTTATAAAAAGTAAATATTAACGAGTATTAGAGAGTAGGGAGTAGTTGAGAAGGGTATTAACAATGCT
TATTTTTCTATGTAATAGAT

Product: dihydroxy-acid dehydratase

Products: NA

Alternate protein names: DAD

Number of amino acids: Translated: 551; Mature: 550

Protein sequence:

>551_residues
MGSETITQGFKRAPHRSLLYALGLDEKELEKPIIGIASSYSEIIPGHKHLDKIAEAVKYGVYSAGGTPVIFSTIGVCDGI
AMGHSGMKYSLASREIIADSVETVVRAHQFDGLVLVPNCDKIVPGMLMAAARLDIPAIVVSGGPMLAGDYQGKSLDLHNV
FEAVGEVKAGKITEGELENIEKAACPGCGSCAGMFTANSMNCLTEVLGMALPGNGTIPAVYAERIRLAKKSGRQIINLVE
KNIKPSDIMTREAFKNAICVDMALGCSTNTALHLPAIAHEAGLDLELDLFNDISRKVPHICSLTPAGIYHIEDLYRVGGI
PAVMKELSEKDLIQLDQLTVTGDTVGTNISRVGYIDHKIIRPVSNPYHNQGGLAVLKGNIAPGGSVVKQAAVADSMMVHR
GPARVFKGEEEAVDAIINGQISEGDVVVITYEGPRGGPGMREMLTPTSALAGLGLDDKVALITDGRFSGATRGAAIGHVS
PEAASGGPIGIIQDGDIIEIDIPAKSLNVDISEEEFEKRMSNFNPELPDISGYLGRYAKHVSSASTGAVLE

Sequences:

>Translated_551_residues
MGSETITQGFKRAPHRSLLYALGLDEKELEKPIIGIASSYSEIIPGHKHLDKIAEAVKYGVYSAGGTPVIFSTIGVCDGI
AMGHSGMKYSLASREIIADSVETVVRAHQFDGLVLVPNCDKIVPGMLMAAARLDIPAIVVSGGPMLAGDYQGKSLDLHNV
FEAVGEVKAGKITEGELENIEKAACPGCGSCAGMFTANSMNCLTEVLGMALPGNGTIPAVYAERIRLAKKSGRQIINLVE
KNIKPSDIMTREAFKNAICVDMALGCSTNTALHLPAIAHEAGLDLELDLFNDISRKVPHICSLTPAGIYHIEDLYRVGGI
PAVMKELSEKDLIQLDQLTVTGDTVGTNISRVGYIDHKIIRPVSNPYHNQGGLAVLKGNIAPGGSVVKQAAVADSMMVHR
GPARVFKGEEEAVDAIINGQISEGDVVVITYEGPRGGPGMREMLTPTSALAGLGLDDKVALITDGRFSGATRGAAIGHVS
PEAASGGPIGIIQDGDIIEIDIPAKSLNVDISEEEFEKRMSNFNPELPDISGYLGRYAKHVSSASTGAVLE
>Mature_550_residues
GSETITQGFKRAPHRSLLYALGLDEKELEKPIIGIASSYSEIIPGHKHLDKIAEAVKYGVYSAGGTPVIFSTIGVCDGIA
MGHSGMKYSLASREIIADSVETVVRAHQFDGLVLVPNCDKIVPGMLMAAARLDIPAIVVSGGPMLAGDYQGKSLDLHNVF
EAVGEVKAGKITEGELENIEKAACPGCGSCAGMFTANSMNCLTEVLGMALPGNGTIPAVYAERIRLAKKSGRQIINLVEK
NIKPSDIMTREAFKNAICVDMALGCSTNTALHLPAIAHEAGLDLELDLFNDISRKVPHICSLTPAGIYHIEDLYRVGGIP
AVMKELSEKDLIQLDQLTVTGDTVGTNISRVGYIDHKIIRPVSNPYHNQGGLAVLKGNIAPGGSVVKQAAVADSMMVHRG
PARVFKGEEEAVDAIINGQISEGDVVVITYEGPRGGPGMREMLTPTSALAGLGLDDKVALITDGRFSGATRGAAIGHVSP
EAASGGPIGIIQDGDIIEIDIPAKSLNVDISEEEFEKRMSNFNPELPDISGYLGRYAKHVSSASTGAVLE

Specific function: Valine and isoleucine biosynthesis; fourth step. [C]

COG id: COG0129

COG function: function code EG; Dihydroxyacid dehydratase/phosphogluconate dehydratase

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the ilvD/edd family

Homologues:

Organism=Escherichia coli, GI48994964, Length=606, Percent_Identity=43.2343234323432, Blast_Score=469, Evalue=1e-133,
Organism=Escherichia coli, GI1786464, Length=500, Percent_Identity=34.2, Blast_Score=227, Evalue=1e-60,
Organism=Escherichia coli, GI2367371, Length=541, Percent_Identity=33.086876155268, Blast_Score=224, Evalue=1e-59,
Organism=Escherichia coli, GI1788157, Length=533, Percent_Identity=30.0187617260788, Blast_Score=221, Evalue=1e-58,
Organism=Saccharomyces cerevisiae, GI6322476, Length=560, Percent_Identity=41.9642857142857, Blast_Score=420, Evalue=1e-118,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): ILVD_HALOH (B8CX17)

Other databases:

- EMBL:   CP001098
- RefSeq:   YP_002508831.1
- ProteinModelPortal:   B8CX17
- SMR:   B8CX17
- GeneID:   7312824
- GenomeReviews:   CP001098_GR
- KEGG:   hor:Hore_10820
- HOGENOM:   HBG671001
- OMA:   KVPCLSK
- ProtClustDB:   CLSK2476428
- HAMAP:   MF_00012
- InterPro:   IPR015928
- InterPro:   IPR004404
- InterPro:   IPR000581
- InterPro:   IPR020558
- PANTHER:   PTHR21000
- TIGRFAMs:   TIGR00110

Pfam domain/function: PF00920 ILVD_EDD; SSF52016 Aconitase/3IPM_dehydase_swvl

EC number: =4.2.1.9

Molecular weight: Translated: 58142; Mature: 58011

Theoretical pI: Translated: 5.24; Mature: 5.24

Prosite motif: PS00886 ILVD_EDD_1; PS00887 ILVD_EDD_2

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.6 %Cys     (Translated Protein)
3.1 %Met     (Translated Protein)
4.7 %Cys+Met (Translated Protein)
1.6 %Cys     (Mature Protein)
2.9 %Met     (Mature Protein)
4.5 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MGSETITQGFKRAPHRSLLYALGLDEKELEKPIIGIASSYSEIIPGHKHLDKIAEAVKYG
CCCHHHHHHHHHCCCHHHHEEECCCHHHHHCCHHHHHHHHHHHCCCHHHHHHHHHHHHHC
VYSAGGTPVIFSTIGVCDGIAMGHSGMKYSLASREIIADSVETVVRAHQFDGLVLVPNCD
CCCCCCCEEEHHHHHHHHHHHCCCCCCEEEHHHHHHHHHHHHHHHHHHHCCCEEECCCCC
KIVPGMLMAAARLDIPAIVVSGGPMLAGDYQGKSLDLHNVFEAVGEVKAGKITEGELENI
HHHHHHHHHHHHCCCCEEEEECCCEEECCCCCCCCCHHHHHHHHCCCCCCCCCCCHHHHH
EKAACPGCGSCAGMFTANSMNCLTEVLGMALPGNGTIPAVYAERIRLAKKSGRQIINLVE
HHHCCCCCCCCHHHHCCCHHHHHHHHHCEECCCCCCCHHHHHHHHHHHHHHHHHHHHHHH
KNIKPSDIMTREAFKNAICVDMALGCSTNTALHLPAIAHEAGLDLELDLFNDISRKVPHI
HCCCCHHHHHHHHHCCCEEEEEEECCCCCCEEECCHHHHHCCCCEEEHHHHHHHHHCCCE
CSLTPAGIYHIEDLYRVGGIPAVMKELSEKDLIQLDQLTVTGDTVGTNISRVGYIDHKII
ECCCCCCHHHHHHHHHHCCCHHHHHHCCHHHCEEEEEEEEECCCCCCCCHHEECHHHHHH
RPVSNPYHNQGGLAVLKGNIAPGGSVVKQAAVADSMMVHRGPARVFKGEEEAVDAIINGQ
CCCCCCCCCCCCEEEEECCCCCCHHHHHHHHHHHHHHHCCCCHHHHCCCHHHHHHHHCCC
ISEGDVVVITYEGPRGGPGMREMLTPTSALAGLGLDDKVALITDGRFSGATRGAAIGHVS
CCCCCEEEEEECCCCCCCCHHHHHCCHHHHHCCCCCCCEEEEECCCCCCCCCCCEECCCC
PEAASGGPIGIIQDGDIIEIDIPAKSLNVDISEEEFEKRMSNFNPELPDISGYLGRYAKH
CCCCCCCCEEEEECCCEEEEECCCCCCCCCCCHHHHHHHHHCCCCCCCCHHHHHHHHHHH
VSSASTGAVLE
HCCCCCCCCCC
>Mature Secondary Structure 
GSETITQGFKRAPHRSLLYALGLDEKELEKPIIGIASSYSEIIPGHKHLDKIAEAVKYG
CCHHHHHHHHHCCCHHHHEEECCCHHHHHCCHHHHHHHHHHHCCCHHHHHHHHHHHHHC
VYSAGGTPVIFSTIGVCDGIAMGHSGMKYSLASREIIADSVETVVRAHQFDGLVLVPNCD
CCCCCCCEEEHHHHHHHHHHHCCCCCCEEEHHHHHHHHHHHHHHHHHHHCCCEEECCCCC
KIVPGMLMAAARLDIPAIVVSGGPMLAGDYQGKSLDLHNVFEAVGEVKAGKITEGELENI
HHHHHHHHHHHHCCCCEEEEECCCEEECCCCCCCCCHHHHHHHHCCCCCCCCCCCHHHHH
EKAACPGCGSCAGMFTANSMNCLTEVLGMALPGNGTIPAVYAERIRLAKKSGRQIINLVE
HHHCCCCCCCCHHHHCCCHHHHHHHHHCEECCCCCCCHHHHHHHHHHHHHHHHHHHHHHH
KNIKPSDIMTREAFKNAICVDMALGCSTNTALHLPAIAHEAGLDLELDLFNDISRKVPHI
HCCCCHHHHHHHHHCCCEEEEEEECCCCCCEEECCHHHHHCCCCEEEHHHHHHHHHCCCE
CSLTPAGIYHIEDLYRVGGIPAVMKELSEKDLIQLDQLTVTGDTVGTNISRVGYIDHKII
ECCCCCCHHHHHHHHHHCCCHHHHHHCCHHHCEEEEEEEEECCCCCCCCHHEECHHHHHH
RPVSNPYHNQGGLAVLKGNIAPGGSVVKQAAVADSMMVHRGPARVFKGEEEAVDAIINGQ
CCCCCCCCCCCCEEEEECCCCCCHHHHHHHHHHHHHHHCCCCHHHHCCCHHHHHHHHCCC
ISEGDVVVITYEGPRGGPGMREMLTPTSALAGLGLDDKVALITDGRFSGATRGAAIGHVS
CCCCCEEEEEECCCCCCCCHHHHHCCHHHHHCCCCCCCEEEEECCCCCCCCCCCEECCCC
PEAASGGPIGIIQDGDIIEIDIPAKSLNVDISEEEFEKRMSNFNPELPDISGYLGRYAKH
CCCCCCCCEEEEECCCEEEEECCCCCCCCCCCHHHHHHHHHCCCCCCCCHHHHHHHHHHH
VSSASTGAVLE
HCCCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA