BacMap

Definition	Akkermansia muciniphila ATCC BAA-835, complete genome.
Accession	NC_010655
Length	2,664,102

Click here to switch to the map view.

The map label for this gene is ispG

Identifier: 187735881

GI number: 187735881

Start: 1657289

End: 1659046

Strand: Direct

Name: ispG

Synonym: Amuc_1388

Alternate gene names: 187735881

Gene position: 1657289-1659046 (Clockwise)

Preceding gene: 187735880

Following gene: 187735882

Centisome position: 62.21

GC content: 59.39

Gene sequence:

>1758_bases
ATGCAGTCTTCCTATTGTCCGAGTCCTTATCGATATACGCGCCGCGTAACCCGTGAAGTCATGGTGGGGAATGTGGGGGT
GGGCGGATCCAATCCCATCCGGATCCAGTCCATGCTGACGTCCGATACGCGGGATACGGATGCCTGCGTGAAGGAGGCTT
TGGAGCTGGCGGAGGCAGGGTGCGAGATTATCCGCCTGACCGCCCAGACCAAGGCGTATGCCGCCAATTTGGAGAATATT
GCCCGGGAATTGCGCGCTGCCGGCTGCCATGTGCCTCTGGTGGCCGATATCCACTTCAAGCCGGATGCCGCGATGGAGGC
TGCCAAATGGGTGGAGAAGATTCGTATTAATCCGGGCAATTTCGTTGATAAGAAGAAGTTTGAAGTGCGGGAGTATTCCG
ACGCCGAATACCGCGAGGAGCTGGACCGCCTGAAGGAAGAATTTACGCCCCTGGTTCTGTTTTGCCGGGAGCATGGCCGC
GCGATGCGCATCGGTTCCAACCATGGCTCCCTGTCCGACCGCATTCTGAACCGCTTTGGCGATACGCCGGAGGGGATGGT
GGAGAGCGCGATTGAGTTTGCCCAGATTGCCCGCGACCTGGATTACCATTCCCTGGTGTTTTCCATGAAGGCTTCCAACG
TCAAGGTGATGGTGGCCGCTTACCGATTGCTGGTGGAGCGCATGAACGCCCTGGGGCCGGATTGGAATTATCCCATTCAT
CTGGGGGTGACGGAAGCCGGGGGCGGAGAGGACGGCCGCATCAAGAGCGCCGTGGGCATCGGCTCCCTGCTGACGGACGG
CATTGGTGATACCCTGCGCGTTTCCCTGACGGAGGACGCTGTGAGGGAGGTGCCCGTGGCTTACCGCCTGTCCAATCCTT
TCCAGCCGTCGGAGCGTTCCGATGACCCGGTTTCCTTCCCTGAACCGGAGTTGAGCTATGATCCCCTGAAGTTTTCCAAA
AGGCAGGGTGGGCTGGCGATGTATTATGGCGTACGCCTGGGCTGGGAACAGCCTGTGCGCGTGGCGGTTCCTGACGCCGG
GTTTTACGCCCTGCAGACAGAACGGGAGGCGATGGGGGACATGATGCCTGAATTATCCCTGGGGCAGCTGGATGCCATTG
AGGTGGATCCCCGGTGCGATGCCGATCTGGAGCCGTTGAAGGAGCTGGCGGAACCGTCTATTGTTACTGTGAAGAACGGG
CTGGCTATGGAGCCTGTATATGCGTTCCGCCTTCTGGCTGCCCGTATTGAGGACAGGCATCTGATCCTGCTGAAGGATAC
GCTGGTGCCCGGTTCCGTTTCCGGGGAAGACGTGCCGCTGACGGCTGCCCGCAATATCGGCTCCCTGCTGTGCGACGGGA
TTGGAGACGCCGTGCTGATTCAGGGCGAGTCGGACCCCCGTTTGGCTTCTTTCCTGGGATTCAATATTTTGCAGGCTACG
GGAACGAGGCTGACGCGGGCGGATTACGTTTCCTGCCCGTCCTGCGGGCGTACCCTGTACAATATCCAGGAGGCGACGGC
CCGCATCCGGAAAGCCACGGAACATCTGAAAGGGGTGAAGATTGCCGTGATGGGATGTATTGTGAATGGCCCCGGCGAGA
TGGCGGATGCGGATTTCGGTTATGTGGGCGGCGCGCCGAACAAGATCAACCTGTATGTGAAGCATACGCCTGTGAAGTTC
AATATTCCCCAGGAGGAGGCTGTGGAACGGCTGGTGGATCTGATCAAGGAGTATGGGCGGTGGGTGGACCCCAAGTGA

Upstream 100 bases:

>100_bases
GCGGTACCGCTCCCGTTTTTCCGGTTACCGGATTGGCGGGAAAAGGCTTTCCGTTTTGAAGGATTGTTGACAGGGGAATC
TGGCGCGGTAGAGTGGTTTC

Downstream 100 bases:

>100_bases
GGTTTTAACGTTGAGGGAACTTTTTTGATGCGGAGAGTGTTCATCAGCGGCGGTCACGGCGGTTTGGCGCGGGCCATCGT
GGAATGTTTTTCCGCTGCGG

Product: 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Products: NA

Alternate protein names: 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Number of amino acids: Translated: 585; Mature: 585

Protein sequence:

>585_residues
MQSSYCPSPYRYTRRVTREVMVGNVGVGGSNPIRIQSMLTSDTRDTDACVKEALELAEAGCEIIRLTAQTKAYAANLENI
ARELRAAGCHVPLVADIHFKPDAAMEAAKWVEKIRINPGNFVDKKKFEVREYSDAEYREELDRLKEEFTPLVLFCREHGR
AMRIGSNHGSLSDRILNRFGDTPEGMVESAIEFAQIARDLDYHSLVFSMKASNVKVMVAAYRLLVERMNALGPDWNYPIH
LGVTEAGGGEDGRIKSAVGIGSLLTDGIGDTLRVSLTEDAVREVPVAYRLSNPFQPSERSDDPVSFPEPELSYDPLKFSK
RQGGLAMYYGVRLGWEQPVRVAVPDAGFYALQTEREAMGDMMPELSLGQLDAIEVDPRCDADLEPLKELAEPSIVTVKNG
LAMEPVYAFRLLAARIEDRHLILLKDTLVPGSVSGEDVPLTAARNIGSLLCDGIGDAVLIQGESDPRLASFLGFNILQAT
GTRLTRADYVSCPSCGRTLYNIQEATARIRKATEHLKGVKIAVMGCIVNGPGEMADADFGYVGGAPNKINLYVKHTPVKF
NIPQEEAVERLVDLIKEYGRWVDPK

Sequences:

>Translated_585_residues
MQSSYCPSPYRYTRRVTREVMVGNVGVGGSNPIRIQSMLTSDTRDTDACVKEALELAEAGCEIIRLTAQTKAYAANLENI
ARELRAAGCHVPLVADIHFKPDAAMEAAKWVEKIRINPGNFVDKKKFEVREYSDAEYREELDRLKEEFTPLVLFCREHGR
AMRIGSNHGSLSDRILNRFGDTPEGMVESAIEFAQIARDLDYHSLVFSMKASNVKVMVAAYRLLVERMNALGPDWNYPIH
LGVTEAGGGEDGRIKSAVGIGSLLTDGIGDTLRVSLTEDAVREVPVAYRLSNPFQPSERSDDPVSFPEPELSYDPLKFSK
RQGGLAMYYGVRLGWEQPVRVAVPDAGFYALQTEREAMGDMMPELSLGQLDAIEVDPRCDADLEPLKELAEPSIVTVKNG
LAMEPVYAFRLLAARIEDRHLILLKDTLVPGSVSGEDVPLTAARNIGSLLCDGIGDAVLIQGESDPRLASFLGFNILQAT
GTRLTRADYVSCPSCGRTLYNIQEATARIRKATEHLKGVKIAVMGCIVNGPGEMADADFGYVGGAPNKINLYVKHTPVKF
NIPQEEAVERLVDLIKEYGRWVDPK
>Mature_585_residues
MQSSYCPSPYRYTRRVTREVMVGNVGVGGSNPIRIQSMLTSDTRDTDACVKEALELAEAGCEIIRLTAQTKAYAANLENI
ARELRAAGCHVPLVADIHFKPDAAMEAAKWVEKIRINPGNFVDKKKFEVREYSDAEYREELDRLKEEFTPLVLFCREHGR
AMRIGSNHGSLSDRILNRFGDTPEGMVESAIEFAQIARDLDYHSLVFSMKASNVKVMVAAYRLLVERMNALGPDWNYPIH
LGVTEAGGGEDGRIKSAVGIGSLLTDGIGDTLRVSLTEDAVREVPVAYRLSNPFQPSERSDDPVSFPEPELSYDPLKFSK
RQGGLAMYYGVRLGWEQPVRVAVPDAGFYALQTEREAMGDMMPELSLGQLDAIEVDPRCDADLEPLKELAEPSIVTVKNG
LAMEPVYAFRLLAARIEDRHLILLKDTLVPGSVSGEDVPLTAARNIGSLLCDGIGDAVLIQGESDPRLASFLGFNILQAT
GTRLTRADYVSCPSCGRTLYNIQEATARIRKATEHLKGVKIAVMGCIVNGPGEMADADFGYVGGAPNKINLYVKHTPVKF
NIPQEEAVERLVDLIKEYGRWVDPK

Specific function: Converts 2C-methyl-D-erythritol 2,4-cyclodiphosphate (ME-2,4cPP) into 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate

COG id: COG0821

COG function: function code I; Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the ispG family

Homologues:

Organism=Escherichia coli, GI1788863, Length=297, Percent_Identity=34.6801346801347, Blast_Score=162, Evalue=7e-41,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): ISPG_AKKM8 (B2UKT9)

Other databases:

- EMBL:   CP001071
- RefSeq:   YP_001877993.1
- GeneID:   6275639
- GenomeReviews:   CP001071_GR
- KEGG:   amu:Amuc_1388
- HOGENOM:   HBG335271
- OMA:   SMRIGTN
- ProtClustDB:   CLSK2337898
- HAMAP:   MF_00159
- InterPro:   IPR017178
- InterPro:   IPR004588
- PIRSF:   PIRSF037336
- TIGRFAMs:   TIGR00612

Pfam domain/function: PF04551 GcpE

EC number: =1.17.7.1

Molecular weight: Translated: 64488; Mature: 64488

Theoretical pI: Translated: 5.04; Mature: 5.04

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.7 %Cys     (Translated Protein)
2.7 %Met     (Translated Protein)
4.4 %Cys+Met (Translated Protein)
1.7 %Cys     (Mature Protein)
2.7 %Met     (Mature Protein)
4.4 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MQSSYCPSPYRYTRRVTREVMVGNVGVGGSNPIRIQSMLTSDTRDTDACVKEALELAEAG
CCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCEEEEEECCCCCCCHHHHHHHHHHHHHCC
CEIIRLTAQTKAYAANLENIARELRAAGCHVPLVADIHFKPDAAMEAAKWVEKIRINPGN
CEEEEEEHHHHHHHHHHHHHHHHHHHCCCCCEEEEEEEECCCHHHHHHHHHHHHCCCCCC
FVDKKKFEVREYSDAEYREELDRLKEEFTPLVLFCREHGRAMRIGSNHGSLSDRILNRFG
CCCCCCHHHHCCCCHHHHHHHHHHHHHCCHHEEEEHHCCCEEEECCCCCCHHHHHHHHCC
DTPEGMVESAIEFAQIARDLDYHSLVFSMKASNVKVMVAAYRLLVERMNALGPDWNYPIH
CCHHHHHHHHHHHHHHHHCCCHHHHEEEECCCCEEHHHHHHHHHHHHHHHCCCCCCCCEE
LGVTEAGGGEDGRIKSAVGIGSLLTDGIGDTLRVSLTEDAVREVPVAYRLSNPFQPSERS
EEEEECCCCCCCCCHHHHHHHHHHHCCCCCEEEEEECHHHHHHCCEEEEECCCCCCCCCC
DDPVSFPEPELSYDPLKFSKRQGGLAMYYGVRLGWEQPVRVAVPDAGFYALQTEREAMGD
CCCCCCCCCCCCCCCCHHHHCCCCEEEEEEEEECCCCCCEEEECCCCEEEEECHHHHHHH
MMPELSLGQLDAIEVDPRCDADLEPLKELAEPSIVTVKNGLAMEPVYAFRLLAARIEDRH
HCCCCCCCCCCEEEECCCCCCCHHHHHHHCCCCEEEECCCCCCCHHHHHHHHHHHHCCCE
LILLKDTLVPGSVSGEDVPLTAARNIGSLLCDGIGDAVLIQGESDPRLASFLGFNILQAT
EEEEEECCCCCCCCCCCCCCHHHHHHHHHHHHCCCCEEEEECCCCCHHHHHHHHHHHHHC
GTRLTRADYVSCPSCGRTLYNIQEATARIRKATEHLKGVKIAVMGCIVNGPGEMADADFG
CCCCCHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCEEEEEEEEECCCCCCCCCCCC
YVGGAPNKINLYVKHTPVKFNIPQEEAVERLVDLIKEYGRWVDPK
CCCCCCCEEEEEEEECCEEEECCHHHHHHHHHHHHHHHCCCCCCC
>Mature Secondary Structure
MQSSYCPSPYRYTRRVTREVMVGNVGVGGSNPIRIQSMLTSDTRDTDACVKEALELAEAG
CCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCEEEEEECCCCCCCHHHHHHHHHHHHHCC
CEIIRLTAQTKAYAANLENIARELRAAGCHVPLVADIHFKPDAAMEAAKWVEKIRINPGN
CEEEEEEHHHHHHHHHHHHHHHHHHHCCCCCEEEEEEEECCCHHHHHHHHHHHHCCCCCC
FVDKKKFEVREYSDAEYREELDRLKEEFTPLVLFCREHGRAMRIGSNHGSLSDRILNRFG
CCCCCCHHHHCCCCHHHHHHHHHHHHHCCHHEEEEHHCCCEEEECCCCCCHHHHHHHHCC
DTPEGMVESAIEFAQIARDLDYHSLVFSMKASNVKVMVAAYRLLVERMNALGPDWNYPIH
CCHHHHHHHHHHHHHHHHCCCHHHHEEEECCCCEEHHHHHHHHHHHHHHHCCCCCCCCEE
LGVTEAGGGEDGRIKSAVGIGSLLTDGIGDTLRVSLTEDAVREVPVAYRLSNPFQPSERS
EEEEECCCCCCCCCHHHHHHHHHHHCCCCCEEEEEECHHHHHHCCEEEEECCCCCCCCCC
DDPVSFPEPELSYDPLKFSKRQGGLAMYYGVRLGWEQPVRVAVPDAGFYALQTEREAMGD
CCCCCCCCCCCCCCCCHHHHCCCCEEEEEEEEECCCCCCEEEECCCCEEEEECHHHHHHH
MMPELSLGQLDAIEVDPRCDADLEPLKELAEPSIVTVKNGLAMEPVYAFRLLAARIEDRH
HCCCCCCCCCCEEEECCCCCCCHHHHHHHCCCCEEEECCCCCCCHHHHHHHHHHHHCCCE
LILLKDTLVPGSVSGEDVPLTAARNIGSLLCDGIGDAVLIQGESDPRLASFLGFNILQAT
EEEEEECCCCCCCCCCCCCCHHHHHHHHHHHHCCCCEEEEECCCCCHHHHHHHHHHHHHC
GTRLTRADYVSCPSCGRTLYNIQEATARIRKATEHLKGVKIAVMGCIVNGPGEMADADFG
CCCCCHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCEEEEEEEEECCCCCCCCCCCC
YVGGAPNKINLYVKHTPVKFNIPQEEAVERLVDLIKEYGRWVDPK
CCCCCCCEEEEEEEECCEEEECCHHHHHHHHHHHHHHHCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA