BacMap

Definition	Akkermansia muciniphila ATCC BAA-835, complete genome.
Accession	NC_010655
Length	2,664,102

Click here to switch to the map view.

The map label for this gene is 187735421

Identifier: 187735421

GI number: 187735421

Start: 1099438

End: 1100859

Strand: Direct

Name: 187735421

Synonym: Amuc_0920

Alternate gene names: NA

Gene position: 1099438-1100859 (Clockwise)

Preceding gene: 187735417

Following gene: 187735425

Centisome position: 41.27

GC content: 58.09

Gene sequence:

>1422_bases
ATGTCTATTTTCTCATCACGCAGACAATTTCTCAAATCTTTGGGGCTTGCGGCCGGAGCGGCTGCCGCCGGAAATGCCCT
CCCTGGGAAGGCTGTGGAAATCCCTGCCGGAGACCATCTCTGGAAATCCGCCTCTCCGGCGGCTCCGAGGCCTTCCGGTT
CCACATACATGGGAGGGTTCAAGGCTCCCCGGCTGGGTCGCATCAGGCTGGCCTTCATCGGCGTGGGAGGGCGCGGGTTC
TCCCACCTGGCGCAAATGTGCGTGATGGATGGAGTGGAAATCGTGGGCATATGTGATTTGAAGGAAGAGTTGACGAAACG
CGGCGTGGATCGCGTGCTCTCCAGAATGGGGAAAAGCCCTTTGGGCTATTCCGGCGGCGATATGGAATACCTGACCATGC
TGAAGGAGCTGAAGCCGGATGCCGTCATCATCAGTACGGATTGGAGTTCGCATGCCAGAATCGCCTGCGACAGCATGAAG
CACGGCGCTCACGCCTTTGTGGAAGTTCCTCTGGCCGTCTCTCTGGAGGAGCTCTGGAGCCTGGTGGATACCAGCGAGGC
CACCAGGAAACATTGCATGATGATGGAAAACGTCAACTATGGGCGGGATGAACTCATGTTCCTGAACATGGTCCGGCAGG
GCGTCATCGGCGATTTGCTTCACGGGGAGGCCGCGTATATCCATTGCCTGGTGACGCAGCTGGGGGACACGCGCGGGGAA
GGGGCCTGGCGGCCGGAATATCATACCAGAATCAATGGCAACCTGTACCCCACCCACGGGTTGGGGCCGGTGGCTCAATA
TATGAATTTGGAGCGTGGAGAGGACCGTTTCTGCCGTGTGGCGGCGTTCGCTTCTCCTGCTCTCGGGCGCAATGCCTACG
CTAAAAAGCATCTTCCCGCCGATCACCGCTGGAACAATACTCCATTCATCTGCGGTGACATGAATACGGCTGTTGTCAAG
ACGCAGCTGGGGCGGACCATTCTTGTCCAGCTGGATGAGACGTCCCCCCGGCCTTACTCCCGCGCCAACCTGATCCAGGG
AACGGAGGGCACGCTGGCTGGTTTCCCAACCCGCGTGGCGGGTGAAAAGCTGGGCAACGGCAATTATCATGAATGGATTG
AAGGCAGGGAAAAACTGGCCGCTATTTATGAAAAATACGATCATCCCCTCTGGAAACGCATCGGGGAGCTGGCCACGAAA
ATGGGCGGTCACGGCGGTATGGACTTTGTGATGCTTTCCCGCATCGTGGAATGCCTCCGGAACGGAGAACCAATGGATCA
GAACGTTTACGAAGGAGCTTCCTGGTCTTCCCTGCTGCCGTTGACAGCCCGTTCCATCGCCCAGGGCGGGATGCCTGTGG
AATTTCCGGATTTTACCCGCGGAGACTGGAAAACCACCATGCCGCTGGCCGTGGTTTCATGA

Upstream 100 bases:

>100_bases
CTAAAATCAGCCATCCGGAGCTTTTCCCCTCAATAGGGAGAATGATGATAAATTCACTCCGGAGGGGGCGTAGTTTTCCT
TGAAGCCATACTTTCAAGCC

Downstream 100 bases:

>100_bases
ATAACGCCGGGGATGAAGGGGCGCTGCCCTCTTCCGGAGAGTTCAGGAAAGAATCCGTTCTTACGCAGGGTGCTCAGCAA
GGACTGCCGGAAAACAGATT

Product: oxidoreductase domain protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 473; Mature: 472

Protein sequence:

>473_residues
MSIFSSRRQFLKSLGLAAGAAAAGNALPGKAVEIPAGDHLWKSASPAAPRPSGSTYMGGFKAPRLGRIRLAFIGVGGRGF
SHLAQMCVMDGVEIVGICDLKEELTKRGVDRVLSRMGKSPLGYSGGDMEYLTMLKELKPDAVIISTDWSSHARIACDSMK
HGAHAFVEVPLAVSLEELWSLVDTSEATRKHCMMMENVNYGRDELMFLNMVRQGVIGDLLHGEAAYIHCLVTQLGDTRGE
GAWRPEYHTRINGNLYPTHGLGPVAQYMNLERGEDRFCRVAAFASPALGRNAYAKKHLPADHRWNNTPFICGDMNTAVVK
TQLGRTILVQLDETSPRPYSRANLIQGTEGTLAGFPTRVAGEKLGNGNYHEWIEGREKLAAIYEKYDHPLWKRIGELATK
MGGHGGMDFVMLSRIVECLRNGEPMDQNVYEGASWSSLLPLTARSIAQGGMPVEFPDFTRGDWKTTMPLAVVS

Sequences:

>Translated_473_residues
MSIFSSRRQFLKSLGLAAGAAAAGNALPGKAVEIPAGDHLWKSASPAAPRPSGSTYMGGFKAPRLGRIRLAFIGVGGRGF
SHLAQMCVMDGVEIVGICDLKEELTKRGVDRVLSRMGKSPLGYSGGDMEYLTMLKELKPDAVIISTDWSSHARIACDSMK
HGAHAFVEVPLAVSLEELWSLVDTSEATRKHCMMMENVNYGRDELMFLNMVRQGVIGDLLHGEAAYIHCLVTQLGDTRGE
GAWRPEYHTRINGNLYPTHGLGPVAQYMNLERGEDRFCRVAAFASPALGRNAYAKKHLPADHRWNNTPFICGDMNTAVVK
TQLGRTILVQLDETSPRPYSRANLIQGTEGTLAGFPTRVAGEKLGNGNYHEWIEGREKLAAIYEKYDHPLWKRIGELATK
MGGHGGMDFVMLSRIVECLRNGEPMDQNVYEGASWSSLLPLTARSIAQGGMPVEFPDFTRGDWKTTMPLAVVS
>Mature_472_residues
SIFSSRRQFLKSLGLAAGAAAAGNALPGKAVEIPAGDHLWKSASPAAPRPSGSTYMGGFKAPRLGRIRLAFIGVGGRGFS
HLAQMCVMDGVEIVGICDLKEELTKRGVDRVLSRMGKSPLGYSGGDMEYLTMLKELKPDAVIISTDWSSHARIACDSMKH
GAHAFVEVPLAVSLEELWSLVDTSEATRKHCMMMENVNYGRDELMFLNMVRQGVIGDLLHGEAAYIHCLVTQLGDTRGEG
AWRPEYHTRINGNLYPTHGLGPVAQYMNLERGEDRFCRVAAFASPALGRNAYAKKHLPADHRWNNTPFICGDMNTAVVKT
QLGRTILVQLDETSPRPYSRANLIQGTEGTLAGFPTRVAGEKLGNGNYHEWIEGREKLAAIYEKYDHPLWKRIGELATKM
GGHGGMDFVMLSRIVECLRNGEPMDQNVYEGASWSSLLPLTARSIAQGGMPVEFPDFTRGDWKTTMPLAVVS

Specific function: Glycosidase

COG id: COG0673

COG function: function code R; Predicted dehydrogenases and related proteins

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Belongs to the gfo/idh/mocA family. Glycosyl hydrolase 109 subfamily

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): G1092_AKKM8 (B2UQL7)

Other databases:

- EMBL:   CP001071
- RefSeq:   YP_001877533.1
- ProteinModelPortal:   B2UQL7
- SMR:   B2UQL7
- GeneID:   6274245
- GenomeReviews:   CP001071_GR
- KEGG:   amu:Amuc_0920
- HOGENOM:   HBG611861
- OMA:   CITELSE
- ProtClustDB:   CLSK901939
- GO:   GO:0005488
- InterPro:   IPR016040
- InterPro:   IPR000683
- InterPro:   IPR006311
- Gene3D:   G3DSA:3.40.50.720
- TIGRFAMs:   TIGR01409

Pfam domain/function: PF01408 GFO_IDH_MocA

EC number: NA

Molecular weight: Translated: 51826; Mature: 51695

Theoretical pI: Translated: 8.04; Mature: 8.04

Prosite motif: PS51318 TAT

Important sites: BINDING 99-99 BINDING 197-197 BINDING 226-226 BINDING 244-244 BINDING 256-256 BINDING 339-339

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.7 %Cys     (Translated Protein)
4.4 %Met     (Translated Protein)
6.1 %Cys+Met (Translated Protein)
1.7 %Cys     (Mature Protein)
4.2 %Met     (Mature Protein)
5.9 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSIFSSRRQFLKSLGLAAGAAAAGNALPGKAVEIPAGDHLWKSASPAAPRPSGSTYMGGF
CCCHHHHHHHHHHHCCHHCCHHCCCCCCCCEEECCCCCCHHCCCCCCCCCCCCCCCCCCC
KAPRLGRIRLAFIGVGGRGFSHLAQMCVMDGVEIVGICDLKEELTKRGVDRVLSRMGKSP
CCCCCCCEEEEEEEECCCCHHHHHHHHHHCCCCEEEEECHHHHHHHHHHHHHHHHHCCCC
LGYSGGDMEYLTMLKELKPDAVIISTDWSSHARIACDSMKHGAHAFVEVPLAVSLEELWS
CCCCCCCHHHHHHHHHCCCCEEEEECCCCCCCEEEEHHHCCCCEEEEECCHHCCHHHHHH
LVDTSEATRKHCMMMENVNYGRDELMFLNMVRQGVIGDLLHGEAAYIHCLVTQLGDTRGE
HHCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHCCCCCC
GAWRPEYHTRINGNLYPTHGLGPVAQYMNLERGEDRFCRVAAFASPALGRNAYAKKHLPA
CCCCCCCCEEECCEECCCCCCCHHHHHHCCCCCCCHHEEHHHHHCCCCCCCCHHHCCCCC
DHRWNNTPFICGDMNTAVVKTQLGRTILVQLDETSPRPYSRANLIQGTEGTLAGFPTRVA
CCCCCCCCEEECCCCHHHHHHHCCCEEEEEEECCCCCCCCHHCCCCCCCCCCCCCCCHHH
GEKLGNGNYHEWIEGREKLAAIYEKYDHPLWKRIGELATKMGGHGGMDFVMLSRIVECLR
HHHCCCCCHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHH
NGEPMDQNVYEGASWSSLLPLTARSIAQGGMPVEFPDFTRGDWKTTMPLAVVS
CCCCCCCHHHCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCEEECC
>Mature Secondary Structure 
SIFSSRRQFLKSLGLAAGAAAAGNALPGKAVEIPAGDHLWKSASPAAPRPSGSTYMGGF
CCHHHHHHHHHHHCCHHCCHHCCCCCCCCEEECCCCCCHHCCCCCCCCCCCCCCCCCCC
KAPRLGRIRLAFIGVGGRGFSHLAQMCVMDGVEIVGICDLKEELTKRGVDRVLSRMGKSP
CCCCCCCEEEEEEEECCCCHHHHHHHHHHCCCCEEEEECHHHHHHHHHHHHHHHHHCCCC
LGYSGGDMEYLTMLKELKPDAVIISTDWSSHARIACDSMKHGAHAFVEVPLAVSLEELWS
CCCCCCCHHHHHHHHHCCCCEEEEECCCCCCCEEEEHHHCCCCEEEEECCHHCCHHHHHH
LVDTSEATRKHCMMMENVNYGRDELMFLNMVRQGVIGDLLHGEAAYIHCLVTQLGDTRGE
HHCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHCCCCCC
GAWRPEYHTRINGNLYPTHGLGPVAQYMNLERGEDRFCRVAAFASPALGRNAYAKKHLPA
CCCCCCCCEEECCEECCCCCCCHHHHHHCCCCCCCHHEEHHHHHCCCCCCCCHHHCCCCC
DHRWNNTPFICGDMNTAVVKTQLGRTILVQLDETSPRPYSRANLIQGTEGTLAGFPTRVA
CCCCCCCCEEECCCCHHHHHHHCCCEEEEEEECCCCCCCCHHCCCCCCCCCCCCCCCHHH
GEKLGNGNYHEWIEGREKLAAIYEKYDHPLWKRIGELATKMGGHGGMDFVMLSRIVECLR
HHHCCCCCHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHH
NGEPMDQNVYEGASWSSLLPLTARSIAQGGMPVEFPDFTRGDWKTTMPLAVVS
CCCCCCCHHHCCCCCCHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCEEECC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA