BacMap

Definition	Escherichia coli HS, complete genome.
Accession	NC_009800
Length	4,643,538

Click here to switch to the map view.

The map label for this gene is malT [H]

Identifier: 157162896

GI number: 157162896

Start: 3597360

End: 3600065

Strand: Direct

Name: malT [H]

Synonym: EcHS_A3616

Alternate gene names: 157162896

Gene position: 3597360-3600065 (Clockwise)

Preceding gene: 157162893

Following gene: 157162899

Centisome position: 77.47

GC content: 54.07

Gene sequence:

>2706_bases
ATGCTGATTCCGTCAAAACTCAGTCGTCCGGTTCGACTCGACCATACCGTGGTTCGTGAGCGCCTGCTGGCTAAACTTTC
CGGCGCGAACAACTTCCGGCTGGCGCTGATCACGAGTCCTGCGGGCTACGGAAAGACCACCCTCATTTCCCAGTGGGCGG
CAGGCAAAAACGATATCGGCTGGTACTCGCTGGATGAAGGTGATAACCAGCAAGAGCGTTTCGCCAGCTATCTCATTGCC
GCCGTGCAGCAGGCAACCAACGGTCACTGTGCGATATGTGAGACGATGGCGCAAAAACGGCAATATGCCAGCCTGACGTC
ACTCTTCGCCCAGCTTTTCATTGAGCTGGCGGAATGGCATAGCCCACTTTATCTGGTCATCGATGACTATCATCTGATCA
CTAATCCAGTGATCCACGAGTCAATGCGCTTCTTTATTCGCCATCAACCAGAAAATCTCACCCTGGTGGTGTTGTCACGC
AACCTTCCGCAACTGGGCATTGCCAATCTGCGTGTTCGTGATCAACTGCTGGAAATTGGCAGTCAGCAACTGGCATTTAC
CCATCAGGAAGCGAAGCAGTTTTTTGATTGCCGTCTGTCATCGCCGATTGAAGCCGCAGAAAGCAGTCGGATTTGCGATG
ACGTTTCCGGTTGGGCGACGGCACTACAGCTAATCGCCCTCTCCGCCCGGCAGAATACCCACTCAGCCCATAAGTCGGCA
CGCCGCCTGGCGGGAATCAATGCCAGCCATCTTTCGGATTATCTGGTCGATGAGGTTTTGGATAACGTCGATCTCGCAAC
GCGCCATTTTCTGTTGAAAAGCGCCATTTTGCGCTCAATGAACGATGCACTCATCACCCGTGTGACCGGCGAAGAAAACG
GGCAAATGCGCCTCGAAGAGATTGAGCGTCAGGGGCTGTTTTTACAGCGGATGGATGATACCGGCGAGTGGTTCTGCTAT
CACCCGCTGTTTGGTAACTTCCTGCGCCAGCGCTGCCAGTGGGAACTGGCGGCGGAGCTGCCGGAAATCCACCGTGCCGC
CGCAGAAAGCTGGATGGCCCAGGGATTTCCCAGCGAAGCGATTCATCATGCGCTGGCGGCAGGCGATGCGCTGATGCTGC
GCGATATTCTGCTTAATCACGCCTGGAGTCTGTTCAACCATAGCGAACTGTCGCTGCTGGAAGAGTCGCTTAAGGCCCTG
CCGTGGGACAGCTTGCTGGAAAATCCGCAGTTGGTGTTATTGCAGGCGTGGCTGATGCAAAGCCAACATCGCTACGGCGA
AGTTAACACCCTGCTAGCCCGTGCTGAACATGAAATCAAGGACATCAGAGAAGACACCATGCACGCAGAATTTAACGCTC
TGCGCGCCCAGGTGGCGATTAACGATGGTAATCCGGATGAAGCGGAACGGCTGGCAAAACTGGCACTGGAAGAGCTGCCG
CCGGGCTGGTTCTATAGCCGCATTGTGGCAACCTCGGTGCTGGGTGAAGTGCTGCACTGCAAAGGCGAATTGACCCGCTC
ACTGGCGCTAATGCAGCAAACCGAACAGATGGCACGCCAGCACGATGTCTGGCACTACGCTTTGTGGAGTTTAATCCAGC
AAAGTGAAATTCTGTTTGCCCAAGGGTTCCTGCAAACCGCGTGGGAAACGCAGGAAAAAGCATTCCAGCTGATCAACGAG
CAGCATCTGGAACAGCTGCCAATGCATGAGTTTCTGGTGCGCATCCGAGCACAACTGTTATGGGCCTGGGCGCGGCTGGA
TGAAGCCGAAGCGTCGGCGCGTAGCGGGATTGAAGTCTTGTCGTCTTATCAGCCACAGCAACAGCTTCAGTGCCTGGCAA
TGTTGATTCAATGCTCGCTGGCCCGTGGTGATTTAGATAACGCCCGTAGCCAGCTGAACCGTCTGGAAAATCTGCTGGGG
AATGGCAAATATCACAGCGACTGGATCTCTAACGCCAACAAAGTCCGGGTGATTTACTGGCAAATGACCGGTGATAAAGC
CGCCGCTGCCAACTGGTTGCGTCATACGGCTAAACCGGAGTTTGCGAACAACCACTTCCTGCAAGGTCAATGGCGCAACA
TTGCCCGTGCACAAATCTTGCTGGGCGAGTTTGAACCTGCGGAAATTGTTCTCGAAGAACTCAATGAAAATGCCCGGAGT
CTGCGGTTGATGAGCGATCTCAACCGTAACCTGTTGCTGCTTAATCAACTGTACTGGCAGGCCGGACGTAAAAGTGACGC
CCAGCGCGTGTTGCTGGACGCATTAAAACTGGCGAATCGCACCGGATTTATCAGCCATTTTGTCATCGAAGGCGAAGCGA
TGGCGCAACAACTGCGTCAGCTGATTCAGCTTAATACGCTGCCGGAACTGGAACAGCATCGCGCGCAGCGTATTCTGCGA
GAAATCAATCAACATCATCGGCATAAATTCGCCCATTTCGATGAGAATTTCGTTGAACGTCTGCTAAATCATCCTGAAGT
ACCTGAACTGATCCGCACCAGCCCGCTGACGCAACGTGAATGGCAGGTACTGGGGCTGATCTACTCTGGTTACAGCAATG
AGCAAATTGCCGGAGAACTGGAAGTCGCGGCAACCACCATCAAAACGCATATCCGCAATCTGTATCAGAAACTCGGCGTG
GCCCATCGCCAGGATGCGGTACAACACGCCCAGCAATTGCTGAAGATGATGGGGTACGGCGTGTAA

Upstream 100 bases:

>100_bases
TCGCTTGCATTAGAAAGGTTTCTGGCCGACCTTATAACCATTAATTACGAAGCGCAAAAAAAATAATATTTCCTCATTTT
CCACAGTGAAGTGATTAACT

Downstream 100 bases:

>100_bases
GTTTAGCCGGATAACGCGCCAGATCCGGCTTACATCTCTGCATCATTCAATGCTCACCCGCGTTACGCCATCTGTTTCTA
TCAAACTAAACCGCACCGGC

Product: transcriptional regulator MalT

Products: NA

Alternate protein names: ATP-dependent transcriptional activator malT [H]

Number of amino acids: Translated: 901; Mature: 901

Protein sequence:

>901_residues
MLIPSKLSRPVRLDHTVVRERLLAKLSGANNFRLALITSPAGYGKTTLISQWAAGKNDIGWYSLDEGDNQQERFASYLIA
AVQQATNGHCAICETMAQKRQYASLTSLFAQLFIELAEWHSPLYLVIDDYHLITNPVIHESMRFFIRHQPENLTLVVLSR
NLPQLGIANLRVRDQLLEIGSQQLAFTHQEAKQFFDCRLSSPIEAAESSRICDDVSGWATALQLIALSARQNTHSAHKSA
RRLAGINASHLSDYLVDEVLDNVDLATRHFLLKSAILRSMNDALITRVTGEENGQMRLEEIERQGLFLQRMDDTGEWFCY
HPLFGNFLRQRCQWELAAELPEIHRAAAESWMAQGFPSEAIHHALAAGDALMLRDILLNHAWSLFNHSELSLLEESLKAL
PWDSLLENPQLVLLQAWLMQSQHRYGEVNTLLARAEHEIKDIREDTMHAEFNALRAQVAINDGNPDEAERLAKLALEELP
PGWFYSRIVATSVLGEVLHCKGELTRSLALMQQTEQMARQHDVWHYALWSLIQQSEILFAQGFLQTAWETQEKAFQLINE
QHLEQLPMHEFLVRIRAQLLWAWARLDEAEASARSGIEVLSSYQPQQQLQCLAMLIQCSLARGDLDNARSQLNRLENLLG
NGKYHSDWISNANKVRVIYWQMTGDKAAAANWLRHTAKPEFANNHFLQGQWRNIARAQILLGEFEPAEIVLEELNENARS
LRLMSDLNRNLLLLNQLYWQAGRKSDAQRVLLDALKLANRTGFISHFVIEGEAMAQQLRQLIQLNTLPELEQHRAQRILR
EINQHHRHKFAHFDENFVERLLNHPEVPELIRTSPLTQREWQVLGLIYSGYSNEQIAGELEVAATTIKTHIRNLYQKLGV
AHRQDAVQHAQQLLKMMGYGV

Sequences:

>Translated_901_residues
MLIPSKLSRPVRLDHTVVRERLLAKLSGANNFRLALITSPAGYGKTTLISQWAAGKNDIGWYSLDEGDNQQERFASYLIA
AVQQATNGHCAICETMAQKRQYASLTSLFAQLFIELAEWHSPLYLVIDDYHLITNPVIHESMRFFIRHQPENLTLVVLSR
NLPQLGIANLRVRDQLLEIGSQQLAFTHQEAKQFFDCRLSSPIEAAESSRICDDVSGWATALQLIALSARQNTHSAHKSA
RRLAGINASHLSDYLVDEVLDNVDLATRHFLLKSAILRSMNDALITRVTGEENGQMRLEEIERQGLFLQRMDDTGEWFCY
HPLFGNFLRQRCQWELAAELPEIHRAAAESWMAQGFPSEAIHHALAAGDALMLRDILLNHAWSLFNHSELSLLEESLKAL
PWDSLLENPQLVLLQAWLMQSQHRYGEVNTLLARAEHEIKDIREDTMHAEFNALRAQVAINDGNPDEAERLAKLALEELP
PGWFYSRIVATSVLGEVLHCKGELTRSLALMQQTEQMARQHDVWHYALWSLIQQSEILFAQGFLQTAWETQEKAFQLINE
QHLEQLPMHEFLVRIRAQLLWAWARLDEAEASARSGIEVLSSYQPQQQLQCLAMLIQCSLARGDLDNARSQLNRLENLLG
NGKYHSDWISNANKVRVIYWQMTGDKAAAANWLRHTAKPEFANNHFLQGQWRNIARAQILLGEFEPAEIVLEELNENARS
LRLMSDLNRNLLLLNQLYWQAGRKSDAQRVLLDALKLANRTGFISHFVIEGEAMAQQLRQLIQLNTLPELEQHRAQRILR
EINQHHRHKFAHFDENFVERLLNHPEVPELIRTSPLTQREWQVLGLIYSGYSNEQIAGELEVAATTIKTHIRNLYQKLGV
AHRQDAVQHAQQLLKMMGYGV
>Mature_901_residues
MLIPSKLSRPVRLDHTVVRERLLAKLSGANNFRLALITSPAGYGKTTLISQWAAGKNDIGWYSLDEGDNQQERFASYLIA
AVQQATNGHCAICETMAQKRQYASLTSLFAQLFIELAEWHSPLYLVIDDYHLITNPVIHESMRFFIRHQPENLTLVVLSR
NLPQLGIANLRVRDQLLEIGSQQLAFTHQEAKQFFDCRLSSPIEAAESSRICDDVSGWATALQLIALSARQNTHSAHKSA
RRLAGINASHLSDYLVDEVLDNVDLATRHFLLKSAILRSMNDALITRVTGEENGQMRLEEIERQGLFLQRMDDTGEWFCY
HPLFGNFLRQRCQWELAAELPEIHRAAAESWMAQGFPSEAIHHALAAGDALMLRDILLNHAWSLFNHSELSLLEESLKAL
PWDSLLENPQLVLLQAWLMQSQHRYGEVNTLLARAEHEIKDIREDTMHAEFNALRAQVAINDGNPDEAERLAKLALEELP
PGWFYSRIVATSVLGEVLHCKGELTRSLALMQQTEQMARQHDVWHYALWSLIQQSEILFAQGFLQTAWETQEKAFQLINE
QHLEQLPMHEFLVRIRAQLLWAWARLDEAEASARSGIEVLSSYQPQQQLQCLAMLIQCSLARGDLDNARSQLNRLENLLG
NGKYHSDWISNANKVRVIYWQMTGDKAAAANWLRHTAKPEFANNHFLQGQWRNIARAQILLGEFEPAEIVLEELNENARS
LRLMSDLNRNLLLLNQLYWQAGRKSDAQRVLLDALKLANRTGFISHFVIEGEAMAQQLRQLIQLNTLPELEQHRAQRILR
EINQHHRHKFAHFDENFVERLLNHPEVPELIRTSPLTQREWQVLGLIYSGYSNEQIAGELEVAATTIKTHIRNLYQKLGV
AHRQDAVQHAQQLLKMMGYGV

Specific function: Positively regulates the transcription of the maltose regulon whose gene products are responsible for uptake and catabolism of malto-oligosaccharides. Binds and recognizes a DNA motif (called the malT box):5'-GGA[TG]GA-3' [H]

COG id: COG2909

COG function: function code K; ATP-dependent transcriptional regulator

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 HTH luxR-type DNA-binding domain [H]

Homologues:

Organism=Escherichia coli, GI2367223, Length=901, Percent_Identity=100, Blast_Score=1842, Evalue=0.0,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR016032
- InterPro:   IPR011990
- InterPro:   IPR000792
- InterPro:   IPR011991 [H]

Pfam domain/function: PF00196 GerE [H]

EC number: NA

Molecular weight: Translated: 103120; Mature: 103120

Theoretical pI: Translated: 6.47; Mature: 6.47

Prosite motif: PS00622 HTH_LUXR_1 ; PS50043 HTH_LUXR_2

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.0 %Cys     (Translated Protein)
2.1 %Met     (Translated Protein)
3.1 %Cys+Met (Translated Protein)
1.0 %Cys     (Mature Protein)
2.1 %Met     (Mature Protein)
3.1 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MLIPSKLSRPVRLDHTVVRERLLAKLSGANNFRLALITSPAGYGKTTLISQWAAGKNDIG
CCCCCCCCCCCCHHHHHHHHHHHHHHCCCCCEEEEEEECCCCCCCHHHHHHHCCCCCCCC
WYSLDEGDNQQERFASYLIAAVQQATNGHCAICETMAQKRQYASLTSLFAQLFIELAEWH
CEECCCCCCHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHC
SPLYLVIDDYHLITNPVIHESMRFFIRHQPENLTLVVLSRNLPQLGIANLRVRDQLLEIG
CCEEEEEECCHHHCCHHHHHHHHHHHHCCCCCEEEEEEECCCCCCCCHHHHHHHHHHHCC
SQQLAFTHQEAKQFFDCRLSSPIEAAESSRICDDVSGWATALQLIALSARQNTHSAHKSA
CHHHHHHHHHHHHHHHHHCCCCHHHHHHCCCHHHHHHHHHHHHHHHHHHHCCHHHHHHHH
RRLAGINASHLSDYLVDEVLDNVDLATRHFLLKSAILRSMNDALITRVTGEENGQMRLEE
HHHHCCCHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHEEEECCCCCCCCHHHH
IERQGLFLQRMDDTGEWFCYHPLFGNFLRQRCQWELAAELPEIHRAAAESWMAQGFPSEA
HHHCCCEEEECCCCCCEEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHH
IHHALAAGDALMLRDILLNHAWSLFNHSELSLLEESLKALPWDSLLENPQLVLLQAWLMQ
HHHHHHHCHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHCCCHHHHCCCHHHHHHHHHHH
SQHRYGEVNTLLARAEHEIKDIREDTMHAEFNALRAQVAINDGNPDEAERLAKLALEELP
HHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHEEEEEECCCCHHHHHHHHHHHHHHCC
PGWFYSRIVATSVLGEVLHCKGELTRSLALMQQTEQMARQHDVWHYALWSLIQQSEILFA
CCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
QGFLQTAWETQEKAFQLINEQHLEQLPMHEFLVRIRAQLLWAWARLDEAEASARSGIEVL
HHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
SSYQPQQQLQCLAMLIQCSLARGDLDNARSQLNRLENLLGNGKYHSDWISNANKVRVIYW
HCCCHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCHHHHCCCCEEEEEEE
QMTGDKAAAANWLRHTAKPEFANNHFLQGQWRNIARAQILLGEFEPAEIVLEELNENARS
EECCCHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHCCCCHHHHHHHHHCCHHHH
LRLMSDLNRNLLLLNQLYWQAGRKSDAQRVLLDALKLANRTGFISHFVIEGEAMAQQLRQ
HHHHHHCCCCHHHHHHHHHHCCCCCHHHHHHHHHHHHHHCCCCHHHHEECCHHHHHHHHH
LIQLNTLPELEQHRAQRILREINQHHRHKFAHFDENFVERLLNHPEVPELIRTSPLTQRE
HHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHCCCCCCHHHHCCCCCHHH
WQVLGLIYSGYSNEQIAGELEVAATTIKTHIRNLYQKLGVAHRQDAVQHAQQLLKMMGYG
HHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHCCC
V
C
>Mature Secondary Structure
MLIPSKLSRPVRLDHTVVRERLLAKLSGANNFRLALITSPAGYGKTTLISQWAAGKNDIG
CCCCCCCCCCCCHHHHHHHHHHHHHHCCCCCEEEEEEECCCCCCCHHHHHHHCCCCCCCC
WYSLDEGDNQQERFASYLIAAVQQATNGHCAICETMAQKRQYASLTSLFAQLFIELAEWH
CEECCCCCCHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHC
SPLYLVIDDYHLITNPVIHESMRFFIRHQPENLTLVVLSRNLPQLGIANLRVRDQLLEIG
CCEEEEEECCHHHCCHHHHHHHHHHHHCCCCCEEEEEEECCCCCCCCHHHHHHHHHHHCC
SQQLAFTHQEAKQFFDCRLSSPIEAAESSRICDDVSGWATALQLIALSARQNTHSAHKSA
CHHHHHHHHHHHHHHHHHCCCCHHHHHHCCCHHHHHHHHHHHHHHHHHHHCCHHHHHHHH
RRLAGINASHLSDYLVDEVLDNVDLATRHFLLKSAILRSMNDALITRVTGEENGQMRLEE
HHHHCCCHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHEEEECCCCCCCCHHHH
IERQGLFLQRMDDTGEWFCYHPLFGNFLRQRCQWELAAELPEIHRAAAESWMAQGFPSEA
HHHCCCEEEECCCCCCEEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHH
IHHALAAGDALMLRDILLNHAWSLFNHSELSLLEESLKALPWDSLLENPQLVLLQAWLMQ
HHHHHHHCHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHCCCHHHHCCCHHHHHHHHHHH
SQHRYGEVNTLLARAEHEIKDIREDTMHAEFNALRAQVAINDGNPDEAERLAKLALEELP
HHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHEEEEEECCCCHHHHHHHHHHHHHHCC
PGWFYSRIVATSVLGEVLHCKGELTRSLALMQQTEQMARQHDVWHYALWSLIQQSEILFA
CCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
QGFLQTAWETQEKAFQLINEQHLEQLPMHEFLVRIRAQLLWAWARLDEAEASARSGIEVL
HHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
SSYQPQQQLQCLAMLIQCSLARGDLDNARSQLNRLENLLGNGKYHSDWISNANKVRVIYW
HCCCHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHCCCCCCHHHHCCCCEEEEEEE
QMTGDKAAAANWLRHTAKPEFANNHFLQGQWRNIARAQILLGEFEPAEIVLEELNENARS
EECCCHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHCCCCHHHHHHHHHCCHHHH
LRLMSDLNRNLLLLNQLYWQAGRKSDAQRVLLDALKLANRTGFISHFVIEGEAMAQQLRQ
HHHHHHCCCCHHHHHHHHHHCCCCCHHHHHHHHHHHHHHCCCCHHHHEECCHHHHHHHHH
LIQLNTLPELEQHRAQRILREINQHHRHKFAHFDENFVERLLNHPEVPELIRTSPLTQRE
HHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHCCCCCCHHHHCCCCCHHH
WQVLGLIYSGYSNEQIAGELEVAATTIKTHIRNLYQKLGVAHRQDAVQHAQQLLKMMGYG
HHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHCCC
V
C

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA