BacMap

Definition	Shigella flexneri 2a str. 2457T, complete genome.
Accession	NC_004741
Length	4,599,354

Click here to switch to the map view.

The map label for this gene is ppsA

Identifier: 30063031

GI number: 30063031

Start: 1598272

End: 1600650

Strand: Direct

Name: ppsA

Synonym: S1646

Alternate gene names: 30063031

Gene position: 1598272-1600650 (Clockwise)

Preceding gene: 30063027

Following gene: 30063037

Centisome position: 34.75

GC content: 54.9

Gene sequence:

>2379_bases
ATGTCCAACAATGGCTCGTCACCGCTGGTGCTTTGGTATAACCAACTCGGCATGAATGATGTAGACAGGGTTGGGGGCAA
AAATGCCTCCCTGGGTGAAATGATTACTAATCTTTCCGGAATGGGTGTTTCCGTTCCGAATGGTTTCGCCACAACCGCCG
ACGCGTTTAACCAGTTTCTGGACCAAAGCGGCGTAAACCAGCGCATTTATGAACTGCTGGATAAAACGGATATTGACGAT
GTTACTCAGCTTGCGAAAGCGGGCGCGCAAATCCGCCAGTGGATTATCGACACTCCCTTCCAGCCTGAGCTGGAAAACGC
CATACGCGAAGCCTATGCACAGCTTTCCGCCGATGACGAAAACGCCTCTTTTGCGGTACGCTCCTCCGCCACCGCAGAAG
ACATGCCGGACGCTTCCTTTGCCGGTCAGCAGGAAACCTTCCTCAACGTTCAGGGTTTTGACGCCGTTCTCGTGGCAGTG
AAACATGTATTTGCTTCTCTGTTTAACGATCGCGCCATCTCTTATCGTGTGCACCAGGGTTACGATCACCGTGGCGTGGC
GCTCTCCGCCGGTGTTCAGCGGATGGTGCGCTCCGACCTCGCATCTTCTGGCGTGATGTTCTCCATTGATACCGAATCCG
GCTTTGACCAGGTGGTGTTTATCACTTCCGCATGGGGCCTTGGGGAAATGGTCGTGCAGGGTGCGGTTAACCCGGATGAG
TTTTACGTGCATAAACCGACACTGGCGGCGAATCGCCCGGCTATCGTGCGCCGCACCATGGGGTCGAAAAAAATCCGCAT
GGTTTACGCGCCGACCCAGGAGCACGGCAAGCAGGTTAAAATCGAAGACGTACCGCAGGAACAGCGTGACATCTTCTCGC
TGACCAACGAAGAAGTGCAGGAACTGGCAAAACAGGCCGTACAAATTGAGAAACACTACGGTCGCCCAATGGATATTGAG
TGGGCGAAAGATGGCCACACCGGCAAACTGTTCATTGTGCAGGCGCGTCCGGAAACCGTGCGCTCACGCGGTCAGGTCAT
GGAGCGTTATACGCTGCATTCACAGGGTAAGATTATCGCCGAAGGCCGTGCTATCGGTCATCGCATCGGCGCGGGTCCGG
TGAAAGTCATCCATGACATCAGCGAAATGAACCGCATCGAACCTGGCGACGTGCTGGTTACTGACATGACCGACCCGGAC
TGGGAACCGATCATGAAGAAAGCATCTGCCATCGTCACCAACCGTGGCGGTCGTACCTGTCACGCGGCGATCATCGCTCG
TGAACTGGGCATTCCGGCGGTAGTGGGCTGTGGAGATGCAACAGAACGGATGAAAGACGGTGAGAACGTCACTGTTTCTT
GTGCCGAAGGTGATACCGGTTACGTCTATGCGGAGTTGCTGGAATTTAGCGTGAAAAGCTCCAGCGTAGAAACGATGCCG
GATCTGCCGTTGAAAGTGATGATGAACGTCGGTAACCCGGACCGTGCTTTCGACTTCGCCTGCCTGCCGAGCGAAGGCGT
GGGCCTTGCGCGTCTGGAATTTATCATCAACCGTATGATTGGCGTCCACCCACGCGCACTGCTTGAGTTTGACGATCAGG
AACCGCAGTTGCAAAACGAAATCCGCGAGATGATGAAAGGTTTTGATTCTCCGCGTGAATTTTACGTTGGTCGTCTGACT
GAAGGGATCGCGACGCTGGGTGCCGCGTTTTATCCGAAGCGCGTCATTGTCCGTCTCTCTGATTTTAAATCGAACGAATA
TGCCAACCTGGTCGGTGGTGAGCGTTACGAGCCAGATGAAGAGAACCCGATGCTCGGCTTCCGTGGTGCGGGCCGCTATG
TTTCCGACAGCTTCCGCGACTGCTTCGCACTGGAGTGTGAAGCAGTGAAACGTGTGCGCAACGACATGGGGCTGACCAAC
GTTGAGATCATGATCCCGTTCGTGCGTACCGTAGATCAGGCGAAAGCGGTGGTTGAAGAACTGGCGCGTCAGGGGCTGAA
ACGTGGCGAGAACGGGCTGAAAATCATCATGATGTGTGAAATCCCGTCCAACGCCTTGCTGGCCGAGCAGTTCCTCGAAT
ATTTCGACGGCTTCTCAATTGGCTCAAACGATATGACGCAGCTGGCGCTCGGTCTGGACCGTGACTCCGGCGTGGTGTCT
GAATTGTTCGATGAGCGCAACGATGCGGTGAAAGCACTGCTGTCGATGGCTATCCGTGCCGCGAAGAAACAGGGCAAATA
TGTCGGGATTTGCGGTCAGGGTCCGTCCGACCACGAAGACTTTGCCGCATGGTTGATGGAAGAGGGGATCGATAGCCTGT
CTCTGAACCCGGACACCGTGGTGCAAACCTGGTTAAGCCTGGCTGAACTGAAGAAATAA

Upstream 100 bases:

>100_bases
TTGAACGATTCACCGTTTTTTTCATCCGGTTAAATATGCAAAGATAAATGCGCAGAAATGTGTTTCTCAAACCGTTCATT
TATCACAAAAGGATTGTTCG

Downstream 100 bases:

>100_bases
AATAAATCCCCGGCGGCGTTCAGTCGCCGGGGTTATGTGATCCCCGAAGATGAAACTTATTCAATCTCTTCACAGACATC
CTGCGTTAATCGCCGTATAA

Product: phosphoenolpyruvate synthase

Products: NA

Alternate protein names: PEP synthase; Pyruvate, water dikinase [H]

Number of amino acids: Translated: 792; Mature: 791

Protein sequence:

>792_residues
MSNNGSSPLVLWYNQLGMNDVDRVGGKNASLGEMITNLSGMGVSVPNGFATTADAFNQFLDQSGVNQRIYELLDKTDIDD
VTQLAKAGAQIRQWIIDTPFQPELENAIREAYAQLSADDENASFAVRSSATAEDMPDASFAGQQETFLNVQGFDAVLVAV
KHVFASLFNDRAISYRVHQGYDHRGVALSAGVQRMVRSDLASSGVMFSIDTESGFDQVVFITSAWGLGEMVVQGAVNPDE
FYVHKPTLAANRPAIVRRTMGSKKIRMVYAPTQEHGKQVKIEDVPQEQRDIFSLTNEEVQELAKQAVQIEKHYGRPMDIE
WAKDGHTGKLFIVQARPETVRSRGQVMERYTLHSQGKIIAEGRAIGHRIGAGPVKVIHDISEMNRIEPGDVLVTDMTDPD
WEPIMKKASAIVTNRGGRTCHAAIIARELGIPAVVGCGDATERMKDGENVTVSCAEGDTGYVYAELLEFSVKSSSVETMP
DLPLKVMMNVGNPDRAFDFACLPSEGVGLARLEFIINRMIGVHPRALLEFDDQEPQLQNEIREMMKGFDSPREFYVGRLT
EGIATLGAAFYPKRVIVRLSDFKSNEYANLVGGERYEPDEENPMLGFRGAGRYVSDSFRDCFALECEAVKRVRNDMGLTN
VEIMIPFVRTVDQAKAVVEELARQGLKRGENGLKIIMMCEIPSNALLAEQFLEYFDGFSIGSNDMTQLALGLDRDSGVVS
ELFDERNDAVKALLSMAIRAAKKQGKYVGICGQGPSDHEDFAAWLMEEGIDSLSLNPDTVVQTWLSLAELKK

Sequences:

>Translated_792_residues
MSNNGSSPLVLWYNQLGMNDVDRVGGKNASLGEMITNLSGMGVSVPNGFATTADAFNQFLDQSGVNQRIYELLDKTDIDD
VTQLAKAGAQIRQWIIDTPFQPELENAIREAYAQLSADDENASFAVRSSATAEDMPDASFAGQQETFLNVQGFDAVLVAV
KHVFASLFNDRAISYRVHQGYDHRGVALSAGVQRMVRSDLASSGVMFSIDTESGFDQVVFITSAWGLGEMVVQGAVNPDE
FYVHKPTLAANRPAIVRRTMGSKKIRMVYAPTQEHGKQVKIEDVPQEQRDIFSLTNEEVQELAKQAVQIEKHYGRPMDIE
WAKDGHTGKLFIVQARPETVRSRGQVMERYTLHSQGKIIAEGRAIGHRIGAGPVKVIHDISEMNRIEPGDVLVTDMTDPD
WEPIMKKASAIVTNRGGRTCHAAIIARELGIPAVVGCGDATERMKDGENVTVSCAEGDTGYVYAELLEFSVKSSSVETMP
DLPLKVMMNVGNPDRAFDFACLPSEGVGLARLEFIINRMIGVHPRALLEFDDQEPQLQNEIREMMKGFDSPREFYVGRLT
EGIATLGAAFYPKRVIVRLSDFKSNEYANLVGGERYEPDEENPMLGFRGAGRYVSDSFRDCFALECEAVKRVRNDMGLTN
VEIMIPFVRTVDQAKAVVEELARQGLKRGENGLKIIMMCEIPSNALLAEQFLEYFDGFSIGSNDMTQLALGLDRDSGVVS
ELFDERNDAVKALLSMAIRAAKKQGKYVGICGQGPSDHEDFAAWLMEEGIDSLSLNPDTVVQTWLSLAELKK
>Mature_791_residues
SNNGSSPLVLWYNQLGMNDVDRVGGKNASLGEMITNLSGMGVSVPNGFATTADAFNQFLDQSGVNQRIYELLDKTDIDDV
TQLAKAGAQIRQWIIDTPFQPELENAIREAYAQLSADDENASFAVRSSATAEDMPDASFAGQQETFLNVQGFDAVLVAVK
HVFASLFNDRAISYRVHQGYDHRGVALSAGVQRMVRSDLASSGVMFSIDTESGFDQVVFITSAWGLGEMVVQGAVNPDEF
YVHKPTLAANRPAIVRRTMGSKKIRMVYAPTQEHGKQVKIEDVPQEQRDIFSLTNEEVQELAKQAVQIEKHYGRPMDIEW
AKDGHTGKLFIVQARPETVRSRGQVMERYTLHSQGKIIAEGRAIGHRIGAGPVKVIHDISEMNRIEPGDVLVTDMTDPDW
EPIMKKASAIVTNRGGRTCHAAIIARELGIPAVVGCGDATERMKDGENVTVSCAEGDTGYVYAELLEFSVKSSSVETMPD
LPLKVMMNVGNPDRAFDFACLPSEGVGLARLEFIINRMIGVHPRALLEFDDQEPQLQNEIREMMKGFDSPREFYVGRLTE
GIATLGAAFYPKRVIVRLSDFKSNEYANLVGGERYEPDEENPMLGFRGAGRYVSDSFRDCFALECEAVKRVRNDMGLTNV
EIMIPFVRTVDQAKAVVEELARQGLKRGENGLKIIMMCEIPSNALLAEQFLEYFDGFSIGSNDMTQLALGLDRDSGVVSE
LFDERNDAVKALLSMAIRAAKKQGKYVGICGQGPSDHEDFAAWLMEEGIDSLSLNPDTVVQTWLSLAELKK

Specific function: Catalyzes the phosphorylation of pyruvate to phosphoenolpyruvate [H]

COG id: COG0574

COG function: function code G; Phosphoenolpyruvate synthase/pyruvate phosphate dikinase

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the PEP-utilizing enzyme family [H]

Homologues:

Organism=Escherichia coli, GI1787994, Length=792, Percent_Identity=99.8737373737374, Blast_Score=1638, Evalue=0.0,
Organism=Escherichia coli, GI1788756, Length=449, Percent_Identity=26.9487750556793, Blast_Score=112, Evalue=9e-26,
Organism=Escherichia coli, GI1788726, Length=399, Percent_Identity=25.31328320802, Blast_Score=100, Evalue=3e-22,
Organism=Escherichia coli, GI48994992, Length=190, Percent_Identity=31.5789473684211, Blast_Score=94, Evalue=5e-20,
Organism=Escherichia coli, GI1789193, Length=405, Percent_Identity=25.9259259259259, Blast_Score=78, Evalue=2e-15,
Organism=Caenorhabditis elegans, GI17564524, Length=331, Percent_Identity=25.9818731117825, Blast_Score=80, Evalue=4e-15,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR013815
- InterPro:   IPR013816
- InterPro:   IPR008279
- InterPro:   IPR006319
- InterPro:   IPR018274
- InterPro:   IPR023151
- InterPro:   IPR000121
- InterPro:   IPR002192
- InterPro:   IPR015813 [H]

Pfam domain/function: PF00391 PEP-utilizers; PF02896 PEP-utilizers_C; PF01326 PPDK_N [H]

EC number: =2.7.9.2 [H]

Molecular weight: Translated: 87409; Mature: 87278

Theoretical pI: Translated: 4.68; Mature: 4.68

Prosite motif: PS00370 PEP_ENZYMES_PHOS_SITE ; PS00742 PEP_ENZYMES_2

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.0 %Cys     (Translated Protein)
3.8 %Met     (Translated Protein)
4.8 %Cys+Met (Translated Protein)
1.0 %Cys     (Mature Protein)
3.7 %Met     (Mature Protein)
4.7 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSNNGSSPLVLWYNQLGMNDVDRVGGKNASLGEMITNLSGMGVSVPNGFATTADAFNQFL
CCCCCCCCEEEEECCCCCCHHHHCCCCCCHHHHHHHCCCCCCEECCCCCCHHHHHHHHHH
DQSGVNQRIYELLDKTDIDDVTQLAKAGAQIRQWIIDTPFQPELENAIREAYAQLSADDE
HHCCCHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHCCCCCC
NASFAVRSSATAEDMPDASFAGQQETFLNVQGFDAVLVAVKHVFASLFNDRAISYRVHQG
CCEEEEECCCCCCCCCCCCCCCCCCCEEECCCHHHHHHHHHHHHHHHHCCCCEEEEEECC
YDHRGVALSAGVQRMVRSDLASSGVMFSIDTESGFDQVVFITSAWGLGEMVVQGAVNPDE
CCCCCEEHHHHHHHHHHHHHHCCCEEEEEECCCCCCEEEEEEECCCHHHHHHHCCCCCCC
FYVHKPTLAANRPAIVRRTMGSKKIRMVYAPTQEHGKQVKIEDVPQEQRDIFSLTNEEVQ
EEEECCCCCCCCCHHHHHHCCCCEEEEEECCCHHCCCEEEECCCCHHHHHHHHHCHHHHH
ELAKQAVQIEKHYGRPMDIEWAKDGHTGKLFIVQARPETVRSRGQVMERYTLHSQGKIIA
HHHHHHHHHHHHCCCCCCEEECCCCCCCEEEEEECCCHHHHHHHHHHHHHHHCCCCCEEE
EGRAIGHRIGAGPVKVIHDISEMNRIEPGDVLVTDMTDPDWEPIMKKASAIVTNRGGRTC
CCHHHHHHCCCCHHHHHHHHHHHCCCCCCCEEEECCCCCCHHHHHHHHHHHHCCCCCCHH
HAAIIARELGIPAVVGCGDATERMKDGENVTVSCAEGDTGYVYAELLEFSVKSSSVETMP
HHHHHHHHCCCCEEEECCCHHHHHCCCCCEEEEECCCCCCHHHHHHHHHHHCCCCCCCCC
DLPLKVMMNVGNPDRAFDFACLPSEGVGLARLEFIINRMIGVHPRALLEFDDQEPQLQNE
CCCCEEEEECCCCCCCEEEEECCCCCCCHHHHHHHHHHHHCCCCHHEEECCCCCCHHHHH
IREMMKGFDSPREFYVGRLTEGIATLGAAFYPKRVIVRLSDFKSNEYANLVGGERYEPDE
HHHHHHCCCCHHHHHHHHHHHHHHHHHHHHCCCEEEEEEECCCCCCCHHCCCCCCCCCCC
ENPMLGFRGAGRYVSDSFRDCFALECEAVKRVRNDMGLTNVEIMIPFVRTVDQAKAVVEE
CCCCEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEEEEHHHHHHHHHHHHHHH
LARQGLKRGENGLKIIMMCEIPSNALLAEQFLEYFDGFSIGSNDMTQLALGLDRDSGVVS
HHHHHHHCCCCCCEEEEEEECCCCHHHHHHHHHHHCCCCCCCCCHHHHHHCCCCCCCHHH
ELFDERNDAVKALLSMAIRAAKKQGKYVGICGQGPSDHEDFAAWLMEEGIDSLSLNPDTV
HHHHCHHHHHHHHHHHHHHHHHHCCCEEEEECCCCCCHHHHHHHHHHHCCCCCCCCHHHH
VQTWLSLAELKK
HHHHHHHHHHCC
>Mature Secondary Structure 
SNNGSSPLVLWYNQLGMNDVDRVGGKNASLGEMITNLSGMGVSVPNGFATTADAFNQFL
CCCCCCCEEEEECCCCCCHHHHCCCCCCHHHHHHHCCCCCCEECCCCCCHHHHHHHHHH
DQSGVNQRIYELLDKTDIDDVTQLAKAGAQIRQWIIDTPFQPELENAIREAYAQLSADDE
HHCCCHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHCCCCCC
NASFAVRSSATAEDMPDASFAGQQETFLNVQGFDAVLVAVKHVFASLFNDRAISYRVHQG
CCEEEEECCCCCCCCCCCCCCCCCCCEEECCCHHHHHHHHHHHHHHHHCCCCEEEEEECC
YDHRGVALSAGVQRMVRSDLASSGVMFSIDTESGFDQVVFITSAWGLGEMVVQGAVNPDE
CCCCCEEHHHHHHHHHHHHHHCCCEEEEEECCCCCCEEEEEEECCCHHHHHHHCCCCCCC
FYVHKPTLAANRPAIVRRTMGSKKIRMVYAPTQEHGKQVKIEDVPQEQRDIFSLTNEEVQ
EEEECCCCCCCCCHHHHHHCCCCEEEEEECCCHHCCCEEEECCCCHHHHHHHHHCHHHHH
ELAKQAVQIEKHYGRPMDIEWAKDGHTGKLFIVQARPETVRSRGQVMERYTLHSQGKIIA
HHHHHHHHHHHHCCCCCCEEECCCCCCCEEEEEECCCHHHHHHHHHHHHHHHCCCCCEEE
EGRAIGHRIGAGPVKVIHDISEMNRIEPGDVLVTDMTDPDWEPIMKKASAIVTNRGGRTC
CCHHHHHHCCCCHHHHHHHHHHHCCCCCCCEEEECCCCCCHHHHHHHHHHHHCCCCCCHH
HAAIIARELGIPAVVGCGDATERMKDGENVTVSCAEGDTGYVYAELLEFSVKSSSVETMP
HHHHHHHHCCCCEEEECCCHHHHHCCCCCEEEEECCCCCCHHHHHHHHHHHCCCCCCCCC
DLPLKVMMNVGNPDRAFDFACLPSEGVGLARLEFIINRMIGVHPRALLEFDDQEPQLQNE
CCCCEEEEECCCCCCCEEEEECCCCCCCHHHHHHHHHHHHCCCCHHEEECCCCCCHHHHH
IREMMKGFDSPREFYVGRLTEGIATLGAAFYPKRVIVRLSDFKSNEYANLVGGERYEPDE
HHHHHHCCCCHHHHHHHHHHHHHHHHHHHHCCCEEEEEEECCCCCCCHHCCCCCCCCCCC
ENPMLGFRGAGRYVSDSFRDCFALECEAVKRVRNDMGLTNVEIMIPFVRTVDQAKAVVEE
CCCCEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEEEEHHHHHHHHHHHHHHH
LARQGLKRGENGLKIIMMCEIPSNALLAEQFLEYFDGFSIGSNDMTQLALGLDRDSGVVS
HHHHHHHCCCCCCEEEEEEECCCCHHHHHHHHHHHCCCCCCCCCHHHHHHCCCCCCCHHH
ELFDERNDAVKALLSMAIRAAKKQGKYVGICGQGPSDHEDFAAWLMEEGIDSLSLNPDTV
HHHHCHHHHHHHHHHHHHHHHHHCCCEEEEECCCCCCHHHHHHHHHHHCCCCCCCCHHHH
VQTWLSLAELKK
HHHHHHHHHHCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 1310524; 9097039; 9278503 [H]