BacMap

Definition	Moorella thermoacetica ATCC 39073, complete genome.
Accession	NC_007644
Length	2,628,784

Click here to switch to the map view.

The map label for this gene is gcp [H]

Identifier: 83590363

GI number: 83590363

Start: 1566394

End: 1567359

Strand: Reverse

Name: gcp [H]

Synonym: Moth_1520

Alternate gene names: 83590363

Gene position: 1567359-1566394 (Counterclockwise)

Preceding gene: 83590364

Following gene: 83590361

Centisome position: 59.62

GC content: 65.22

Gene sequence:

>966_bases
ATGGCTATTCTGGGGATTGACACCAGCGCCTATACCTGTTCGGCGGCCGCCGTCAGCCAGGATGGCGAACTATTGGCAGC
CCACCGTCGCCTTTTGCCGGTACCTCCGGGTGAAAGGGGCCTGCAGCAGGCTACGGCGGTTTTTCATCACGTCCAGATCC
TGCCGGAGGTCCTGTCAGAAGTTTTTGCCGCCGTCCCGGCGGCCAGGATCAGGAGAGTGGTTGCCTCTGTCAAACCGCGG
CCGGTAGAAGGCTCTTATATGCCGGTCTTTACCGTGGCTGCCGGGCAGGGTCGCATCCTGGCGGCCGCTTTAGGCGTACC
CTTTCGGGCCACCACCCACCAGGAAGGCCATATACAGGCCGGCTTGTGGTCGTCAGGCTGGCAGCCGTCGGACTCCTTTC
TGGCGGTCCATCTCTCGGGCGGTACCTCGGAAGTACTCCTGGTGAGCCGGAAACCGGGGGGCTTTACCATTGAGAAGCTG
GGAGGTACCCTGGACCTTCATGCCGGCCAGCTAGTTGACCGCGCCGGGGTCCTGATGGGGCTCGAGTTTCCGGCTGGCCC
CGCCCTGGAGCGCCTGGCCCGGGAAGCGGGCCCGGAAATGGAAAAGGTCCACCTGACCTCGGCCGTGAGGGGCTATAACT
TCAGCTTTTCCGGCCCGGCCAGCCAGGCGGAGCGGCTCCTCGCGGCCGGGGCACCTCCGGCCGCCGTGGCCAGGGCGGTG
GAACAGTGTATTGCCAATACCCTGGAGCGGGTGCTGCGGCCGGCAGTAGAGGCTACCGGCCTGCGGGATATCTTAATTGT
CGGCGGGGTAGCGGCCAACAACTACCTGCGGCAGCGCCTGCGCCACCGCCTGGAACATCCGGCAGTAGCGGCGCGCCTGC
ATTTTGCCGCCCCGGAACACAGCTCCGACAACGCTATCGGCGTAGCCCTCCTGGGACTGGAGGTAGACCCCCGGGAAAAA
GGATAG

Upstream 100 bases:

>100_bases
GAACTGGCCAAAAACTTTAATAACGAAGAAGCTGGCCGCTTCGTCAACGGTCTCCTGGATAACGCCCGCAAGGATCTGGG
GCTGAGTGAGGAAATAGAAA

Downstream 100 bases:

>100_bases
GTTGCAGGGGAAAAACCGGGCTTCAAGCCCGGCTATTTTTTTCTTCCGGCACTGGTTCAACTCTGACTTGCCGGGCGGAC
GGTTGCTGGCGCAGGTCCGG

Product: O-sialoglycoprotein endopeptidase

Products: NA

Alternate protein names: Glycoprotease [H]

Number of amino acids: Translated: 321; Mature: 320

Protein sequence:

>321_residues
MAILGIDTSAYTCSAAAVSQDGELLAAHRRLLPVPPGERGLQQATAVFHHVQILPEVLSEVFAAVPAARIRRVVASVKPR
PVEGSYMPVFTVAAGQGRILAAALGVPFRATTHQEGHIQAGLWSSGWQPSDSFLAVHLSGGTSEVLLVSRKPGGFTIEKL
GGTLDLHAGQLVDRAGVLMGLEFPAGPALERLAREAGPEMEKVHLTSAVRGYNFSFSGPASQAERLLAAGAPPAAVARAV
EQCIANTLERVLRPAVEATGLRDILIVGGVAANNYLRQRLRHRLEHPAVAARLHFAAPEHSSDNAIGVALLGLEVDPREK
G

Sequences:

>Translated_321_residues
MAILGIDTSAYTCSAAAVSQDGELLAAHRRLLPVPPGERGLQQATAVFHHVQILPEVLSEVFAAVPAARIRRVVASVKPR
PVEGSYMPVFTVAAGQGRILAAALGVPFRATTHQEGHIQAGLWSSGWQPSDSFLAVHLSGGTSEVLLVSRKPGGFTIEKL
GGTLDLHAGQLVDRAGVLMGLEFPAGPALERLAREAGPEMEKVHLTSAVRGYNFSFSGPASQAERLLAAGAPPAAVARAV
EQCIANTLERVLRPAVEATGLRDILIVGGVAANNYLRQRLRHRLEHPAVAARLHFAAPEHSSDNAIGVALLGLEVDPREK
G
>Mature_320_residues
AILGIDTSAYTCSAAAVSQDGELLAAHRRLLPVPPGERGLQQATAVFHHVQILPEVLSEVFAAVPAARIRRVVASVKPRP
VEGSYMPVFTVAAGQGRILAAALGVPFRATTHQEGHIQAGLWSSGWQPSDSFLAVHLSGGTSEVLLVSRKPGGFTIEKLG
GTLDLHAGQLVDRAGVLMGLEFPAGPALERLAREAGPEMEKVHLTSAVRGYNFSFSGPASQAERLLAAGAPPAAVARAVE
QCIANTLERVLRPAVEATGLRDILIVGGVAANNYLRQRLRHRLEHPAVAARLHFAAPEHSSDNAIGVALLGLEVDPREKG

Specific function: Could Be A Metalloprotease. [C]

COG id: COG0533

COG function: function code O; Metal-dependent proteases with possible chaperone activity

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the peptidase M22 family [H]

Homologues:

Organism=Homo sapiens, GI8923380, Length=324, Percent_Identity=26.8518518518519, Blast_Score=76, Evalue=4e-14,
Organism=Escherichia coli, GI1789445, Length=228, Percent_Identity=31.5789473684211, Blast_Score=91, Evalue=8e-20,
Organism=Caenorhabditis elegans, GI71995670, Length=293, Percent_Identity=26.2798634812287, Blast_Score=70, Evalue=2e-12,
Organism=Drosophila melanogaster, GI21357207, Length=332, Percent_Identity=27.4096385542169, Blast_Score=84, Evalue=9e-17,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR022449
- InterPro:   IPR000905
- InterPro:   IPR017861 [H]

Pfam domain/function: PF00814 Peptidase_M22 [H]

EC number: =3.4.24.57 [H]

Molecular weight: Translated: 33813; Mature: 33682

Theoretical pI: Translated: 8.30; Mature: 8.30

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.6 %Cys     (Translated Protein)
1.2 %Met     (Translated Protein)
1.9 %Cys+Met (Translated Protein)
0.6 %Cys     (Mature Protein)
0.9 %Met     (Mature Protein)
1.6 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MAILGIDTSAYTCSAAAVSQDGELLAAHRRLLPVPPGERGLQQATAVFHHVQILPEVLSE
CEEEEECCCCCEEEHHHHCCCCHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHH
VFAAVPAARIRRVVASVKPRPVEGSYMPVFTVAAGQGRILAAALGVPFRATTHQEGHIQA
HHHHCCHHHHHHHHHHCCCCCCCCCCCEEEEEECCCCEEEEEECCCCCEECCCCCCCEEE
GLWSSGWQPSDSFLAVHLSGGTSEVLLVSRKPGGFTIEKLGGTLDLHAGQLVDRAGVLMG
CCCCCCCCCCCCEEEEEECCCCCEEEEEEECCCCEEHHHCCCEEEECHHHHHHHCCCEEE
LEFPAGPALERLAREAGPEMEKVHLTSAVRGYNFSFSGPASQAERLLAAGAPPAAVARAV
ECCCCCHHHHHHHHHHCCCHHHHHHHHHHHCCCCCCCCCHHHHHHHHHCCCCHHHHHHHH
EQCIANTLERVLRPAVEATGLRDILIVGGVAANNYLRQRLRHRLEHPAVAARLHFAAPEH
HHHHHHHHHHHHHHHHHHCCCCEEEEECCHHHHHHHHHHHHHHHCCCHHHHEEEECCCCC
SSDNAIGVALLGLEVDPREKG
CCCCCEEEEEEEEECCCCCCC
>Mature Secondary Structure 
AILGIDTSAYTCSAAAVSQDGELLAAHRRLLPVPPGERGLQQATAVFHHVQILPEVLSE
EEEEECCCCCEEEHHHHCCCCHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHH
VFAAVPAARIRRVVASVKPRPVEGSYMPVFTVAAGQGRILAAALGVPFRATTHQEGHIQA
HHHHCCHHHHHHHHHHCCCCCCCCCCCEEEEEECCCCEEEEEECCCCCEECCCCCCCEEE
GLWSSGWQPSDSFLAVHLSGGTSEVLLVSRKPGGFTIEKLGGTLDLHAGQLVDRAGVLMG
CCCCCCCCCCCCEEEEEECCCCCEEEEEEECCCCEEHHHCCCEEEECHHHHHHHCCCEEE
LEFPAGPALERLAREAGPEMEKVHLTSAVRGYNFSFSGPASQAERLLAAGAPPAAVARAV
ECCCCCHHHHHHHHHHCCCHHHHHHHHHHHCCCCCCCCCHHHHHHHHHCCCCHHHHHHHH
EQCIANTLERVLRPAVEATGLRDILIVGGVAANNYLRQRLRHRLEHPAVAARLHFAAPEH
HHHHHHHHHHHHHHHHHHCCCCEEEEECCHHHHHHHHHHHHHHHCCCHHHHEEEECCCCC
SSDNAIGVALLGLEVDPREKG
CCCCCEEEEEEEEECCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 10.0

TargetDB status: NA

Availability: NA

References: 9389475 [H]