BacMap

Definition	Sphingomonas wittichii RW1 plasmid pSWIT01, complete sequence.
Accession	NC_009507
Length	310,228

Click here to switch to the map view.

The map label for this gene is degP [H]

Identifier: 148550710

GI number: 148550710

Start: 169911

End: 171416

Strand: Reverse

Name: degP [H]

Synonym: Swit_5274

Alternate gene names: 148550710

Gene position: 171416-169911 (Counterclockwise)

Preceding gene: 148550711

Following gene: 148550709

Centisome position: 55.25

GC content: 66.27

Gene sequence:

>1506_bases
GTGCGAAATCCTGACAGGATCTTTGCCTCCCTATTAAGCACCGCCGCCGCCGTGGGTCTTGTCATCGGCCAGCCATCCCC
CGCTGCCGCGCAATCGCCGCCCGCCGCATCGCCAGTCGTGCCACGCCCAGGCGCGCCGCAAAGCTTTGCCGATCTCACCG
AAAGGCTGGCGCCCGCCGTCGTCAACATCTCGACCCGCCAGCGCGTGCAGATGCCGAGCTTCAGCCCCTTTGCCGGCACG
CCCTTCGAGCGCTTCTTCGGAAGTCCCACGGGACCGCGCACCCGCGAGGCGCAGTCGCTCGGCTCAGGCTTCATCCTGTC
CGCCGACGGCTACATTGTCACCAACAACCACGTCATCACCGCCGACGGGCAGGGCAAGGTCGAGACGATCACGGTCACCT
TGCACAATGGCGAGGAATATCCGGCGACCCTCGTCGGTAGCGATCCCGCCTCGGACCTGGCGGTCCTCAAGATTACGTTG
CGCAAACCGCTGCCCTTCGTGACCTTCGGCGATTCCACGCGAGTCAGGGTTGGCGACTGGGTGCTCGCGATCGGCAATCC
TTTCGGCCTGGGCGGCACGGTCACAGCCGGTATCGTCTCGGCGGTCTACCGCAATACCGGTACAGGGCGCGCCTATGACC
GCTATCTGCAAACCGACGCCTCGATCAACCGCGGCAATTCGGGCGGACCGATGTTCGACAGCAGCGGGCGGGTCATCGGC
ATCAACAATGCGATCTTCTCGCCCACGGGCGGAAATGTCGGGATCGGCTTTGCCATCCCCGCGGAGATCGCCGCGCCGAT
CGTCGAGAAGCTCAAGGCCGGCAAGGCCATCGAACGCGGTTATCTGGGCGTGACGATCCAGCCGATGACCGAAGACCTCG
CGTCATCGCTCGGCGTTCCGCGAGACCGCGGCGAGTTCGTCCAGAGCGTGGAGCCCGGCGGGCCCGCGGCACAGGCTGGC
ATCCGCGCCGGCGACGTCATCCTGCGGGTCGACGGCAAGGAGGTGACTCCAAGCCAAAGCCTGTCGTTCCTCGTTGCGAG
CGTCGAACCTGGCCGCAAGGTCGCAGTCGAACTCATGCGCGGCAACCAGCGCATGACCGTGACTGCCACGCCGGTGCTTC
GTCCCAGCGAGGACAAGCTCGCCCGGCAGGGTTTTGGCCGCGATGACCGTCGTTTCGACAATTTCGACAAGGATCGCGCG
TCCCCCAGCGAAAAGACACTCGGGCTTGCCGTCGAACCGCTGACTCCAGGCATCGCGCGTCAACTCGGTGCGAGCGACGT
CTCCCAGGGTCTCGTCATCAGCAGCGTCGAGGGCAATTCCGATGCGGCGCGCAAAGGCCTCAGCCGCGGCGACATCATCC
TGTCGGCCAACAACCGGCCGGTGGCGAGCGCTGCTGATCTCGAGGCCGCGATCCGGCAGGCCAGGACGGCGGGACGATCG
GCTATCCTGCTACGGGTCAAGGGGCGCGGCGAAGCGCCGGCCTATGTGCCGGTACGGCTGCGATAG

Upstream 100 bases:

>100_bases
CTTTGCGGACCCCGCCGCTCTGCCGACGTCGACCAGAGCCGGCGTGGCTGTTGCCGCGCCGACCATCCCATCTCGAGAAA
GGAAGGAAGAGGAGAATTTC

Downstream 100 bases:

>100_bases
GGCGGCACCAGGGCAGCGTCCTCGGCCGACGAGGGCGCTGCCTTCCTGGCAGCATCGTCGAGACGGGGAGGCTAGACGGC
AACGTGTGGCCAGCGCGAGA

Product: protease Do

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 501; Mature: 501

Protein sequence:

>501_residues
MRNPDRIFASLLSTAAAVGLVIGQPSPAAAQSPPAASPVVPRPGAPQSFADLTERLAPAVVNISTRQRVQMPSFSPFAGT
PFERFFGSPTGPRTREAQSLGSGFILSADGYIVTNNHVITADGQGKVETITVTLHNGEEYPATLVGSDPASDLAVLKITL
RKPLPFVTFGDSTRVRVGDWVLAIGNPFGLGGTVTAGIVSAVYRNTGTGRAYDRYLQTDASINRGNSGGPMFDSSGRVIG
INNAIFSPTGGNVGIGFAIPAEIAAPIVEKLKAGKAIERGYLGVTIQPMTEDLASSLGVPRDRGEFVQSVEPGGPAAQAG
IRAGDVILRVDGKEVTPSQSLSFLVASVEPGRKVAVELMRGNQRMTVTATPVLRPSEDKLARQGFGRDDRRFDNFDKDRA
SPSEKTLGLAVEPLTPGIARQLGASDVSQGLVISSVEGNSDAARKGLSRGDIILSANNRPVASAADLEAAIRQARTAGRS
AILLRVKGRGEAPAYVPVRLR

Sequences:

>Translated_501_residues
MRNPDRIFASLLSTAAAVGLVIGQPSPAAAQSPPAASPVVPRPGAPQSFADLTERLAPAVVNISTRQRVQMPSFSPFAGT
PFERFFGSPTGPRTREAQSLGSGFILSADGYIVTNNHVITADGQGKVETITVTLHNGEEYPATLVGSDPASDLAVLKITL
RKPLPFVTFGDSTRVRVGDWVLAIGNPFGLGGTVTAGIVSAVYRNTGTGRAYDRYLQTDASINRGNSGGPMFDSSGRVIG
INNAIFSPTGGNVGIGFAIPAEIAAPIVEKLKAGKAIERGYLGVTIQPMTEDLASSLGVPRDRGEFVQSVEPGGPAAQAG
IRAGDVILRVDGKEVTPSQSLSFLVASVEPGRKVAVELMRGNQRMTVTATPVLRPSEDKLARQGFGRDDRRFDNFDKDRA
SPSEKTLGLAVEPLTPGIARQLGASDVSQGLVISSVEGNSDAARKGLSRGDIILSANNRPVASAADLEAAIRQARTAGRS
AILLRVKGRGEAPAYVPVRLR
>Mature_501_residues
MRNPDRIFASLLSTAAAVGLVIGQPSPAAAQSPPAASPVVPRPGAPQSFADLTERLAPAVVNISTRQRVQMPSFSPFAGT
PFERFFGSPTGPRTREAQSLGSGFILSADGYIVTNNHVITADGQGKVETITVTLHNGEEYPATLVGSDPASDLAVLKITL
RKPLPFVTFGDSTRVRVGDWVLAIGNPFGLGGTVTAGIVSAVYRNTGTGRAYDRYLQTDASINRGNSGGPMFDSSGRVIG
INNAIFSPTGGNVGIGFAIPAEIAAPIVEKLKAGKAIERGYLGVTIQPMTEDLASSLGVPRDRGEFVQSVEPGGPAAQAG
IRAGDVILRVDGKEVTPSQSLSFLVASVEPGRKVAVELMRGNQRMTVTATPVLRPSEDKLARQGFGRDDRRFDNFDKDRA
SPSEKTLGLAVEPLTPGIARQLGASDVSQGLVISSVEGNSDAARKGLSRGDIILSANNRPVASAADLEAAIRQARTAGRS
AILLRVKGRGEAPAYVPVRLR

Specific function: Protease With A Shared Specificity With Degp. [C]

COG id: COG0265

COG function: function code O; Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain

Gene ontology:

Cell location: Periplasm (Potential) [H]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 2 PDZ (DHR) domains [H]

Homologues:

Organism=Homo sapiens, GI22129776, Length=335, Percent_Identity=34.3283582089552, Blast_Score=167, Evalue=2e-41,
Organism=Homo sapiens, GI4506141, Length=343, Percent_Identity=34.402332361516, Blast_Score=164, Evalue=3e-40,
Organism=Homo sapiens, GI7019477, Length=339, Percent_Identity=34.2182890855457, Blast_Score=154, Evalue=2e-37,
Organism=Homo sapiens, GI24308541, Length=337, Percent_Identity=32.6409495548961, Blast_Score=144, Evalue=2e-34,
Organism=Escherichia coli, GI1789629, Length=502, Percent_Identity=34.8605577689243, Blast_Score=248, Evalue=7e-67,
Organism=Escherichia coli, GI1786356, Length=476, Percent_Identity=34.2436974789916, Blast_Score=241, Evalue=7e-65,
Organism=Escherichia coli, GI1789630, Length=373, Percent_Identity=36.1930294906166, Blast_Score=189, Evalue=4e-49,
Organism=Drosophila melanogaster, GI24646839, Length=356, Percent_Identity=32.3033707865169, Blast_Score=152, Evalue=4e-37,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR001478
- InterPro:   IPR009003
- InterPro:   IPR011782
- InterPro:   IPR001254
- InterPro:   IPR001940 [H]

Pfam domain/function: PF00595 PDZ; PF00089 Trypsin [H]

EC number: 3.4.21.- [C]

Molecular weight: Translated: 52409; Mature: 52409

Theoretical pI: Translated: 10.33; Mature: 10.33

Prosite motif: PS50106 PDZ

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.0 %Cys     (Translated Protein)
1.2 %Met     (Translated Protein)
1.2 %Cys+Met (Translated Protein)
0.0 %Cys     (Mature Protein)
1.2 %Met     (Mature Protein)
1.2 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MRNPDRIFASLLSTAAAVGLVIGQPSPAAAQSPPAASPVVPRPGAPQSFADLTERLAPAV
CCCHHHHHHHHHHHHHHHEEEECCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHCCEE
VNISTRQRVQMPSFSPFAGTPFERFFGSPTGPRTREAQSLGSGFILSADGYIVTNNHVIT
EECCCHHEECCCCCCCCCCCCHHHHCCCCCCCCCHHHHHCCCCEEEECCCEEEECCEEEE
ADGQGKVETITVTLHNGEEYPATLVGSDPASDLAVLKITLRKPLPFVTFGDSTRVRVGDW
ECCCCCEEEEEEEEECCCCCCEEEECCCCCCCEEEEEEEECCCCCEEEECCCCEEEECCE
VLAIGNPFGLGGTVTAGIVSAVYRNTGTGRAYDRYLQTDASINRGNSGGPMFDSSGRVIG
EEEECCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHCCCCCCCCCCCCCCCCCCCCEEE
INNAIFSPTGGNVGIGFAIPAEIAAPIVEKLKAGKAIERGYLGVTIQPMTEDLASSLGVP
ECCEEECCCCCCEEEEEECCHHHHHHHHHHHHCCCHHHCCEEEEEECHHHHHHHHHCCCC
RDRGEFVQSVEPGGPAAQAGIRAGDVILRVDGKEVTPSQSLSFLVASVEPGRKVAVELMR
CCHHHHHHHCCCCCCHHHCCCCCCCEEEEECCCCCCCCCCEEEEEEECCCCHHHHHHHHC
GNQRMTVTATPVLRPSEDKLARQGFGRDDRRFDNFDKDRASPSEKTLGLAVEPLTPGIAR
CCCEEEEEECCCCCCCHHHHHHHCCCCCCCCCCCCCHHCCCCCCCEEEEEECCCCCHHHH
QLGASDVSQGLVISSVEGNSDAARKGLSRGDIILSANNRPVASAADLEAAIRQARTAGRS
HCCHHHHHCCEEEEECCCCCHHHHCCCCCCCEEEECCCCCCCCHHHHHHHHHHHHHCCCE
AILLRVKGRGEAPAYVPVRLR
EEEEEEECCCCCCCEEEEEEC
>Mature Secondary Structure
MRNPDRIFASLLSTAAAVGLVIGQPSPAAAQSPPAASPVVPRPGAPQSFADLTERLAPAV
CCCHHHHHHHHHHHHHHHEEEECCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHCCEE
VNISTRQRVQMPSFSPFAGTPFERFFGSPTGPRTREAQSLGSGFILSADGYIVTNNHVIT
EECCCHHEECCCCCCCCCCCCHHHHCCCCCCCCCHHHHHCCCCEEEECCCEEEECCEEEE
ADGQGKVETITVTLHNGEEYPATLVGSDPASDLAVLKITLRKPLPFVTFGDSTRVRVGDW
ECCCCCEEEEEEEEECCCCCCEEEECCCCCCCEEEEEEEECCCCCEEEECCCCEEEECCE
VLAIGNPFGLGGTVTAGIVSAVYRNTGTGRAYDRYLQTDASINRGNSGGPMFDSSGRVIG
EEEECCCCCCCCHHHHHHHHHHHHCCCCCHHHHHHHHCCCCCCCCCCCCCCCCCCCCEEE
INNAIFSPTGGNVGIGFAIPAEIAAPIVEKLKAGKAIERGYLGVTIQPMTEDLASSLGVP
ECCEEECCCCCCEEEEEECCHHHHHHHHHHHHCCCHHHCCEEEEEECHHHHHHHHHCCCC
RDRGEFVQSVEPGGPAAQAGIRAGDVILRVDGKEVTPSQSLSFLVASVEPGRKVAVELMR
CCHHHHHHHCCCCCCHHHCCCCCCCEEEEECCCCCCCCCCEEEEEEECCCCHHHHHHHHC
GNQRMTVTATPVLRPSEDKLARQGFGRDDRRFDNFDKDRASPSEKTLGLAVEPLTPGIAR
CCCEEEEEECCCCCCCHHHHHHHCCCCCCCCCCCCCHHCCCCCCCEEEEEECCCCCHHHH
QLGASDVSQGLVISSVEGNSDAARKGLSRGDIILSANNRPVASAADLEAAIRQARTAGRS
HCCHHHHHCCEEEEECCCCCHHHHCCCCCCCEEEECCCCCCCCHHHHHHHHHHHHHCCCE
AILLRVKGRGEAPAYVPVRLR
EEEEEEECCCCCCCEEEEEEC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 7861951 [H]