The gene/protein map for NC_003106 is currently unavailable.
Definition Sulfolobus tokodaii str. 7 chromosome, complete genome.
Accession NC_003106
Length 2,694,756

Click here to switch to the map view.

The map label for this gene is soxM [H]

Identifier: 15920282

GI number: 15920282

Start: 126287

End: 128734

Strand: Reverse

Name: soxM [H]

Synonym: ST0103

Alternate gene names: 15920282

Gene position: 128734-126287 (Counterclockwise)

Preceding gene: 15920289

Following gene: 15920281

Centisome position: 4.78

GC content: 36.36

Gene sequence:

>2448_bases
ATGAGAATTATGAGTAGTGTAGCTCATAAAATTAAGGAAGTCCTTAAAATAGCATTTACTACTACTAATGCTTCAGATAT
TGGTATAATGTACATAACACTAGGAATTATTAGCCTAATTATCGGAAGCGTTGAAGCAACGATAATGAGGACTCAGCTAA
CTTTCAATAATATAGGTCCTACTACATATTATGACGCTTTAACACTTCACGGTATATTTATGATATTCTTCGTAGTGATG
CCATTATCTGCTGGTCTAGCTAATTATTTAGTTCCGAGAATGATTGGTGCTCATGATTTATATTGGCCTAAAATAAATGC
ACTCTCATTTTGGATTCTAGTCCCTGCCGTCACTTTAACGGCAATCTCTCCTCTTGTCGGAGTTGTAAATGCTGGATGGT
ATATGTATGCACCACTTTCTGTGGATTTACAAGTAAATAGCGGAATAGGAATGGATGTAATAGAGATAGCTCTTATAATA
GCTGGTATATCTAGCACGTTAACTGGAATAAACTTCATATTGACGATTACTAGGCTAAAGAAAATACCATACTTTAAGAT
GCCATTATTTGTTTGGGCTTTCTTCTCTACAGCTATATTACTAATGATAGCTTTACCGCCATTAACAGCCGGTTTAGCTA
TGGCATTTCTAGAGAGAAATTGGGGTTTCCAATTCTTTAATGCTAATGCTGGCGGAAATCCATTGCTGTGGCAAAATGTT
TTCTGGTTCTTCGGTCATCCAGAAGTATATATCCTTATACTTCCAGCAATGGGCATAATTGGTGAAGTGTTACCTAGGTC
TGTGGGTAGACAAATTTATGGTTATAAAGCCTTAGCGTTATCATCTTTTGCAATAGCATTCTTAAGTGCTATGGGAGTTT
GGATGCATCATATGTTCACATCAATATTTAACTTCTGGGCTGATGCAGTTTCTTCAGCTATAACTATGGCAATAGCAATA
CCTTCTGGTGTAAAGGTTGTTAATTGGACCGCTACATTTTATCAAGGAAAACTTAGAGTTACTGGGTATTCGCTGCTGAC
TATAGGTTTTATAGCACTATTCCTTGTTGGAGGTATCACAGGTGTGTTATTCCCTCTAATACCTTTAGACTATGATTTAA
ATGGTACTTATGCTGTCGTAGGTCATTTTCATTACATGGTATTCGCTATTGTAGTAGCATTTTTAGCTGCATTGCTCTAC
TATTTCCCATATTTTACTGGTAAAATGTATGATATGGAATTATCTAAGAGTGGTGCTATAATGACAGTAGCTGGAGCATT
TGTAATAGCTACTGGAATGTTTGTTGAAGGAGTATTAGGTATGCCAAGAAGGTATGCATGGGTTCCATCGATGATATACT
ATCCATTCCAAATACTAATTGATGTAGGAGGAGTAATAATGGGTTTAGGGCTAGTATTAATCTTCGGCAATTTACTTTAT
AGTTGGGTTAAAGGTAAAAGGGTTGAAAGTCTAGATCCTTGGGGAGTTGAAGCAATAGGACTACCAGACTTCTATATTAA
ACCAGTTGCATTACCATTAACATTTGGTAGGGCAATGGACGGATCTATACCAGAGCATAGGCATGGTACATTTTTACCAT
CATTAATGGGTATTTTGATGTTCTTACCGGGATTGGGGTTCTTGTTTATTTTAAGATTTGGATTACTAGATGTAGGTTTA
CCAATGATTTTAGCCTTCTTAGCAGTCGGAGGTTATTGGGCTTATCATGATTACTTCAAAGGCTTGTATCCATCAGTACC
ATCTATAAGACCTCCAGGTGGATTTGAGATGACAAAAATGGCTGGTTCACCATTTTCTGGGTCTTCAAATACCTTATCTG
TAACACCAGAGGGAATACAAAAGGCAATGCAAACAAGAACTATAGTCCTCTATTTAATTATAGCAGAAATATTCTTATTT
GGAGGGTTTATAGGAGGTTATCTTTATACTATTAACTGGACACCTGCTGCACAACCATATTTGGCTTCGTTCCATGTAGA
TTGGTACGGTTTACCATTAGCAATGACAATAATATTACTTTCAAGCTCAATACCATCACATTTCGCCTATGATAGTCTAC
TAAAGGGTAAATTAAAAAGGTTCAAATATTTAGGCTTAGCAACGTTCTTGATGGGGTTAACATTTCTAAGTGGGCAAATG
TATGAGTTTACTCATATAATTCACTTTACTCCGCAAGAAAATATCATAACATCATTCTTCTTCACTATAGTATGGTTACA
TGGTTTTCACGTTATTATGGGGCTAACACTATGGGCGTTCACGCTATTAAGGGCAAGGAGAATAATACCCTATGAAGCTT
CTACTGCAGCATCATATTATTGGCATTTTGTAGATGGAATATGGGTAATAGTATTTACAATGCTATACTTGCAATTACCG
TTCTATCATCCCTTTACTCCAGGGCAAATCTCATTCTTCGGGATTTAA

Upstream 100 bases:

>100_bases
TAATTAAATTTTTTCTCTTAAATATTAAAATATAATCAAAGTTTTAAACTATAAAAGTTTTTGATAATAAGATTAATAAA
CTGGTATCAGATATTAATTA

Downstream 100 bases:

>100_bases
GATGAATAAGATTTTTTATTATCTTCTTCCTCTTGATATGTTTTTAATTTTACCATTTACATTTAGTTTTTTATCATATT
CTCCTGCAATACCGATGTTA

Product: quinol oxidase polypeptide I/III

Products: NA

Alternate protein names: Quinol oxidase polypeptide I/III [H]

Number of amino acids: Translated: 815; Mature: 815

Protein sequence:

>815_residues
MRIMSSVAHKIKEVLKIAFTTTNASDIGIMYITLGIISLIIGSVEATIMRTQLTFNNIGPTTYYDALTLHGIFMIFFVVM
PLSAGLANYLVPRMIGAHDLYWPKINALSFWILVPAVTLTAISPLVGVVNAGWYMYAPLSVDLQVNSGIGMDVIEIALII
AGISSTLTGINFILTITRLKKIPYFKMPLFVWAFFSTAILLMIALPPLTAGLAMAFLERNWGFQFFNANAGGNPLLWQNV
FWFFGHPEVYILILPAMGIIGEVLPRSVGRQIYGYKALALSSFAIAFLSAMGVWMHHMFTSIFNFWADAVSSAITMAIAI
PSGVKVVNWTATFYQGKLRVTGYSLLTIGFIALFLVGGITGVLFPLIPLDYDLNGTYAVVGHFHYMVFAIVVAFLAALLY
YFPYFTGKMYDMELSKSGAIMTVAGAFVIATGMFVEGVLGMPRRYAWVPSMIYYPFQILIDVGGVIMGLGLVLIFGNLLY
SWVKGKRVESLDPWGVEAIGLPDFYIKPVALPLTFGRAMDGSIPEHRHGTFLPSLMGILMFLPGLGFLFILRFGLLDVGL
PMILAFLAVGGYWAYHDYFKGLYPSVPSIRPPGGFEMTKMAGSPFSGSSNTLSVTPEGIQKAMQTRTIVLYLIIAEIFLF
GGFIGGYLYTINWTPAAQPYLASFHVDWYGLPLAMTIILLSSSIPSHFAYDSLLKGKLKRFKYLGLATFLMGLTFLSGQM
YEFTHIIHFTPQENIITSFFFTIVWLHGFHVIMGLTLWAFTLLRARRIIPYEASTAASYYWHFVDGIWVIVFTMLYLQLP
FYHPFTPGQISFFGI

Sequences:

>Translated_815_residues
MRIMSSVAHKIKEVLKIAFTTTNASDIGIMYITLGIISLIIGSVEATIMRTQLTFNNIGPTTYYDALTLHGIFMIFFVVM
PLSAGLANYLVPRMIGAHDLYWPKINALSFWILVPAVTLTAISPLVGVVNAGWYMYAPLSVDLQVNSGIGMDVIEIALII
AGISSTLTGINFILTITRLKKIPYFKMPLFVWAFFSTAILLMIALPPLTAGLAMAFLERNWGFQFFNANAGGNPLLWQNV
FWFFGHPEVYILILPAMGIIGEVLPRSVGRQIYGYKALALSSFAIAFLSAMGVWMHHMFTSIFNFWADAVSSAITMAIAI
PSGVKVVNWTATFYQGKLRVTGYSLLTIGFIALFLVGGITGVLFPLIPLDYDLNGTYAVVGHFHYMVFAIVVAFLAALLY
YFPYFTGKMYDMELSKSGAIMTVAGAFVIATGMFVEGVLGMPRRYAWVPSMIYYPFQILIDVGGVIMGLGLVLIFGNLLY
SWVKGKRVESLDPWGVEAIGLPDFYIKPVALPLTFGRAMDGSIPEHRHGTFLPSLMGILMFLPGLGFLFILRFGLLDVGL
PMILAFLAVGGYWAYHDYFKGLYPSVPSIRPPGGFEMTKMAGSPFSGSSNTLSVTPEGIQKAMQTRTIVLYLIIAEIFLF
GGFIGGYLYTINWTPAAQPYLASFHVDWYGLPLAMTIILLSSSIPSHFAYDSLLKGKLKRFKYLGLATFLMGLTFLSGQM
YEFTHIIHFTPQENIITSFFFTIVWLHGFHVIMGLTLWAFTLLRARRIIPYEASTAASYYWHFVDGIWVIVFTMLYLQLP
FYHPFTPGQISFFGI
>Mature_815_residues
MRIMSSVAHKIKEVLKIAFTTTNASDIGIMYITLGIISLIIGSVEATIMRTQLTFNNIGPTTYYDALTLHGIFMIFFVVM
PLSAGLANYLVPRMIGAHDLYWPKINALSFWILVPAVTLTAISPLVGVVNAGWYMYAPLSVDLQVNSGIGMDVIEIALII
AGISSTLTGINFILTITRLKKIPYFKMPLFVWAFFSTAILLMIALPPLTAGLAMAFLERNWGFQFFNANAGGNPLLWQNV
FWFFGHPEVYILILPAMGIIGEVLPRSVGRQIYGYKALALSSFAIAFLSAMGVWMHHMFTSIFNFWADAVSSAITMAIAI
PSGVKVVNWTATFYQGKLRVTGYSLLTIGFIALFLVGGITGVLFPLIPLDYDLNGTYAVVGHFHYMVFAIVVAFLAALLY
YFPYFTGKMYDMELSKSGAIMTVAGAFVIATGMFVEGVLGMPRRYAWVPSMIYYPFQILIDVGGVIMGLGLVLIFGNLLY
SWVKGKRVESLDPWGVEAIGLPDFYIKPVALPLTFGRAMDGSIPEHRHGTFLPSLMGILMFLPGLGFLFILRFGLLDVGL
PMILAFLAVGGYWAYHDYFKGLYPSVPSIRPPGGFEMTKMAGSPFSGSSNTLSVTPEGIQKAMQTRTIVLYLIIAEIFLF
GGFIGGYLYTINWTPAAQPYLASFHVDWYGLPLAMTIILLSSSIPSHFAYDSLLKGKLKRFKYLGLATFLMGLTFLSGQM
YEFTHIIHFTPQENIITSFFFTIVWLHGFHVIMGLTLWAFTLLRARRIIPYEASTAASYYWHFVDGIWVIVFTMLYLQLP
FYHPFTPGQISFFGI

Specific function: Catalytic subunit of the enzyme. Electrons originating in a quinol are transferred to the bimetallic center of SoxM formed by a heme and copper B [H]

COG id: COG0843

COG function: function code C; Heme/copper-type cytochrome/quinol oxidases, subunit 1

Gene ontology:

Cell location: Cell membrane; Multi-pass membrane protein [H]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: In the C-terminal section; belongs to the cytochrome c oxidase subunit 3 family [H]

Homologues:

Organism=Homo sapiens, GI251831109, Length=455, Percent_Identity=38.4615384615385, Blast_Score=251, Evalue=2e-66,
Organism=Escherichia coli, GI1786634, Length=492, Percent_Identity=35.7723577235772, Blast_Score=274, Evalue=2e-74,
Organism=Saccharomyces cerevisiae, GI6226519, Length=494, Percent_Identity=36.8421052631579, Blast_Score=259, Evalue=1e-69,
Organism=Saccharomyces cerevisiae, GI6226524, Length=318, Percent_Identity=39.622641509434, Blast_Score=200, Evalue=7e-52,
Organism=Saccharomyces cerevisiae, GI6226523, Length=242, Percent_Identity=41.3223140495868, Blast_Score=140, Evalue=6e-34,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR000883
- InterPro:   IPR000298
- InterPro:   IPR013833 [H]

Pfam domain/function: PF00115 COX1; PF00510 COX3 [H]

EC number: 1.9.3.-

Molecular weight: Translated: 90604; Mature: 90604

Theoretical pI: Translated: 9.28; Mature: 9.28

Prosite motif: PS50855 COX1 ; PS00077 COX1_CUB ; PS50253 COX3

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.0 %Cys     (Translated Protein)
4.5 %Met     (Translated Protein)
4.5 %Cys+Met (Translated Protein)
0.0 %Cys     (Mature Protein)
4.5 %Met     (Mature Protein)
4.5 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MRIMSSVAHKIKEVLKIAFTTTNASDIGIMYITLGIISLIIGSVEATIMRTQLTFNNIGP
CCHHHHHHHHHHHHHHHHEEECCCCCCHHHHHHHHHHHHHHHHHHHHHEEEEEEECCCCC
TTYYDALTLHGIFMIFFVVMPLSAGLANYLVPRMIGAHDLYWPKINALSFWILVPAVTLT
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHH
AISPLVGVVNAGWYMYAPLSVDLQVNSGIGMDVIEIALIIAGISSTLTGINFILTITRLK
HHHHHHHHHCCCEEEEECEEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
KIPYFKMPLFVWAFFSTAILLMIALPPLTAGLAMAFLERNWGFQFFNANAGGNPLLWQNV
HCCCHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHCCCEEEEECCCCCCCCCHHHH
FWFFGHPEVYILILPAMGIIGEVLPRSVGRQIYGYKALALSSFAIAFLSAMGVWMHHMFT
HHEECCCCEEEEEEHHHHHHHHHHHHHHCHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHH
SIFNFWADAVSSAITMAIAIPSGVKVVNWTATFYQGKLRVTGYSLLTIGFIALFLVGGIT
HHHHHHHHHHHHHHEEEEECCCCCEEEEEEEEEEECEEEEECHHHHHHHHHHHHHHHHHH
GVLFPLIPLDYDLNGTYAVVGHFHYMVFAIVVAFLAALLYYFPYFTGKMYDMELSKSGAI
HHHHHHHCCCCCCCCCEEHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEEECCCCCE
MTVAGAFVIATGMFVEGVLGMPRRYAWVPSMIYYPFQILIDVGGVIMGLGLVLIFGNLLY
EEEHHHHHHHHHHHHHHHHCCCCHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
SWVKGKRVESLDPWGVEAIGLPDFYIKPVALPLTFGRAMDGSIPEHRHGTFLPSLMGILM
HHHCCCCCCCCCCCCCEEECCCCHHHCCEEEEEEECCCCCCCCCCCCCCCHHHHHHHHHH
FLPGLGFLFILRFGLLDVGLPMILAFLAVGGYWAYHDYFKGLYPSVPSIRPPGGFEMTKM
HHHHHHHHHHHHHHHHHCCHHHHHHHHHHCCHHHHHHHHHHCCCCCCCCCCCCCCEEHHC
AGSPFSGSSNTLSVTPEGIQKAMQTRTIVLYLIIAEIFLFGGFIGGYLYTINWTPAAQPY
CCCCCCCCCCEEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEECCCCCCCC
LASFHVDWYGLPLAMTIILLSSSIPSHFAYDSLLKGKLKRFKYLGLATFLMGLTFLSGQM
CEEEECCCCCHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCC
YEFTHIIHFTPQENIITSFFFTIVWLHGFHVIMGLTLWAFTLLRARRIIPYEASTAASYY
EEEEEEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHH
WHFVDGIWVIVFTMLYLQLPFYHPFTPGQISFFGI
HHHHHHHHHHHHHHHHHHCCCCCCCCCCCEEEEEC
>Mature Secondary Structure
MRIMSSVAHKIKEVLKIAFTTTNASDIGIMYITLGIISLIIGSVEATIMRTQLTFNNIGP
CCHHHHHHHHHHHHHHHHEEECCCCCCHHHHHHHHHHHHHHHHHHHHHEEEEEEECCCCC
TTYYDALTLHGIFMIFFVVMPLSAGLANYLVPRMIGAHDLYWPKINALSFWILVPAVTLT
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHH
AISPLVGVVNAGWYMYAPLSVDLQVNSGIGMDVIEIALIIAGISSTLTGINFILTITRLK
HHHHHHHHHCCCEEEEECEEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
KIPYFKMPLFVWAFFSTAILLMIALPPLTAGLAMAFLERNWGFQFFNANAGGNPLLWQNV
HCCCHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHCCCEEEEECCCCCCCCCHHHH
FWFFGHPEVYILILPAMGIIGEVLPRSVGRQIYGYKALALSSFAIAFLSAMGVWMHHMFT
HHEECCCCEEEEEEHHHHHHHHHHHHHHCHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHH
SIFNFWADAVSSAITMAIAIPSGVKVVNWTATFYQGKLRVTGYSLLTIGFIALFLVGGIT
HHHHHHHHHHHHHHEEEEECCCCCEEEEEEEEEEECEEEEECHHHHHHHHHHHHHHHHHH
GVLFPLIPLDYDLNGTYAVVGHFHYMVFAIVVAFLAALLYYFPYFTGKMYDMELSKSGAI
HHHHHHHCCCCCCCCCEEHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEEECCCCCE
MTVAGAFVIATGMFVEGVLGMPRRYAWVPSMIYYPFQILIDVGGVIMGLGLVLIFGNLLY
EEEHHHHHHHHHHHHHHHHCCCCHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
SWVKGKRVESLDPWGVEAIGLPDFYIKPVALPLTFGRAMDGSIPEHRHGTFLPSLMGILM
HHHCCCCCCCCCCCCCEEECCCCHHHCCEEEEEEECCCCCCCCCCCCCCCHHHHHHHHHH
FLPGLGFLFILRFGLLDVGLPMILAFLAVGGYWAYHDYFKGLYPSVPSIRPPGGFEMTKM
HHHHHHHHHHHHHHHHHCCHHHHHHHHHHCCHHHHHHHHHHCCCCCCCCCCCCCCEEHHC
AGSPFSGSSNTLSVTPEGIQKAMQTRTIVLYLIIAEIFLFGGFIGGYLYTINWTPAAQPY
CCCCCCCCCCEEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCEEEEEECCCCCCCC
LASFHVDWYGLPLAMTIILLSSSIPSHFAYDSLLKGKLKRFKYLGLATFLMGLTFLSGQM
CEEEECCCCCHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCC
YEFTHIIHFTPQENIITSFFFTIVWLHGFHVIMGLTLWAFTLLRARRIIPYEASTAASYY
EEEEEEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHH
WHFVDGIWVIVFTMLYLQLPFYHPFTPGQISFFGI
HHHHHHHHHHHHHHHHHHCCCCCCCCCCCEEEEEC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 8076636 [H]