BacMap

Definition	Desulfurococcus kamchatkensis 1221n chromosome, complete genome.
Accession	NC_011766
Length	1,365,223

Click here to switch to the map view.

The map label for this gene is galS [H]

Identifier: 218884021

GI number: 218884021

Start: 679359

End: 681431

Strand: Reverse

Name: galS [H]

Synonym: DKAM_0710

Alternate gene names: 218884021

Gene position: 681431-679359 (Counterclockwise)

Preceding gene: 218884024

Following gene: 218884016

Centisome position: 49.91

GC content: 47.13

Gene sequence:

>2073_bases
ATGATCAAAGGAGTAACCATGCATTATGCTGATGGATCAAGCGAGGACTGCAGCCAAATCGAGACTGGTGAAAACCATTA
CATGTATAAATGTGTAAACGGTATCGTGACGTTAAGGAATGAGGACGGGGTAGTTTCATTATCGGCCAGTACAGTGAAGC
CCTTGAGTAGCCTCATAGCTCTTGATATATGGCTAGACCTAGAGAATGACTCGAGGATACTTGTATTGACAACGCATCCC
GATGCTGGATCCATGTATGCCTCTGCCTTCGCATACTATAATAAGCTAGCTATTGGTGAGTCTCCTTCAGTCGAGAAGCC
GCCTGATAACCCTGATTACCCACCTAGGTTCACTATGATAGATCACTTCTCATACATCAGGAGATTCCCTTGCTGGAGCT
ATCCGGTAATAATCCAGGGCTTCGATGAGATACCATTATACAGTATATTTGCTGTATACATGCGTAAAGGAGAATACATT
ATATTACTTCCCCTGCTAGGCTGCTCATTCACAGTTTACCTTGGACCTGGACCCAGGTTAATGGTATTCACTGGGAGAGA
AGTCTTCGAGCTCCCAGAGACCCCTGTCCTCATAGCTGGGAAAGGCTTGAACCTCTACAGGGTTATAGAGGAAACAGTAG
CAAAAGCATCAAGGATCACCGGCTTCAGGCTTAGAAGGGAGAAGCGTCTCCCCGTCTTCATGAATGGGCTTGGATGGTGT
TCATGGAATGCGTTCCTAACAACCAGGTTAACCCATGACAACGTAGTTACAGTTGTATCTAGGCTCCTCGGGAAAGACAT
CCCATTGAAATGGGTTTTAATAGATGACGGATGGCAGGATGAGGAAGTGGTATCCGTACTGCAAGTGAGAGCGTTGAAGA
CCCTTAACACGGATAGGTCTAAGTTCCCAAGAGGCCTCAGCAACACTGTCTCCATGTTGAAGAACATGGGGATTAGGTAT
ACCGGTTTATGGCACACTATTAACATTCACTGGGGAGGTGCAGAAGAAGAAGTATTCAGAGAGCTGGGTTCCAACGGGTA
TAGATCACCTGTTCTTAAAACCCTTATCCCGCAACCGGAGCTAGGGGATGCGTATCGCTTCTACAAGGGGTTCTATAAAT
GGGTGGGGAAGCAGGGATTCAACTTCGTCAAGGTTGACAACCAGTGGTCTATACATGCATTGTATCTGGGCGACAAGGCC
TCGGCTGAGGCCTCTAGGAGCATTGAGCTTGCCCTCCAGCTTGCTGCCGAGGAGAATGGGCTCGAGGTGTTGAACTGTAT
GTCTATGGTGCCTGAGAACTACTATAGCTTCCTACTGAGTAACGCGGTGAGGACCTCTATAGACTATGTCCCCTTCTGGA
GAGGCGGCGCAAAACTCCACGCATTCTTCAATGTGTATAATTCACTCTTATTCAGCCATATAGCCTATCCTGACTACGAT
ATGTGGGTAACGTATGACCCATACGCCAGGCTACACGCTGTCCTCAGGGTGTTCAGCGGTGGCCCAGTCTACATAACTGA
TGGAGACCCCGATAGAACAGATAGGGAACTCCTCGGGAAAATAGTGTTGCCGGATGGATCCATTACAAGGGTAGATGAGC
CTGGTTTACCAACCCTAGACATAGTCTTCAGGGATCCCTACAATGAGGAGGTCTTGTTAAAGATCGCTTCAAAGATAGGT
TTCTCAACGGCTATAGCCTTATTCAACATCAATAGGAATGAAAAGAGGATCAGTGATAAAGTAACAGTAGACACTCTTCC
ATACATTACGGAGGCAGAAGCATACGCCTATTACAAAGTATTCACAGGTGAAACAGGCGTCATAGATAGAAGCGGAGAGG
TGCACGTGGAGCTGGAACCATTGGGCGTTGAAGTACTAATACTGTCACCGATAGTAAACAATAAAGCCGTGATAGGGTTG
GAGAATTACCTGCTACCACCAGCCACGGTGGAATCCCTGATTCTACCTGGTGAAATACTCGTCAAGGCCAAGGCTAAGGG
GCGAATACTATACTATAAAGACGCGGGCTTCGCAAGGAAACAGGTTGAAGCAGGCGAGACAGTAAAGATCTAG

Upstream 100 bases:

>100_bases
ACCATGATAAAATCTAAGTATATACTTGTAAGGAATGTATATAAGTTTAACGCTTCATCACTAATAATCATGTATAACTT
GTGGGGGTATCGCTGGCTTG

Downstream 100 bases:

>100_bases
CTTATGTTTTCTTCGACTTAAACCCACAATCCCTGTTCTGTCTAGTAATTCAAGTAGTTCATTGAGGTACGGCATATCGT
TTCCTCCAATCATATCGCTC

Product: raffinose synthase

Products: NA

Alternate protein names: Alpha-Gal [H]

Number of amino acids: Translated: 690; Mature: 690

Protein sequence:

>690_residues
MIKGVTMHYADGSSEDCSQIETGENHYMYKCVNGIVTLRNEDGVVSLSASTVKPLSSLIALDIWLDLENDSRILVLTTHP
DAGSMYASAFAYYNKLAIGESPSVEKPPDNPDYPPRFTMIDHFSYIRRFPCWSYPVIIQGFDEIPLYSIFAVYMRKGEYI
ILLPLLGCSFTVYLGPGPRLMVFTGREVFELPETPVLIAGKGLNLYRVIEETVAKASRITGFRLRREKRLPVFMNGLGWC
SWNAFLTTRLTHDNVVTVVSRLLGKDIPLKWVLIDDGWQDEEVVSVLQVRALKTLNTDRSKFPRGLSNTVSMLKNMGIRY
TGLWHTINIHWGGAEEEVFRELGSNGYRSPVLKTLIPQPELGDAYRFYKGFYKWVGKQGFNFVKVDNQWSIHALYLGDKA
SAEASRSIELALQLAAEENGLEVLNCMSMVPENYYSFLLSNAVRTSIDYVPFWRGGAKLHAFFNVYNSLLFSHIAYPDYD
MWVTYDPYARLHAVLRVFSGGPVYITDGDPDRTDRELLGKIVLPDGSITRVDEPGLPTLDIVFRDPYNEEVLLKIASKIG
FSTAIALFNINRNEKRISDKVTVDTLPYITEAEAYAYYKVFTGETGVIDRSGEVHVELEPLGVEVLILSPIVNNKAVIGL
ENYLLPPATVESLILPGEILVKAKAKGRILYYKDAGFARKQVEAGETVKI

Sequences:

>Translated_690_residues
MIKGVTMHYADGSSEDCSQIETGENHYMYKCVNGIVTLRNEDGVVSLSASTVKPLSSLIALDIWLDLENDSRILVLTTHP
DAGSMYASAFAYYNKLAIGESPSVEKPPDNPDYPPRFTMIDHFSYIRRFPCWSYPVIIQGFDEIPLYSIFAVYMRKGEYI
ILLPLLGCSFTVYLGPGPRLMVFTGREVFELPETPVLIAGKGLNLYRVIEETVAKASRITGFRLRREKRLPVFMNGLGWC
SWNAFLTTRLTHDNVVTVVSRLLGKDIPLKWVLIDDGWQDEEVVSVLQVRALKTLNTDRSKFPRGLSNTVSMLKNMGIRY
TGLWHTINIHWGGAEEEVFRELGSNGYRSPVLKTLIPQPELGDAYRFYKGFYKWVGKQGFNFVKVDNQWSIHALYLGDKA
SAEASRSIELALQLAAEENGLEVLNCMSMVPENYYSFLLSNAVRTSIDYVPFWRGGAKLHAFFNVYNSLLFSHIAYPDYD
MWVTYDPYARLHAVLRVFSGGPVYITDGDPDRTDRELLGKIVLPDGSITRVDEPGLPTLDIVFRDPYNEEVLLKIASKIG
FSTAIALFNINRNEKRISDKVTVDTLPYITEAEAYAYYKVFTGETGVIDRSGEVHVELEPLGVEVLILSPIVNNKAVIGL
ENYLLPPATVESLILPGEILVKAKAKGRILYYKDAGFARKQVEAGETVKI
>Mature_690_residues
MIKGVTMHYADGSSEDCSQIETGENHYMYKCVNGIVTLRNEDGVVSLSASTVKPLSSLIALDIWLDLENDSRILVLTTHP
DAGSMYASAFAYYNKLAIGESPSVEKPPDNPDYPPRFTMIDHFSYIRRFPCWSYPVIIQGFDEIPLYSIFAVYMRKGEYI
ILLPLLGCSFTVYLGPGPRLMVFTGREVFELPETPVLIAGKGLNLYRVIEETVAKASRITGFRLRREKRLPVFMNGLGWC
SWNAFLTTRLTHDNVVTVVSRLLGKDIPLKWVLIDDGWQDEEVVSVLQVRALKTLNTDRSKFPRGLSNTVSMLKNMGIRY
TGLWHTINIHWGGAEEEVFRELGSNGYRSPVLKTLIPQPELGDAYRFYKGFYKWVGKQGFNFVKVDNQWSIHALYLGDKA
SAEASRSIELALQLAAEENGLEVLNCMSMVPENYYSFLLSNAVRTSIDYVPFWRGGAKLHAFFNVYNSLLFSHIAYPDYD
MWVTYDPYARLHAVLRVFSGGPVYITDGDPDRTDRELLGKIVLPDGSITRVDEPGLPTLDIVFRDPYNEEVLLKIASKIG
FSTAIALFNINRNEKRISDKVTVDTLPYITEAEAYAYYKVFTGETGVIDRSGEVHVELEPLGVEVLILSPIVNNKAVIGL
ENYLLPPATVESLILPGEILVKAKAKGRILYYKDAGFARKQVEAGETVKI

Specific function: Involved in the degradation of various alpha-linked galactosides such as raffinose, stachyose and melibiose [H]

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Belongs to the glycosyl hydrolase 36 family [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR013785
- InterPro:   IPR017853
- InterPro:   IPR008811 [H]

Pfam domain/function: PF05691 Raffinose_syn [H]

EC number: =3.2.1.22 [H]

Molecular weight: Translated: 77680; Mature: 77680

Theoretical pI: Translated: 5.99; Mature: 5.99

Prosite motif: PS00213 LIPOCALIN

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.9 %Cys     (Translated Protein)
1.9 %Met     (Translated Protein)
2.8 %Cys+Met (Translated Protein)
0.9 %Cys     (Mature Protein)
1.9 %Met     (Mature Protein)
2.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MIKGVTMHYADGSSEDCSQIETGENHYMYKCVNGIVTLRNEDGVVSLSASTVKPLSSLIA
CCCCEEEEECCCCCCCHHHCCCCCCCEEEEEECCEEEEECCCCEEEEECHHHHHHHHHEE
LDIWLDLENDSRILVLTTHPDAGSMYASAFAYYNKLAIGESPSVEKPPDNPDYPPRFTMI
EEEEEEECCCCEEEEEEECCCCCHHHHHHHHHHHHEECCCCCCCCCCCCCCCCCCCEEHH
DHFSYIRRFPCWSYPVIIQGFDEIPLYSIFAVYMRKGEYIILLPLLGCSFTVYLGPGPRL
HHHHHHHHCCCCCCCEEEECCCCCHHHHHHHHHHHCCCEEEEEEECCCEEEEEECCCCEE
MVFTGREVFELPETPVLIAGKGLNLYRVIEETVAKASRITGFRLRREKRLPVFMNGLGWC
EEEECCHHCCCCCCCEEEEECCCCHHHHHHHHHHHHHHCCCCEEHHCCCCCEEECCCCEE
SWNAFLTTRLTHDNVVTVVSRLLGKDIPLKWVLIDDGWQDEEVVSVLQVRALKTLNTDRS
EECEEEEEEECCCHHHHHHHHHHCCCCCEEEEEECCCCCHHHHHHHHHHHHHHHCCCCHH
KFPRGLSNTVSMLKNMGIRYTGLWHTINIHWGGAEEEVFRELGSNGYRSPVLKTLIPQPE
HCCCCHHHHHHHHHHCCCEEEEEEEEEEEEECCCHHHHHHHHCCCCCCCCHHHHHCCCCC
LGDAYRFYKGFYKWVGKQGFNFVKVDNQWSIHALYLGDKASAEASRSIELALQLAAEENG
CCCHHHHHHHHHHHHHCCCCCEEEECCCEEEEEEEECCCCCCCCCCCEEEEEEEECCCCC
LEVLNCMSMVPENYYSFLLSNAVRTSIDYVPFWRGGAKLHAFFNVYNSLLFSHIAYPDYD
HHHHHHHHHCHHHHHHHHHHHHHHHCCCCCEEECCCCHHHHHHHHHHHHHHHHHCCCCCC
MWVTYDPYARLHAVLRVFSGGPVYITDGDPDRTDRELLGKIVLPDGSITRVDEPGLPTLD
EEEEECHHHHHHHHHHHHCCCCEEEECCCCCCCCHHHHCEEECCCCCEEECCCCCCCEEE
IVFRDPYNEEVLLKIASKIGFSTAIALFNINRNEKRISDKVTVDTLPYITEAEAYAYYKV
EEEECCCCHHHHHHHHHHCCCEEEEEEEECCCCHHHHCCCEEEECCCCEECCCCEEEEEE
FTGETGVIDRSGEVHVELEPLGVEVLILSPIVNNKAVIGLENYLLPPATVESLILPGEIL
EECCCCEEECCCCEEEEEECCCEEEEEEEECCCCCEEEEEHHCCCCCHHHHHHCCCCCEE
VKAKAKGRILYYKDAGFARKQVEAGETVKI
EEEECCCEEEEEECCCCCHHHCCCCCEECC
>Mature Secondary Structure
MIKGVTMHYADGSSEDCSQIETGENHYMYKCVNGIVTLRNEDGVVSLSASTVKPLSSLIA
CCCCEEEEECCCCCCCHHHCCCCCCCEEEEEECCEEEEECCCCEEEEECHHHHHHHHHEE
LDIWLDLENDSRILVLTTHPDAGSMYASAFAYYNKLAIGESPSVEKPPDNPDYPPRFTMI
EEEEEEECCCCEEEEEEECCCCCHHHHHHHHHHHHEECCCCCCCCCCCCCCCCCCCEEHH
DHFSYIRRFPCWSYPVIIQGFDEIPLYSIFAVYMRKGEYIILLPLLGCSFTVYLGPGPRL
HHHHHHHHCCCCCCCEEEECCCCCHHHHHHHHHHHCCCEEEEEEECCCEEEEEECCCCEE
MVFTGREVFELPETPVLIAGKGLNLYRVIEETVAKASRITGFRLRREKRLPVFMNGLGWC
EEEECCHHCCCCCCCEEEEECCCCHHHHHHHHHHHHHHCCCCEEHHCCCCCEEECCCCEE
SWNAFLTTRLTHDNVVTVVSRLLGKDIPLKWVLIDDGWQDEEVVSVLQVRALKTLNTDRS
EECEEEEEEECCCHHHHHHHHHHCCCCCEEEEEECCCCCHHHHHHHHHHHHHHHCCCCHH
KFPRGLSNTVSMLKNMGIRYTGLWHTINIHWGGAEEEVFRELGSNGYRSPVLKTLIPQPE
HCCCCHHHHHHHHHHCCCEEEEEEEEEEEEECCCHHHHHHHHCCCCCCCCHHHHHCCCCC
LGDAYRFYKGFYKWVGKQGFNFVKVDNQWSIHALYLGDKASAEASRSIELALQLAAEENG
CCCHHHHHHHHHHHHHCCCCCEEEECCCEEEEEEEECCCCCCCCCCCEEEEEEEECCCCC
LEVLNCMSMVPENYYSFLLSNAVRTSIDYVPFWRGGAKLHAFFNVYNSLLFSHIAYPDYD
HHHHHHHHHCHHHHHHHHHHHHHHHCCCCCEEECCCCHHHHHHHHHHHHHHHHHCCCCCC
MWVTYDPYARLHAVLRVFSGGPVYITDGDPDRTDRELLGKIVLPDGSITRVDEPGLPTLD
EEEEECHHHHHHHHHHHHCCCCEEEECCCCCCCCHHHHCEEECCCCCEEECCCCCCCEEE
IVFRDPYNEEVLLKIASKIGFSTAIALFNINRNEKRISDKVTVDTLPYITEAEAYAYYKV
EEEECCCCHHHHHHHHHHCCCEEEEEEEECCCCHHHHCCCEEEECCCCEECCCCEEEEEE
FTGETGVIDRSGEVHVELEPLGVEVLILSPIVNNKAVIGLENYLLPPATVESLILPGEIL
EECCCCEEECCCCEEEEEECCCEEEEEEEECCCCCEEEEEHHCCCCCHHHHHHCCCCCEE
VKAKAKGRILYYKDAGFARKQVEAGETVKI
EEEECCCEEEEEECCCCCHHHCCCCCEECC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 11427726 [H]