BacMap

Definition	Sphingomonas wittichii RW1 plasmid pSWIT01, complete sequence.
Accession	NC_009507
Length	310,228

Click here to switch to the map view.

The map label for this gene is 148550759

Identifier: 148550759

GI number: 148550759

Start: 220441

End: 222792

Strand: Direct

Name: 148550759

Synonym: Swit_5323

Alternate gene names: NA

Gene position: 220441-222792 (Clockwise)

Preceding gene: 148550755

Following gene: 148550760

Centisome position: 71.06

GC content: 60.03

Gene sequence:

>2352_bases
GTGGGCTTCAAGGTAGCGGCGAGGACGATTCTGGAATTGGGGGCTGAGCTGATCAGCACCGACGCCATCGCCCTGTATGA
ATTGATCAAGAACAGCTATGATGCCGGCTCCAAACGCGCGACGCTGGACATCCACACAGTCCTCAAGTTCAGTGAGCTGC
GCAACTTCAGGCAGCGCCTGGCGGCCGCACAGCGGCTTGTCCAGGACGAGGGTGCGGACGAGGATGAGCTGGTCGATCGG
CTGCGCGCGCAGCTTGTCGATCGCCTGGACTCTACAGCTGTTCAACCCGCGCTTGACGCCTTCCAGGCGGCACTTGCTGC
GGTTGATGACCTGGAAGAGCTCGGGGAAGCGGTCGAAACGCAATTTGAGAAGCTAAACTACATCGATGTCATCGACACGG
GCGAAGGCATGAGCCTGCGCGACCTGAGGGAGATTTTTCTTACGGTCGGCACCACTTCGCGGCTCCACGATACCAGGGGC
CGTCATTTCGTGGGCGGCAAAGGGATCGGCCGACTGTCGGCGATGCGCCTTGGTGACCGGCTGCGGGTCGAGACCGCGCG
TGAGAGCGATAGCGCTTGGAACCTGCTGACCATTGACTGGCGGAATTTCACCCATGAATCGGCCGATACGCTCGACACGA
TCGATGTTGCGCCCAGGCGGGGGCCGCCCAAGGAACAGGTGGACGCGCATGGCACGACGCTCCGCGTTCAGGCCCTGAAG
GCAGACTGGGACTTCGAACGCGTGAAGCGTCTCGCCGACCGCTATTTCGACCGGCTGTTCGATCCATTCTCCGGACGTTC
ACGCTACCCCCTGGTCATCCGCGTGAACGGGGCCAAGGTGCCGGTGCCGACATTCGATCGGGACGTGCTTGAAGAAGCGC
AGGCGTCGGTTTCGATCCGCTATATCGTTTCGCCCGAGCCGCAGCTCACGCTGGATATCAACTATATTACCCGCGGCAGG
CCGAAAGTCGAAGTCTGGAGCCGGGACGACATCCTGGGCATTACTGCTCACGAGGATGTCTCCGTCGCCGCGCTCGAGAG
CCTGGGGCCGTTCAGGGCTGACTTCCACTGGTTCAATCGGCAGCGTCTCAAGGCGATCGAGGGATATGGCGACCGGGAGA
AGGTTAAGGACACGGTCAACAATTGGGCCAACGGCCTCCTGATGTACCGCGATGGCTTCCGGGTGAACCCCTATGGAAAT
CCGGATGACGACTGGCTGGGCCTGGATGCCAAAGCGCTGGGTTCGGGCGGCTACAAGGTCAATCGCAAGCAGATTATTGG
CGCGGTATATATCTCAGCGGAGGATAATCCTTCGCTTATCGACCAGACCAACCGCGAGGGTCTCCGGGCCAATGAAGAAA
AATCGCTGCTCGTGCTGCTGCTGCGCAAGGCGATTACCGAGAATTTCAAGACCTTCCTGAATGATGTCGAAAAAGAGCTG
CGCAAGAGCACGCGCATCGATGCGACCGAGACAGCGGCCTATCTCGACCAGATCTCCAAGCGCGTCGCTCGCTCGCTCAA
AACGCTTCACAGCCTGGTGCCCCGGGAGAACGAGGAGGAGGTCGAGTTCCTGGAAGAGACTTTCGACGAACTGCAGGGGC
GACTGGCCGATGCGAAGGCATCGATCGCCAATGCGGAGAAAGATCAGCGGGACCTTGTAGATTTGGCGGGTGTGGGGTTG
CAGGTGGAGATCGTCGCGCACGAACTCGGCCGGGTCACGCGCAGGACTCTTGACCTGATCAAGACGTTACAGGGTGTGGA
TCTCCCGCCGCGGGCGCAAAGCACGTTCGGCTCGATCGAAAGCCAGATGCTCGTCATTCGTAAGCGACTGGACGTACTTG
ATCCGCTGGGGCCGAGCAGCCGCAATGCCAAGGCCAAGACGGATCTCAAAGAACTGGTCGAGCAGGTCTTCGACGCGCAT
GTCGATCAGTTCAGCCGTTATGGCATCGATCATGTGTTGCGGGTCTATCCGCGTTCCACGCGGTCTTTCACCAAGCGCGT
CGTGCGAGGCATGATCGTACAGGTCTTGGAAAACCTTATCGACAATGCCGTCTTCTGGCTGCGCCAGCGATCACGCGCCG
ATCCGGACTTCGAGCCGCGGATCGAGATTGAAATCGACGTCGACGACGATGAGATCCGAGTGACCGATAATGGCCCGGGT
ATTCCCGTCGATCGGCGCGAGGAGATTTTCAAGCCGTTTGTCTCGTTCAAGCCGCCGGGCGAGGGGAAGGGGCTTGGCCT
CTTCATCTCGCGTGAAATCGCGCGCCGGCATTCGAGCGATCTTTATCTTCAGGAGGGGGCGGACACGACCGGTCGTCTGC
ATACCTTCGTTCTCGACATGGCAGGAAGCTGA

Upstream 100 bases:

>100_bases
ATCTTCTAGCAGCAAAGCATCCGTAGCGGTTGATATACCGCGTTTTTGCTTGGTTTATCTCTCTATTCTGGATACTTCCG
GGCCTGTGACGGGGGGACGT

Downstream 100 bases:

>100_bases
AGGATGGACCTGCAAAGTATCAAGCCCGTGTTCGCTACCGCCAAGGTCAGCAGCGCCTTGCTGATTGACGACGCGTTCGA
TCCCTTGCCGGACATCGAGC

Product: histidine kinase

Products: NA

Alternate protein names: Sensor Histidine Kinase; Signal Transduction Protein; Two-Component Sensor Kinase

Number of amino acids: Translated: 783; Mature: 782

Protein sequence:

>783_residues
MGFKVAARTILELGAELISTDAIALYELIKNSYDAGSKRATLDIHTVLKFSELRNFRQRLAAAQRLVQDEGADEDELVDR
LRAQLVDRLDSTAVQPALDAFQAALAAVDDLEELGEAVETQFEKLNYIDVIDTGEGMSLRDLREIFLTVGTTSRLHDTRG
RHFVGGKGIGRLSAMRLGDRLRVETARESDSAWNLLTIDWRNFTHESADTLDTIDVAPRRGPPKEQVDAHGTTLRVQALK
ADWDFERVKRLADRYFDRLFDPFSGRSRYPLVIRVNGAKVPVPTFDRDVLEEAQASVSIRYIVSPEPQLTLDINYITRGR
PKVEVWSRDDILGITAHEDVSVAALESLGPFRADFHWFNRQRLKAIEGYGDREKVKDTVNNWANGLLMYRDGFRVNPYGN
PDDDWLGLDAKALGSGGYKVNRKQIIGAVYISAEDNPSLIDQTNREGLRANEEKSLLVLLLRKAITENFKTFLNDVEKEL
RKSTRIDATETAAYLDQISKRVARSLKTLHSLVPRENEEEVEFLEETFDELQGRLADAKASIANAEKDQRDLVDLAGVGL
QVEIVAHELGRVTRRTLDLIKTLQGVDLPPRAQSTFGSIESQMLVIRKRLDVLDPLGPSSRNAKAKTDLKELVEQVFDAH
VDQFSRYGIDHVLRVYPRSTRSFTKRVVRGMIVQVLENLIDNAVFWLRQRSRADPDFEPRIEIEIDVDDDEIRVTDNGPG
IPVDRREEIFKPFVSFKPPGEGKGLGLFISREIARRHSSDLYLQEGADTTGRLHTFVLDMAGS

Sequences:

>Translated_783_residues
MGFKVAARTILELGAELISTDAIALYELIKNSYDAGSKRATLDIHTVLKFSELRNFRQRLAAAQRLVQDEGADEDELVDR
LRAQLVDRLDSTAVQPALDAFQAALAAVDDLEELGEAVETQFEKLNYIDVIDTGEGMSLRDLREIFLTVGTTSRLHDTRG
RHFVGGKGIGRLSAMRLGDRLRVETARESDSAWNLLTIDWRNFTHESADTLDTIDVAPRRGPPKEQVDAHGTTLRVQALK
ADWDFERVKRLADRYFDRLFDPFSGRSRYPLVIRVNGAKVPVPTFDRDVLEEAQASVSIRYIVSPEPQLTLDINYITRGR
PKVEVWSRDDILGITAHEDVSVAALESLGPFRADFHWFNRQRLKAIEGYGDREKVKDTVNNWANGLLMYRDGFRVNPYGN
PDDDWLGLDAKALGSGGYKVNRKQIIGAVYISAEDNPSLIDQTNREGLRANEEKSLLVLLLRKAITENFKTFLNDVEKEL
RKSTRIDATETAAYLDQISKRVARSLKTLHSLVPRENEEEVEFLEETFDELQGRLADAKASIANAEKDQRDLVDLAGVGL
QVEIVAHELGRVTRRTLDLIKTLQGVDLPPRAQSTFGSIESQMLVIRKRLDVLDPLGPSSRNAKAKTDLKELVEQVFDAH
VDQFSRYGIDHVLRVYPRSTRSFTKRVVRGMIVQVLENLIDNAVFWLRQRSRADPDFEPRIEIEIDVDDDEIRVTDNGPG
IPVDRREEIFKPFVSFKPPGEGKGLGLFISREIARRHSSDLYLQEGADTTGRLHTFVLDMAGS
>Mature_782_residues
GFKVAARTILELGAELISTDAIALYELIKNSYDAGSKRATLDIHTVLKFSELRNFRQRLAAAQRLVQDEGADEDELVDRL
RAQLVDRLDSTAVQPALDAFQAALAAVDDLEELGEAVETQFEKLNYIDVIDTGEGMSLRDLREIFLTVGTTSRLHDTRGR
HFVGGKGIGRLSAMRLGDRLRVETARESDSAWNLLTIDWRNFTHESADTLDTIDVAPRRGPPKEQVDAHGTTLRVQALKA
DWDFERVKRLADRYFDRLFDPFSGRSRYPLVIRVNGAKVPVPTFDRDVLEEAQASVSIRYIVSPEPQLTLDINYITRGRP
KVEVWSRDDILGITAHEDVSVAALESLGPFRADFHWFNRQRLKAIEGYGDREKVKDTVNNWANGLLMYRDGFRVNPYGNP
DDDWLGLDAKALGSGGYKVNRKQIIGAVYISAEDNPSLIDQTNREGLRANEEKSLLVLLLRKAITENFKTFLNDVEKELR
KSTRIDATETAAYLDQISKRVARSLKTLHSLVPRENEEEVEFLEETFDELQGRLADAKASIANAEKDQRDLVDLAGVGLQ
VEIVAHELGRVTRRTLDLIKTLQGVDLPPRAQSTFGSIESQMLVIRKRLDVLDPLGPSSRNAKAKTDLKELVEQVFDAHV
DQFSRYGIDHVLRVYPRSTRSFTKRVVRGMIVQVLENLIDNAVFWLRQRSRADPDFEPRIEIEIDVDDDEIRVTDNGPGI
PVDRREEIFKPFVSFKPPGEGKGLGLFISREIARRHSSDLYLQEGADTTGRLHTFVLDMAGS

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 88432; Mature: 88301

Theoretical pI: Translated: 5.21; Mature: 5.21

Prosite motif: PS50109 HIS_KIN ; PS00758 ARGE_DAPE_CPG2_1

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.0 %Cys     (Translated Protein)
0.9 %Met     (Translated Protein)
0.9 %Cys+Met (Translated Protein)
0.0 %Cys     (Mature Protein)
0.8 %Met     (Mature Protein)
0.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MGFKVAARTILELGAELISTDAIALYELIKNSYDAGSKRATLDIHTVLKFSELRNFRQRL
CCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEHHHHHHHHHHHHHHHHHH
AAAQRLVQDEGADEDELVDRLRAQLVDRLDSTAVQPALDAFQAALAAVDDLEELGEAVET
HHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
QFEKLNYIDVIDTGEGMSLRDLREIFLTVGTTSRLHDTRGRHFVGGKGIGRLSAMRLGDR
HHHHCCCEEEEECCCCCCHHHHHHHHHHHCCCHHHHHCCCCEEECCCCCCHHHHHHCCCH
LRVETARESDSAWNLLTIDWRNFTHESADTLDTIDVAPRRGPPKEQVDAHGTTLRVQALK
HEEEECCCCCCCCCEEEEECCCCCCCCCCCCHHHCCCCCCCCCHHHHCCCCCEEEEEEEC
ADWDFERVKRLADRYFDRLFDPFSGRSRYPLVIRVNGAKVPVPTFDRDVLEEAQASVSIR
CCCCHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCCCCCCCCHHHHHHHHHCEEEE
YIVSPEPQLTLDINYITRGRPKVEVWSRDDILGITAHEDVSVAALESLGPFRADFHWFNR
EEECCCCCEEEEEEEEECCCCCEEEECCCCEEEEECCCCCHHHHHHHCCCCHHHHHHHHH
QRLKAIEGYGDREKVKDTVNNWANGLLMYRDGFRVNPYGNPDDDWLGLDAKALGSGGYKV
HHHHHHHCCCCHHHHHHHHHHHHCCEEEEECCEEECCCCCCCCCEECCCHHHHCCCCCEE
NRKQIIGAVYISAEDNPSLIDQTNREGLRANEEKSLLVLLLRKAITENFKTFLNDVEKEL
CCEEEEEEEEEECCCCCHHHCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHH
RKSTRIDATETAAYLDQISKRVARSLKTLHSLVPRENEEEVEFLEETFDELQGRLADAKA
HHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHHHH
SIANAEKDQRDLVDLAGVGLQVEIVAHELGRVTRRTLDLIKTLQGVDLPPRAQSTFGSIE
HHHCCCHHHHHHHHHHCCCEEEEHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHH
SQMLVIRKRLDVLDPLGPSSRNAKAKTDLKELVEQVFDAHVDQFSRYGIDHVLRVYPRST
HHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCHHHHHHHCCCCH
RSFTKRVVRGMIVQVLENLIDNAVFWLRQRSRADPDFEPRIEIEIDVDDDEIRVTDNGPG
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCEEEEECCCCC
IPVDRREEIFKPFVSFKPPGEGKGLGLFISREIARRHSSDLYLQEGADTTGRLHTFVLDM
CCCCCHHHHHHHHHCCCCCCCCCCEEEEEEHHHHHHCCCCEEEECCCCCCCCEEEEEEEC
AGS
CCC
>Mature Secondary Structure 
GFKVAARTILELGAELISTDAIALYELIKNSYDAGSKRATLDIHTVLKFSELRNFRQRL
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEHHHHHHHHHHHHHHHHHH
AAAQRLVQDEGADEDELVDRLRAQLVDRLDSTAVQPALDAFQAALAAVDDLEELGEAVET
HHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
QFEKLNYIDVIDTGEGMSLRDLREIFLTVGTTSRLHDTRGRHFVGGKGIGRLSAMRLGDR
HHHHCCCEEEEECCCCCCHHHHHHHHHHHCCCHHHHHCCCCEEECCCCCCHHHHHHCCCH
LRVETARESDSAWNLLTIDWRNFTHESADTLDTIDVAPRRGPPKEQVDAHGTTLRVQALK
HEEEECCCCCCCCCEEEEECCCCCCCCCCCCHHHCCCCCCCCCHHHHCCCCCEEEEEEEC
ADWDFERVKRLADRYFDRLFDPFSGRSRYPLVIRVNGAKVPVPTFDRDVLEEAQASVSIR
CCCCHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCCCCCCCCHHHHHHHHHCEEEE
YIVSPEPQLTLDINYITRGRPKVEVWSRDDILGITAHEDVSVAALESLGPFRADFHWFNR
EEECCCCCEEEEEEEEECCCCCEEEECCCCEEEEECCCCCHHHHHHHCCCCHHHHHHHHH
QRLKAIEGYGDREKVKDTVNNWANGLLMYRDGFRVNPYGNPDDDWLGLDAKALGSGGYKV
HHHHHHHCCCCHHHHHHHHHHHHCCEEEEECCEEECCCCCCCCCEECCCHHHHCCCCCEE
NRKQIIGAVYISAEDNPSLIDQTNREGLRANEEKSLLVLLLRKAITENFKTFLNDVEKEL
CCEEEEEEEEEECCCCCHHHCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHH
RKSTRIDATETAAYLDQISKRVARSLKTLHSLVPRENEEEVEFLEETFDELQGRLADAKA
HHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHHHH
SIANAEKDQRDLVDLAGVGLQVEIVAHELGRVTRRTLDLIKTLQGVDLPPRAQSTFGSIE
HHHCCCHHHHHHHHHHCCCEEEEHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHH
SQMLVIRKRLDVLDPLGPSSRNAKAKTDLKELVEQVFDAHVDQFSRYGIDHVLRVYPRST
HHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCHHHHHHHCCCCH
RSFTKRVVRGMIVQVLENLIDNAVFWLRQRSRADPDFEPRIEIEIDVDDDEIRVTDNGPG
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCEEEEECCCCC
IPVDRREEIFKPFVSFKPPGEGKGLGLFISREIARRHSSDLYLQEGADTTGRLHTFVLDM
CCCCCHHHHHHHHHCCCCCCCCCCEEEEEEHHHHHHCCCCEEEECCCCCCCCEEEEEEEC
AGS
CCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA