BacMap

Definition	Rhizobium etli CFN 42 plasmid p42f, complete sequence.
Accession	NC_007766
Length	642,517

Click here to switch to the map view.

The map label for this gene is ygbK [C]

Identifier: 86360775

GI number: 86360775

Start: 41679

End: 43013

Strand: Reverse

Name: ygbK [C]

Synonym: RHE_PF00041

Alternate gene names: 86360775

Gene position: 43013-41679 (Counterclockwise)

Preceding gene: 86360776

Following gene: 86360774

Centisome position: 6.69

GC content: 66.52

Gene sequence:

>1335_bases
ATGGATGGAGTTCTCGTCAGCTATTACGGGGATGATTTCACCGGCTCCACCGACGTCATGGAGGCGCTCGCCTCGAACGG
CGTCGAGACCGTGCTCTTCCTCGACCTTCCCAGGCCGGAGCTGCTTGCCCGTTTCAGCCACTGCCGCGCCATCGGCATTG
CCGGAACGAGCCGCAGCGAGACGCCGGCATGGATGGAGGAGCACCTTGCGCCGGCCTTCGACTGGCTGAAATCGCTCGGC
GCTTCGATCTGCCATTACAAGGTCTGCTCGACGTTCGATTCCAGCCCCGGCATCGGCAATATTGGCAAGGCGATCGAGAT
CGGCCGCACGAGTTTCGGGCAATCGATCGTGCCTGTCATCGTCGGCGCGCCGCAATTGAAGCGCTACACCGCTTTCGGCA
ATCTTTTCGCCGCCTATCAGGGCCGCGTCTTCCGCATTGACCGCCATCCCGTGATGAGCCGCCATCCCGTCACGCCGATG
GATGAGGCGGATCTTGCGCTGCACCTGTCGAAGCAGACCTCGCTTCCCGTGCTGCTTGCCGATCTCGTCGCAATCACCGC
GGCCGATGCCGACCGGCGGATCGACGAGCTGGCGTCCCATCCGGACGGCATTCTGCTTCTCGATGTCGACTCCGAGGCGA
CGCAGGCGGCAGCCGGGCGACAGATGCTGCGTGTCGCCGCCCGCTCGGGAGGCTTCGTCGCCGGCTCCTCGGGGGTCGAA
TACGCCCTGCTCAACGCCTGGCGGCAGGCCGGCGCGATTGGCGGGGGCAGCGCCGAATTTCCCGATATCGGCCCGGTCGA
GCGGCTTGCCGTCGTCTCCGGCAGCGTCTCGCCGACGACCGAGCGCCAGATCCGCAAGGCCGTCGAAAATGGCTTCGAAA
GCATCGCACTCGATCCGCTTGCACTGGTCTCGAATGGAGAGGCTGCGGTGGATGCGGCGGTGCACGCGGGCATCCGGACG
CTGAAGGAAGGCCGGAGCGTCATCCTCCATACGGCGCTCGGCCCATCCGCTGACCGCGGCGCCGATATCGACCGGCTTCC
CGGCGCTCGCCACCAGCTCGGCAGCGCGCTCGGCACGATCCTGCGCAGGCTGATCGAGCAGGAAGCACTGCCGCGCGCGG
TCGTCGCCGGCGGCGATACGTCGAGCCACGCGCTGCGGCAATTGAAGATCGACGCGCTGACGACATTGCTGCCGCTGCCG
CAGACGCCGGGCTCGCCGCTTTGCCTTGCGCATGGCGACTACCAGCCGACCAACGGTCTGCAGATCGCGCTGAAGGGCGG
GCAGGTCGGCACGGATGGCTATTTCGCGCAGATCCGCGACGGGAGGAAGAACTGA

Upstream 100 bases:

>100_bases
CGGCGGTCGCCGGCATTCCGCTGGAGGTCTATGCCAAGGATCATCCGGAGCTTGCCGCCTCGATTGCCAAATTCAGCGAC
GGCAAGGGCGCGTGACGGCG

Downstream 100 bases:

>100_bases
GATGGTCGTCTGGGTCGGCACCAGCTTCAAGATGAACAAGACGCTTGAGGAAGCGCTCGCCTTCGCGCGCCGCCTCGCCG
ATGCGGATCTTGAACGCGAT

Product: hypothetical protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 444; Mature: 444

Protein sequence:

>444_residues
MDGVLVSYYGDDFTGSTDVMEALASNGVETVLFLDLPRPELLARFSHCRAIGIAGTSRSETPAWMEEHLAPAFDWLKSLG
ASICHYKVCSTFDSSPGIGNIGKAIEIGRTSFGQSIVPVIVGAPQLKRYTAFGNLFAAYQGRVFRIDRHPVMSRHPVTPM
DEADLALHLSKQTSLPVLLADLVAITAADADRRIDELASHPDGILLLDVDSEATQAAAGRQMLRVAARSGGFVAGSSGVE
YALLNAWRQAGAIGGGSAEFPDIGPVERLAVVSGSVSPTTERQIRKAVENGFESIALDPLALVSNGEAAVDAAVHAGIRT
LKEGRSVILHTALGPSADRGADIDRLPGARHQLGSALGTILRRLIEQEALPRAVVAGGDTSSHALRQLKIDALTTLLPLP
QTPGSPLCLAHGDYQPTNGLQIALKGGQVGTDGYFAQIRDGRKN

Sequences:

>Translated_444_residues
MDGVLVSYYGDDFTGSTDVMEALASNGVETVLFLDLPRPELLARFSHCRAIGIAGTSRSETPAWMEEHLAPAFDWLKSLG
ASICHYKVCSTFDSSPGIGNIGKAIEIGRTSFGQSIVPVIVGAPQLKRYTAFGNLFAAYQGRVFRIDRHPVMSRHPVTPM
DEADLALHLSKQTSLPVLLADLVAITAADADRRIDELASHPDGILLLDVDSEATQAAAGRQMLRVAARSGGFVAGSSGVE
YALLNAWRQAGAIGGGSAEFPDIGPVERLAVVSGSVSPTTERQIRKAVENGFESIALDPLALVSNGEAAVDAAVHAGIRT
LKEGRSVILHTALGPSADRGADIDRLPGARHQLGSALGTILRRLIEQEALPRAVVAGGDTSSHALRQLKIDALTTLLPLP
QTPGSPLCLAHGDYQPTNGLQIALKGGQVGTDGYFAQIRDGRKN
>Mature_444_residues
MDGVLVSYYGDDFTGSTDVMEALASNGVETVLFLDLPRPELLARFSHCRAIGIAGTSRSETPAWMEEHLAPAFDWLKSLG
ASICHYKVCSTFDSSPGIGNIGKAIEIGRTSFGQSIVPVIVGAPQLKRYTAFGNLFAAYQGRVFRIDRHPVMSRHPVTPM
DEADLALHLSKQTSLPVLLADLVAITAADADRRIDELASHPDGILLLDVDSEATQAAAGRQMLRVAARSGGFVAGSSGVE
YALLNAWRQAGAIGGGSAEFPDIGPVERLAVVSGSVSPTTERQIRKAVENGFESIALDPLALVSNGEAAVDAAVHAGIRT
LKEGRSVILHTALGPSADRGADIDRLPGARHQLGSALGTILRRLIEQEALPRAVVAGGDTSSHALRQLKIDALTTLLPLP
QTPGSPLCLAHGDYQPTNGLQIALKGGQVGTDGYFAQIRDGRKN

Specific function: Unknown

COG id: COG3395

COG function: function code S; Uncharacterized protein conserved in bacteria

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: To E.coli ygbK [H]

Homologues:

Organism=Escherichia coli, GI1789093, Length=405, Percent_Identity=27.4074074074074, Blast_Score=75, Evalue=1e-14,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR010737 [H]

Pfam domain/function: PF07005 DUF1537 [H]

EC number: NA

Molecular weight: Translated: 46859; Mature: 46859

Theoretical pI: Translated: 6.24; Mature: 6.24

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.9 %Cys     (Translated Protein)
1.4 %Met     (Translated Protein)
2.3 %Cys+Met (Translated Protein)
0.9 %Cys     (Mature Protein)
1.4 %Met     (Mature Protein)
2.3 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MDGVLVSYYGDDFTGSTDVMEALASNGVETVLFLDLPRPELLARFSHCRAIGIAGTSRSE
CCCEEEEECCCCCCCHHHHHHHHHCCCCEEEEEEECCCHHHHHHHHHHCEEEECCCCCCC
TPAWMEEHLAPAFDWLKSLGASICHYKVCSTFDSSPGIGNIGKAIEIGRTSFGQSIVPVI
CHHHHHHHCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHCCHHCCCCCHHHE
VGAPQLKRYTAFGNLFAAYQGRVFRIDRHPVMSRHPVTPMDEADLALHLSKQTSLPVLLA
ECCCHHHHHHHHHHHHHHHCCCEEEEECCCCCCCCCCCCCCCCCEEEEECCCCCCHHHHH
DLVAITAADADRRIDELASHPDGILLLDVDSEATQAAAGRQMLRVAARSGGFVAGSSGVE
HHHHHHHCCHHHHHHHHHCCCCCEEEEECCCHHHHHHHHHHHHHHHHHCCCEEECCCCCH
YALLNAWRQAGAIGGGSAEFPDIGPVERLAVVSGSVSPTTERQIRKAVENGFESIALDPL
HHHHHHHHHHCCCCCCCCCCCCCCCHHHHHHHCCCCCCHHHHHHHHHHHCCHHHHCCCCE
ALVSNGEAAVDAAVHAGIRTLKEGRSVILHTALGPSADRGADIDRLPGARHQLGSALGTI
EEECCCCHHHHHHHHHHHHHHHCCCEEEEEECCCCCCCCCCCCHHCCCHHHHHHHHHHHH
LRRLIEQEALPRAVVAGGDTSSHALRQLKIDALTTLLPLPQTPGSPLCLAHGDYQPTNGL
HHHHHHHHCCCCEEEECCCCHHHHHHHHHHHHHHHHHCCCCCCCCCEEEECCCCCCCCCE
QIALKGGQVGTDGYFAQIRDGRKN
EEEEECCEECCCCCEEEECCCCCC
>Mature Secondary Structure
MDGVLVSYYGDDFTGSTDVMEALASNGVETVLFLDLPRPELLARFSHCRAIGIAGTSRSE
CCCEEEEECCCCCCCHHHHHHHHHCCCCEEEEEEECCCHHHHHHHHHHCEEEECCCCCCC
TPAWMEEHLAPAFDWLKSLGASICHYKVCSTFDSSPGIGNIGKAIEIGRTSFGQSIVPVI
CHHHHHHHCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHCCHHCCCCCHHHE
VGAPQLKRYTAFGNLFAAYQGRVFRIDRHPVMSRHPVTPMDEADLALHLSKQTSLPVLLA
ECCCHHHHHHHHHHHHHHHCCCEEEEECCCCCCCCCCCCCCCCCEEEEECCCCCCHHHHH
DLVAITAADADRRIDELASHPDGILLLDVDSEATQAAAGRQMLRVAARSGGFVAGSSGVE
HHHHHHHCCHHHHHHHHHCCCCCEEEEECCCHHHHHHHHHHHHHHHHHCCCEEECCCCCH
YALLNAWRQAGAIGGGSAEFPDIGPVERLAVVSGSVSPTTERQIRKAVENGFESIALDPL
HHHHHHHHHHCCCCCCCCCCCCCCCHHHHHHHCCCCCCHHHHHHHHHHHCCHHHHCCCCE
ALVSNGEAAVDAAVHAGIRTLKEGRSVILHTALGPSADRGADIDRLPGARHQLGSALGTI
EEECCCCHHHHHHHHHHHHHHHCCCEEEEEECCCCCCCCCCCCHHCCCHHHHHHHHHHHH
LRRLIEQEALPRAVVAGGDTSSHALRQLKIDALTTLLPLPQTPGSPLCLAHGDYQPTNGL
HHHHHHHHCCCCEEEECCCCHHHHHHHHHHHHHHHHHCCCCCCCCCEEEECCCCCCCCCE
QIALKGGQVGTDGYFAQIRDGRKN
EEEEECCEECCCCCEEEECCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 7542800 [H]