BacMap

Definition	Clostridium botulinum A2 str. Kyoto chromosome, complete genome.
Accession	NC_012563
Length	4,155,278

Click here to switch to the map view.

The map label for this gene is tdk [H]

Identifier: 226947359

GI number: 226947359

Start: 167869

End: 168444

Strand: Direct

Name: tdk [H]

Synonym: CLM_0179

Alternate gene names: 226947359

Gene position: 167869-168444 (Clockwise)

Preceding gene: 226947357

Following gene: 226947360

Centisome position: 4.04

GC content: 33.33

Gene sequence:

>576_bases
ATGTATGGTCCCAAAGATCATGGCTGGATTGAAGTAGTAGCAGGCCCTATGTATAGTGGAAAAACGGAAGAATTAATAAG
ACGAATAAGAAGAGCTGAAATTGCAAAGCAAAAAGTTCAAGTTTTTAAACCTGAAATAGATAACAGATATAGTAAACAAG
ATGTTGTGTCTCATGCAGGAGATAAAATTCAGTCAGTACCAGTTAAAAGTAGTAAAGAAATATTAGAAAAACTTTTAGAT
GATACAGATGTAATAGGTATAGATGAAGCACAATTTTTTGATGATTCTTTAGTTGAAATAGTAAGTAAAATAGCTAATAA
TAATAGAAGGGTTATTTGTGCAGGACTAGATATGGATTTTAAGGGAGAACCCTTTGGTCCAATGCCTAAACTTATGGCTA
TAGCAGAATTTGTAGATAAAATACAAGCTGTATGTATGGTTTGTAATAATCCAGCTACAAGAACCCAAAGACTTATAAAT
GGAAAGCCAGCAAAGAAATCTGACCCAGTAGTATTAATAGGGGCACAAGAGTCTTATGAAGCTAGATGTAGGAAGTGTCA
TTGTGTTCCAAGATAA

Upstream 100 bases:

>100_bases
GAATTAAATAATTATATGTAAATTTTACCTATAATAAATTCTTTATTATAACAATTAGTTTTGATAAAATATACTTGTTT
ATTAAAATGGAGGTGTTTTT

Downstream 100 bases:

>100_bases
GTAATGAGGTGATTAAGTGGGGAAAAGTACTAACGTTGGAGGACAAGCAGTTCTAGAAGGGGTAATGATGAGAGGAAAAA
ATGGTATAGCAACGGCAGTT

Product: thymidine kinase

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 191; Mature: 191

Protein sequence:

>191_residues
MYGPKDHGWIEVVAGPMYSGKTEELIRRIRRAEIAKQKVQVFKPEIDNRYSKQDVVSHAGDKIQSVPVKSSKEILEKLLD
DTDVIGIDEAQFFDDSLVEIVSKIANNNRRVICAGLDMDFKGEPFGPMPKLMAIAEFVDKIQAVCMVCNNPATRTQRLIN
GKPAKKSDPVVLIGAQESYEARCRKCHCVPR

Sequences:

>Translated_191_residues
MYGPKDHGWIEVVAGPMYSGKTEELIRRIRRAEIAKQKVQVFKPEIDNRYSKQDVVSHAGDKIQSVPVKSSKEILEKLLD
DTDVIGIDEAQFFDDSLVEIVSKIANNNRRVICAGLDMDFKGEPFGPMPKLMAIAEFVDKIQAVCMVCNNPATRTQRLIN
GKPAKKSDPVVLIGAQESYEARCRKCHCVPR
>Mature_191_residues
MYGPKDHGWIEVVAGPMYSGKTEELIRRIRRAEIAKQKVQVFKPEIDNRYSKQDVVSHAGDKIQSVPVKSSKEILEKLLD
DTDVIGIDEAQFFDDSLVEIVSKIANNNRRVICAGLDMDFKGEPFGPMPKLMAIAEFVDKIQAVCMVCNNPATRTQRLIN
GKPAKKSDPVVLIGAQESYEARCRKCHCVPR

Specific function: Phosphorylates Both Thymidine And Deoxyuridine. [C]

COG id: COG1435

COG function: function code F; Thymidine kinase

Gene ontology:

Cell location: Cytoplasm (Potential) [H]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the thymidine kinase family [H]

Homologues:

Organism=Homo sapiens, GI164698438, Length=183, Percent_Identity=39.8907103825137, Blast_Score=124, Evalue=5e-29,
Organism=Caenorhabditis elegans, GI17543396, Length=187, Percent_Identity=33.6898395721925, Blast_Score=97, Evalue=7e-21,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR001267
- InterPro:   IPR020633
- InterPro:   IPR020634 [H]

Pfam domain/function: PF00265 TK [H]

EC number: =2.7.1.21 [H]

Molecular weight: Translated: 21432; Mature: 21432

Theoretical pI: Translated: 8.37; Mature: 8.37

Prosite motif: PS00603 TK_CELLULAR_TYPE

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

3.1 %Cys     (Translated Protein)
3.1 %Met     (Translated Protein)
6.3 %Cys+Met (Translated Protein)
3.1 %Cys     (Mature Protein)
3.1 %Met     (Mature Protein)
6.3 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MYGPKDHGWIEVVAGPMYSGKTEELIRRIRRAEIAKQKVQVFKPEIDNRYSKQDVVSHAG
CCCCCCCCEEEEEECCCCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHCC
DKIQSVPVKSSKEILEKLLDDTDVIGIDEAQFFDDSLVEIVSKIANNNRRVICAGLDMDF
CHHHCCCCCCHHHHHHHHHCCCCEECCCHHHHHHHHHHHHHHHHHCCCCEEEEEECCCCC
KGEPFGPMPKLMAIAEFVDKIQAVCMVCNNPATRTQRLINGKPAKKSDPVVLIGAQESYE
CCCCCCCHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHCCCCCCCCCCEEEEECCCCHH
ARCRKCHCVPR
HHHHHCCCCCC
>Mature Secondary Structure
MYGPKDHGWIEVVAGPMYSGKTEELIRRIRRAEIAKQKVQVFKPEIDNRYSKQDVVSHAG
CCCCCCCCEEEEEECCCCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHCC
DKIQSVPVKSSKEILEKLLDDTDVIGIDEAQFFDDSLVEIVSKIANNNRRVICAGLDMDF
CHHHCCCCCCHHHHHHHHHCCCCEECCCHHHHHHHHHHHHHHHHHCCCCEEEEEECCCCC
KGEPFGPMPKLMAIAEFVDKIQAVCMVCNNPATRTQRLINGKPAKKSDPVVLIGAQESYE
CCCCCCCHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHCCCCCCCCCCEEEEECCCCHH
ARCRKCHCVPR
HHHHHCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 10.0

TargetDB status: NA

Availability: NA

References: NA