BacMap

Definition	Trichodesmium erythraeum IMS101 chromosome, complete genome.
Accession	NC_008312
Length	7,750,108

Click here to switch to the map view.

The map label for this gene is 113477430

Identifier: 113477430

GI number: 113477430

Start: 6176750

End: 6178288

Strand: Reverse

Name: 113477430

Synonym: Tery_3995

Alternate gene names: NA

Gene position: 6178288-6176750 (Counterclockwise)

Preceding gene: 113477431

Following gene: 113477429

Centisome position: 79.72

GC content: 39.05

Gene sequence:

>1539_bases
ATGTCAAACATTAGTCTTTTTCCAGCAAAATACCAAGAACTCAAAAACCATCTTCGAAAAATACAAAACTTAGAAAATGC
AGCCTCCATCCTAAATTGGGACCAAACAACTTATATGCCAAATGGAGGAAGTTATGCCAGAGGCCAACAAATAGCTACCC
TTAAAGAACTTGCCCATGAAAAACTTACCGACCCAACCATGGGTCAGCTACTCGAAGACCTCCGTTCCTACGAACAAAGC
TCTCCTTACGACTCTACCGAAGCTAGCCTGATCCGCGTTGCTCGTCGAGACTATGAGCGTGCTGTCCGAATTCCCTCAAA
ATTTATGGCAAAATTCTGCCAACATCAAGCTATCTCCTACGAAACATGGGTAAAAGCAAAGTTCCTCAAAGACTTCTCCA
TAGTACAACCCTACCTAGAAAAAACATTAGAACTAAGTCAGGAACTAGCCAGCTTTTTCCCCTACAAACATATTGCCGAT
CCACTGATCGACCTTGTAGACGAAGGCATGACAGTTTCCATTCTTCGTCCTCTATTTAGCAAACTGCGCCAAAAATTACG
ACCCATTGTTGAAGCCATCACCGACACCCCACCCATAGACGACTCTTGTCTCCATCAATATTATTCAAGAGAACAACAAC
TAAACTTTGGGTATATTGTGATCAAACGTATTGGCTTCGACTTTCAACGGGGCAGACTTGATGTAACACCTCACCCCTTT
ACCTCCAGCTTTTCTATTGGAGATGTTCGTATTACCACCCGTATCTACGAAAATAACTTTAGCGAAGGCCTATTTAGTAC
CATCCATGAAGCCGGCCATGCTCTTTATGAACAAGGTATCGGTACAGAATTAGAAGGTACACTCCTTGCCGGAGGAATTT
CTAGTGGTATCCATGAAAGCCAATCTAGATTGTGGGAGAATATAGTAGCTCGTAGTCGTGGGTTTTGGGAATGTTTTTAT
CCTCAGCTACAAGGGACTTTTCTAAAACAACTTAGCTCTACCTCTGTTTCCAAATTTTATCAGGCTATTAATAGAGTTGC
AAAATCAGCTATCCGTACTGATGCTGATGAAGTTACATACAATCTTCATATTATGATTAGGTTTGATTTAGAGTTAGCTA
TGTTGGAAGGAAAGTTAGCTGTTAAAGACCTTCCTGAAGCTTGGAATGAACTTTATAAAAAAGATTTAGGTCTTGTTCCT
GCCAATAATAGTGAAGGAGTAATGCAAGATGTACATTGGTATGGTGAAATGATTGGCGGAATGTTTCAAGGTTATACTCT
AGGCAACTTAATAGCTGCTCAAATTTATCAAGCAGCAATTAAATATAATCCAGAAATTCCTGTTGGTATTGAACAAGGTA
ATTTTGATCTTTTACGCCAATGGTTGAAACAAAATATTCATCAACATGGCCGCAAATACACTGCTAATGAATTAATTTAT
CGCATCACAGGTAAACCTTTAAGTATTGATCCATTTATTGATTACATTCAAGATAAATATAGCAATATGTATCATATGAA
AGTTCCAATATCTGCTTAA

Upstream 100 bases:

>100_bases
TGCTAGGAATATTAATTAATACTAAAAATTATATCCTCTAACCCCTCCTAATAAGCAAAACATGAAATAAAATTTTAATC
CATAACATTACTTCATAATT

Downstream 100 bases:

>100_bases
AGAAAAGTTATCATTAAAACAGGTAATTAAAGCTTCAATTAAAATTTTTGCAAGCTTAAGTACCTGTACTAAATTAATGC
AAAACTAGCAAAAATTCACT

Product: carboxypeptidase

Products: NA

Alternate protein names: Carboxypeptidase Taq [H]

Number of amino acids: Translated: 512; Mature: 511

Protein sequence:

>512_residues
MSNISLFPAKYQELKNHLRKIQNLENAASILNWDQTTYMPNGGSYARGQQIATLKELAHEKLTDPTMGQLLEDLRSYEQS
SPYDSTEASLIRVARRDYERAVRIPSKFMAKFCQHQAISYETWVKAKFLKDFSIVQPYLEKTLELSQELASFFPYKHIAD
PLIDLVDEGMTVSILRPLFSKLRQKLRPIVEAITDTPPIDDSCLHQYYSREQQLNFGYIVIKRIGFDFQRGRLDVTPHPF
TSSFSIGDVRITTRIYENNFSEGLFSTIHEAGHALYEQGIGTELEGTLLAGGISSGIHESQSRLWENIVARSRGFWECFY
PQLQGTFLKQLSSTSVSKFYQAINRVAKSAIRTDADEVTYNLHIMIRFDLELAMLEGKLAVKDLPEAWNELYKKDLGLVP
ANNSEGVMQDVHWYGEMIGGMFQGYTLGNLIAAQIYQAAIKYNPEIPVGIEQGNFDLLRQWLKQNIHQHGRKYTANELIY
RITGKPLSIDPFIDYIQDKYSNMYHMKVPISA

Sequences:

>Translated_512_residues
MSNISLFPAKYQELKNHLRKIQNLENAASILNWDQTTYMPNGGSYARGQQIATLKELAHEKLTDPTMGQLLEDLRSYEQS
SPYDSTEASLIRVARRDYERAVRIPSKFMAKFCQHQAISYETWVKAKFLKDFSIVQPYLEKTLELSQELASFFPYKHIAD
PLIDLVDEGMTVSILRPLFSKLRQKLRPIVEAITDTPPIDDSCLHQYYSREQQLNFGYIVIKRIGFDFQRGRLDVTPHPF
TSSFSIGDVRITTRIYENNFSEGLFSTIHEAGHALYEQGIGTELEGTLLAGGISSGIHESQSRLWENIVARSRGFWECFY
PQLQGTFLKQLSSTSVSKFYQAINRVAKSAIRTDADEVTYNLHIMIRFDLELAMLEGKLAVKDLPEAWNELYKKDLGLVP
ANNSEGVMQDVHWYGEMIGGMFQGYTLGNLIAAQIYQAAIKYNPEIPVGIEQGNFDLLRQWLKQNIHQHGRKYTANELIY
RITGKPLSIDPFIDYIQDKYSNMYHMKVPISA
>Mature_511_residues
SNISLFPAKYQELKNHLRKIQNLENAASILNWDQTTYMPNGGSYARGQQIATLKELAHEKLTDPTMGQLLEDLRSYEQSS
PYDSTEASLIRVARRDYERAVRIPSKFMAKFCQHQAISYETWVKAKFLKDFSIVQPYLEKTLELSQELASFFPYKHIADP
LIDLVDEGMTVSILRPLFSKLRQKLRPIVEAITDTPPIDDSCLHQYYSREQQLNFGYIVIKRIGFDFQRGRLDVTPHPFT
SSFSIGDVRITTRIYENNFSEGLFSTIHEAGHALYEQGIGTELEGTLLAGGISSGIHESQSRLWENIVARSRGFWECFYP
QLQGTFLKQLSSTSVSKFYQAINRVAKSAIRTDADEVTYNLHIMIRFDLELAMLEGKLAVKDLPEAWNELYKKDLGLVPA
NNSEGVMQDVHWYGEMIGGMFQGYTLGNLIAAQIYQAAIKYNPEIPVGIEQGNFDLLRQWLKQNIHQHGRKYTANELIYR
ITGKPLSIDPFIDYIQDKYSNMYHMKVPISA

Specific function: Releases amino acids sequentially from the C-terminus with a broad substrate specificity (except for proline) [H]

COG id: COG2317

COG function: function code E; Zn-dependent carboxypeptidase

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Belongs to the peptidase M32 family [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR001333 [H]

Pfam domain/function: PF02074 Peptidase_M32 [H]

EC number: =3.4.17.19 [H]

Molecular weight: Translated: 58709; Mature: 58577

Theoretical pI: Translated: 6.76; Mature: 6.76

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.6 %Cys     (Translated Protein)
2.3 %Met     (Translated Protein)
2.9 %Cys+Met (Translated Protein)
0.6 %Cys     (Mature Protein)
2.2 %Met     (Mature Protein)
2.7 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSNISLFPAKYQELKNHLRKIQNLENAASILNWDQTTYMPNGGSYARGQQIATLKELAHE
CCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCEECCCCCCCCCCHHHHHHHHHHHH
KLTDPTMGQLLEDLRSYEQSSPYDSTEASLIRVARRDYERAVRIPSKFMAKFCQHQAISY
HCCCCHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHCCCH
ETWVKAKFLKDFSIVQPYLEKTLELSQELASFFPYKHIADPLIDLVDEGMTVSILRPLFS
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHCCCCHHHHHHHHHH
KLRQKLRPIVEAITDTPPIDDSCLHQYYSREQQLNFGYIVIKRIGFDFQRGRLDVTPHPF
HHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHCCCCCEEEEEHHCCCHHCCEECCCCCCC
TSSFSIGDVRITTRIYENNFSEGLFSTIHEAGHALYEQGIGTELEGTLLAGGISSGIHES
CCCCCCCCEEEEEEEHHCCCCHHHHHHHHHHHHHHHHHCCCCCCCCCEEECCHHHHHHHH
QSRLWENIVARSRGFWECFYPQLQGTFLKQLSSTSVSKFYQAINRVAKSAIRTDADEVTY
HHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHEEE
NLHIMIRFDLELAMLEGKLAVKDLPEAWNELYKKDLGLVPANNSEGVMQDVHWYGEMIGG
EEEEEEEECCEEEHHCCCHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHH
MFQGYTLGNLIAAQIYQAAIKYNPEIPVGIEQGNFDLLRQWLKQNIHQHGRKYTANELIY
HHCCCHHHHHHHHHHHHHHHHCCCCCCCEECCCCHHHHHHHHHHHHHHCCCCCCHHHHEE
RITGKPLSIDPFIDYIQDKYSNMYHMKVPISA
EECCCCCCCHHHHHHHHHHHCCEEEEEECCCC
>Mature Secondary Structure 
SNISLFPAKYQELKNHLRKIQNLENAASILNWDQTTYMPNGGSYARGQQIATLKELAHE
CCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCEECCCCCCCCCCHHHHHHHHHHHH
KLTDPTMGQLLEDLRSYEQSSPYDSTEASLIRVARRDYERAVRIPSKFMAKFCQHQAISY
HCCCCHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHCCCH
ETWVKAKFLKDFSIVQPYLEKTLELSQELASFFPYKHIADPLIDLVDEGMTVSILRPLFS
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHCCCCHHHHHHHHHH
KLRQKLRPIVEAITDTPPIDDSCLHQYYSREQQLNFGYIVIKRIGFDFQRGRLDVTPHPF
HHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHCCCCCEEEEEHHCCCHHCCEECCCCCCC
TSSFSIGDVRITTRIYENNFSEGLFSTIHEAGHALYEQGIGTELEGTLLAGGISSGIHES
CCCCCCCCEEEEEEEHHCCCCHHHHHHHHHHHHHHHHHCCCCCCCCCEEECCHHHHHHHH
QSRLWENIVARSRGFWECFYPQLQGTFLKQLSSTSVSKFYQAINRVAKSAIRTDADEVTY
HHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHEEE
NLHIMIRFDLELAMLEGKLAVKDLPEAWNELYKKDLGLVPANNSEGVMQDVHWYGEMIGG
EEEEEEEECCEEEHHCCCHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHH
MFQGYTLGNLIAAQIYQAAIKYNPEIPVGIEQGNFDLLRQWLKQNIHQHGRKYTANELIY
HHCCCHHHHHHHHHHHHHHHHCCCCCCCEECCCCHHHHHHHHHHHHHHCCCCCCHHHHEE
RITGKPLSIDPFIDYIQDKYSNMYHMKVPISA
EECCCCCCCHHHHHHHHHHHCCEEEEEECCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 7765282; 1369078 [H]