BacMap

Definition	Halothermothrix orenii H 168 chromosome, complete genome.
Accession	NC_011899
Length	2,578,146

Click here to switch to the map view.

The map label for this gene is cstA [H]

Identifier: 220931886

GI number: 220931886

Start: 1131283

End: 1132947

Strand: Direct

Name: cstA [H]

Synonym: Hore_10430

Alternate gene names: 220931886

Gene position: 1131283-1132947 (Clockwise)

Preceding gene: 220931885

Following gene: 220931887

Centisome position: 43.88

GC content: 39.34

Gene sequence:

>1665_bases
ATGAATTCTGCAGTAGTAGGACTTATTGCATTTTTTCTCTTATTTTTAGGTTATAAGTACTATGGTGGGTTAATAGAACG
TAAGGTAGTTAGACCGGATGATAGCAAAAAAACACCGGCCCACCGTCTTTATGATGGACAGGATTATAGTCCTGGTAAAA
AGTCTTTGTTGTTTGGACACCATTTCTCCTCAATTGCCGGGGCTGCCCCTATTATTGGACCTGTTGTTGCGGTTTATAAC
TTTGGATGGGGGTTGGGAGCTGTCTGGATTGTAGTTGGCGCTATTTTTATGGGAGCTGTTCACGATTATTTATCACTCAT
GGTCTCTGTAAGAAATGATGGTAACTCTATGGCAGATGTAGCCGGAAAGGTAATGGGTAAAAAATCCAAAAAGATGTTTG
CTATCTTTATGTGGATAACCCTGGTATTAATTATTACCGTATTTGGCTGGGTTGCTGCTAAAACCCTGGCTACTAAACCG
GAAATTGTACTACCTACCTTTTTGCTGTTACCTATTGCTATGTTGTTCGGGTTTGCTGTCTACAGGTTAAATGTACCTGT
CTCTGTAGGAACCATATCTGCTATATTGCTGCTACTGGGTAGTATATACCTGGGTTATAAAGTTCCTATATTATTACCTT
TTGCTTTAAAAACCAATATGATACTCTGGTTTACAGCTTTAATGGGGTATGCACTGGTTGCTTCGGTATTACCAGTATGG
TTACTTTTACAGCCGCGGGATTATTTAAGTACCTTTGTGTTGTTTATCGGTCTTGCCGTTGGAATAGCCGGCCTGCTTGT
AACCCATCCTGAAATTAACGCTCCGGTATTTACCGGTGTTATGTCAGGGCAGGGTCCTGTCTGGCCAACATTGATGGTTC
TGATTGCCTGTGGAGCTATTTCCGGTTTCCATTCTATTGTATCCGGTGGTACAACTTCTAAACAGCTTGATAAAGAAAGT
GATGGAAGGGTAATTGGTTATGGTGGTATGATTATGGAATCAGTTCTTGCTTTTATTGCTCTTCTTGCTGTCAGTGCCGG
ACTTTTCTGGAATCCCCCGGCTGGTATGGAGCAATTTGGTTTTAGAACTTTATTTGAACAAAAGGGCTGGATTGTGGCTT
TTGGGACCGGTTATGGACGTTTTGTAGAACCCTTTATAGGGATTTCTCTAGGAACATTATTTGCCATGACCATGTTAAAA
ACCTTTATTATGACATCACTAGATACTTCTACCCGTCTGGCCAGGTTTATATTTACAGAAACATTTGGTGAAAACTCTAA
TATCTTAAAAAATAAATGGGTAGCTTCATTTATTTCAATATTACCGGCATTTATACTTGGTGTAACTGGAAGCTGGCAGG
GTATATGGACACTTTTTGGTGCCTCAAACCAGTTGATAGCAGCATTATCTTTAATTGTAGTTTCGGCTTACCTTATCGGG
GTTAAAAAACCGGCAAAATACACCCTTATTCCGGCAGGCATTATGCTTATTACAACTATAGTTGCTTTATTATACAAGAT
TTATTCTGACCTGATATTAGCACCTGAACCCAAATACTTTATTGTTCTGGTAGCTTTAGTAATCTTGTATCTCGCCATTG
TAATGATGCGGGAAGCCAGGGATATCTTCTTTAATAAAAAAATAAACGTAGAAAACAATATGTAA

Upstream 100 bases:

>100_bases
ACAGTTTGTCCCCCTATTTTTACAATTTAGAGAAATTATATAGGTAATATCTTTGTTTTAAATTACAATTAAGGTGAAAT
ATAAAACGGGGGGGACATAA

Downstream 100 bases:

>100_bases
ATATATAAAAGACAAAATCATGTCTCAGGATACACCCCGGAATATTGATTCCGGGGTGTTTTATATGTGTGTCCTGTATG
CGTAAACAGCTTTACGGTGA

Product: carbon starvation protein CstA

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 554; Mature: 554

Protein sequence:

>554_residues
MNSAVVGLIAFFLLFLGYKYYGGLIERKVVRPDDSKKTPAHRLYDGQDYSPGKKSLLFGHHFSSIAGAAPIIGPVVAVYN
FGWGLGAVWIVVGAIFMGAVHDYLSLMVSVRNDGNSMADVAGKVMGKKSKKMFAIFMWITLVLIITVFGWVAAKTLATKP
EIVLPTFLLLPIAMLFGFAVYRLNVPVSVGTISAILLLLGSIYLGYKVPILLPFALKTNMILWFTALMGYALVASVLPVW
LLLQPRDYLSTFVLFIGLAVGIAGLLVTHPEINAPVFTGVMSGQGPVWPTLMVLIACGAISGFHSIVSGGTTSKQLDKES
DGRVIGYGGMIMESVLAFIALLAVSAGLFWNPPAGMEQFGFRTLFEQKGWIVAFGTGYGRFVEPFIGISLGTLFAMTMLK
TFIMTSLDTSTRLARFIFTETFGENSNILKNKWVASFISILPAFILGVTGSWQGIWTLFGASNQLIAALSLIVVSAYLIG
VKKPAKYTLIPAGIMLITTIVALLYKIYSDLILAPEPKYFIVLVALVILYLAIVMMREARDIFFNKKINVENNM

Sequences:

>Translated_554_residues
MNSAVVGLIAFFLLFLGYKYYGGLIERKVVRPDDSKKTPAHRLYDGQDYSPGKKSLLFGHHFSSIAGAAPIIGPVVAVYN
FGWGLGAVWIVVGAIFMGAVHDYLSLMVSVRNDGNSMADVAGKVMGKKSKKMFAIFMWITLVLIITVFGWVAAKTLATKP
EIVLPTFLLLPIAMLFGFAVYRLNVPVSVGTISAILLLLGSIYLGYKVPILLPFALKTNMILWFTALMGYALVASVLPVW
LLLQPRDYLSTFVLFIGLAVGIAGLLVTHPEINAPVFTGVMSGQGPVWPTLMVLIACGAISGFHSIVSGGTTSKQLDKES
DGRVIGYGGMIMESVLAFIALLAVSAGLFWNPPAGMEQFGFRTLFEQKGWIVAFGTGYGRFVEPFIGISLGTLFAMTMLK
TFIMTSLDTSTRLARFIFTETFGENSNILKNKWVASFISILPAFILGVTGSWQGIWTLFGASNQLIAALSLIVVSAYLIG
VKKPAKYTLIPAGIMLITTIVALLYKIYSDLILAPEPKYFIVLVALVILYLAIVMMREARDIFFNKKINVENNM
>Mature_554_residues
MNSAVVGLIAFFLLFLGYKYYGGLIERKVVRPDDSKKTPAHRLYDGQDYSPGKKSLLFGHHFSSIAGAAPIIGPVVAVYN
FGWGLGAVWIVVGAIFMGAVHDYLSLMVSVRNDGNSMADVAGKVMGKKSKKMFAIFMWITLVLIITVFGWVAAKTLATKP
EIVLPTFLLLPIAMLFGFAVYRLNVPVSVGTISAILLLLGSIYLGYKVPILLPFALKTNMILWFTALMGYALVASVLPVW
LLLQPRDYLSTFVLFIGLAVGIAGLLVTHPEINAPVFTGVMSGQGPVWPTLMVLIACGAISGFHSIVSGGTTSKQLDKES
DGRVIGYGGMIMESVLAFIALLAVSAGLFWNPPAGMEQFGFRTLFEQKGWIVAFGTGYGRFVEPFIGISLGTLFAMTMLK
TFIMTSLDTSTRLARFIFTETFGENSNILKNKWVASFISILPAFILGVTGSWQGIWTLFGASNQLIAALSLIVVSAYLIG
VKKPAKYTLIPAGIMLITTIVALLYKIYSDLILAPEPKYFIVLVALVILYLAIVMMREARDIFFNKKINVENNM

Specific function: Peptide Utilization During Carbon Starvation. [C]

COG id: COG1966

COG function: function code T; Carbon starvation protein, predicted membrane protein

Gene ontology:

Cell location: Cell membrane; Multi-pass membrane protein (Potential) [H]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the CstA family [H]

Homologues:

Organism=Escherichia coli, GI1786814, Length=573, Percent_Identity=32.8097731239092, Blast_Score=253, Evalue=3e-68,
Organism=Escherichia coli, GI87082431, Length=359, Percent_Identity=40.1114206128134, Blast_Score=234, Evalue=7e-63,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003706 [H]

Pfam domain/function: PF02554 CstA [H]

EC number: NA

Molecular weight: Translated: 60356; Mature: 60356

Theoretical pI: Translated: 10.02; Mature: 10.02

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.2 %Cys     (Translated Protein)
4.0 %Met     (Translated Protein)
4.2 %Cys+Met (Translated Protein)
0.2 %Cys     (Mature Protein)
4.0 %Met     (Mature Protein)
4.2 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MNSAVVGLIAFFLLFLGYKYYGGLIERKVVRPDDSKKTPAHRLYDGQDYSPGKKSLLFGH
CCCHHHHHHHHHHHHHHHHHHCHHHHCCCCCCCCCCCCCHHHCCCCCCCCCCCCCEEECC
HFSSIAGAAPIIGPVVAVYNFGWGLGAVWIVVGAIFMGAVHDYLSLMVSVRNDGNSMADV
HHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHH
AGKVMGKKSKKMFAIFMWITLVLIITVFGWVAAKTLATKPEIVLPTFLLLPIAMLFGFAV
HHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHH
YRLNVPVSVGTISAILLLLGSIYLGYKVPILLPFALKTNMILWFTALMGYALVASVLPVW
HHEECCEEHHHHHHHHHHHHHHHHCCCCHHEEEHHHHHHHHHHHHHHHHHHHHHHHHHHH
LLLQPRDYLSTFVLFIGLAVGIAGLLVTHPEINAPVFTGVMSGQGPVWPTLMVLIACGAI
HHCCCHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHEECCCCCHHHHHHHHHHHHHH
SGFHSIVSGGTTSKQLDKESDGRVIGYGGMIMESVLAFIALLAVSAGLFWNPPAGMEQFG
HHHHHHHCCCCCHHHCCCCCCCCEEEECHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHH
FRTLFEQKGWIVAFGTGYGRFVEPFIGISLGTLFAMTMLKTFIMTSLDTSTRLARFIFTE
HHHHHHCCCCEEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHH
TFGENSNILKNKWVASFISILPAFILGVTGSWQGIWTLFGASNQLIAALSLIVVSAYLIG
HCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHEECCCHHHHHHHHHHHHHHHHHH
VKKPAKYTLIPAGIMLITTIVALLYKIYSDLILAPEPKYFIVLVALVILYLAIVMMREAR
CCCCCCEEEEHHHHHHHHHHHHHHHHHHHCCEECCCCHHHHHHHHHHHHHHHHHHHHHHH
DIFFNKKINVENNM
HHHHCCEECCCCCC
>Mature Secondary Structure
MNSAVVGLIAFFLLFLGYKYYGGLIERKVVRPDDSKKTPAHRLYDGQDYSPGKKSLLFGH
CCCHHHHHHHHHHHHHHHHHHCHHHHCCCCCCCCCCCCCHHHCCCCCCCCCCCCCEEECC
HFSSIAGAAPIIGPVVAVYNFGWGLGAVWIVVGAIFMGAVHDYLSLMVSVRNDGNSMADV
HHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHH
AGKVMGKKSKKMFAIFMWITLVLIITVFGWVAAKTLATKPEIVLPTFLLLPIAMLFGFAV
HHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHH
YRLNVPVSVGTISAILLLLGSIYLGYKVPILLPFALKTNMILWFTALMGYALVASVLPVW
HHEECCEEHHHHHHHHHHHHHHHHCCCCHHEEEHHHHHHHHHHHHHHHHHHHHHHHHHHH
LLLQPRDYLSTFVLFIGLAVGIAGLLVTHPEINAPVFTGVMSGQGPVWPTLMVLIACGAI
HHCCCHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHEECCCCCHHHHHHHHHHHHHH
SGFHSIVSGGTTSKQLDKESDGRVIGYGGMIMESVLAFIALLAVSAGLFWNPPAGMEQFG
HHHHHHHCCCCCHHHCCCCCCCCEEEECHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHH
FRTLFEQKGWIVAFGTGYGRFVEPFIGISLGTLFAMTMLKTFIMTSLDTSTRLARFIFTE
HHHHHHCCCCEEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHH
TFGENSNILKNKWVASFISILPAFILGVTGSWQGIWTLFGASNQLIAALSLIVVSAYLIG
HCCCCCCHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHEECCCHHHHHHHHHHHHHHHHHH
VKKPAKYTLIPAGIMLITTIVALLYKIYSDLILAPEPKYFIVLVALVILYLAIVMMREAR
CCCCCCEEEEHHHHHHHHHHHHHHHHHHHCCEECCCCHHHHHHHHHHHHHHHHHHHHHHH
DIFFNKKINVENNM
HHHHCCEECCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 9537320 [H]