BacMap

Definition	Clostridium acetobutylicum ATCC 824 plasmid pSOL1, complete sequence.
Accession	NC_001988
Length	192,000

Click here to switch to the map view.

The map label for this gene is Not Available

Identifier: 15004824

GI number: 15004824

Start: 131085

End: 132716

Strand: Direct

Name: Not Available

Synonym: CA_P0121

Alternate gene names: NA

Gene position: 131085-132716 (Clockwise)

Preceding gene: 15004814

Following gene: 15004826

Centisome position: 68.27

GC content: 26.78

Gene sequence:

>1632_bases
ATGGGTATATTAATTAATAGCATTATAGATAAACTCAAACAATATAAACCCAAAAGTTATATTAACAACAAAAATATAAC
AACTATTGAATCTGTAAAATATCTAGATAACAATATTAAGTATTTTCACTCAAACACACTGTATGTTGGTGAATTATCAA
AGTTCGCAGTAAGTAATCTAATCTTGCACCAAACTAATTTCTTAATTATTTCTAAACTTCAAATGCCATTTCCTATTAAA
ACCAATAAGAACATAAACATAGTTCTTATAAATGAAGATTTTACATTATCTATGTTCAACAAGATTCTAGATATTTTTTT
TCAATATCAAAATATAGATACTAATTCTTTAAGACTACTAGAGGTACTTTCCAAAAACACTGGTTTACAAAACATTATTA
ATAGTGCCTCAAAGCTTCTTGGAAATCCTGCTTATATCAGCAACACAAACTTTAAAATTCTATCATTTACAGAAGGCATT
AAATTAGATCACCCCTTATGGCAAGACGTTGCATTAAAGGGCTATCAGCAATATGAAAGTTTGCAAAGTCTTCTAACTGA
TGCAATATTAGATGCAAAAATACCAATTTATTTTAAATCAACAAACAATAAAAATAGATATACTATTGATTATAGTAATA
ATAGAGAAGGTAAGTTAAGACCAAATTCTAAATCTATTATATATAAAGAAAATAATAAATTTACTATATCTCGAATATGG
TCAAACATATATGCGGGCAACAAGCTTTTAGGTCAATTTATAGTACTTGAAGCCTTTAAGCCATTTACAGAGAGTGATAT
AAGGTTAATCAAACTTTTAAGTAATGCAATTTCAATAGAACTTCAAAAACATAAATACTATGAGAGCACAAATATAACCA
ATGAAGAATTGCTACTATTACAACTACTTGATGGTAAAATAGTTAACCGTGAAGCTCTTGATGAAAACATTAAATTTGCA
CATTGTACCTTTAAATATCCTCTTAACCTTATAGGAATCATTAATAAAAATTCTATCTCATACATTCAGTTCAGCTACAT
AAAAACCTTTTTTAAAAAGATATTTCATGATTCTATCTGTGTTTTGTATAAAGGAAATATAGTTATAGTCGCTAGCTATG
TCCAGGATAAAACCTTGTATGAGACTTGCTTTAAAAAATTAAATAAGGTTTTAAAAGATCTAGACATGCTTTGTGGAATT
AGTCGTCCATTCTATAATTTACTTGACATTAATAAATACTATAATCAGTCACTTAAATCAATAGAACTCGGACGTCATTT
AACTAATAATAAATTTATTTTTTTCTATGATTCCTATATTTTGCAGCATATCTTTTCTCTATGCTCCAGTGAAGAATCCC
TTAAAGATTTTTGTCACCCTTCAATCTTTAAACTTATCACCTATGATAGTGTGTATAAAACAGATTACCTAAAGAACCTA
TATTTATATGTAATGAATTTTAAAAACCAGTCAAAGCTTGCAGAATTAATGCATGTACATAGAAATACTCTACACTACAG
AATTTCTAAAATAGAAGAAATAATGAATGTGGACTTAAATAATGTAGATGAATTTTTTAGCATTTATTTATCCCTAAAGA
TACTAGAATACCTTGGTGAATGCTTAATATGA

Upstream 100 bases:

>100_bases
CGCAATGTGCATGTACTTAAACTAAAACTTTTAATATTTATGCATGTGCACAAAAGTATAAAGAACAATTATTATGAATT
GTTAAAACAGGAGGTAACCT

Downstream 100 bases:

>100_bases
GTTGAATAACAAAAATAGTGCCCTCTAATTAAGAAGGCACTATTCTTCAGTAACATTTTATTACATTACTTTTTCTATAA
AAACCTTTAATGCATCTTTC

Product: hypothetical protein

Products: NA

Alternate protein names: Transcriptional Regulator; Transcriptional Regulator PucR Family; CdaR Family Transcriptional Regulator; PucR Family Transcriptional Regulator; Regulatory Protein

Number of amino acids: Translated: 543; Mature: 542

Protein sequence:

>543_residues
MGILINSIIDKLKQYKPKSYINNKNITTIESVKYLDNNIKYFHSNTLYVGELSKFAVSNLILHQTNFLIISKLQMPFPIK
TNKNINIVLINEDFTLSMFNKILDIFFQYQNIDTNSLRLLEVLSKNTGLQNIINSASKLLGNPAYISNTNFKILSFTEGI
KLDHPLWQDVALKGYQQYESLQSLLTDAILDAKIPIYFKSTNNKNRYTIDYSNNREGKLRPNSKSIIYKENNKFTISRIW
SNIYAGNKLLGQFIVLEAFKPFTESDIRLIKLLSNAISIELQKHKYYESTNITNEELLLLQLLDGKIVNREALDENIKFA
HCTFKYPLNLIGIINKNSISYIQFSYIKTFFKKIFHDSICVLYKGNIVIVASYVQDKTLYETCFKKLNKVLKDLDMLCGI
SRPFYNLLDINKYYNQSLKSIELGRHLTNNKFIFFYDSYILQHIFSLCSSEESLKDFCHPSIFKLITYDSVYKTDYLKNL
YLYVMNFKNQSKLAELMHVHRNTLHYRISKIEEIMNVDLNNVDEFFSIYLSLKILEYLGECLI

Sequences:

>Translated_543_residues
MGILINSIIDKLKQYKPKSYINNKNITTIESVKYLDNNIKYFHSNTLYVGELSKFAVSNLILHQTNFLIISKLQMPFPIK
TNKNINIVLINEDFTLSMFNKILDIFFQYQNIDTNSLRLLEVLSKNTGLQNIINSASKLLGNPAYISNTNFKILSFTEGI
KLDHPLWQDVALKGYQQYESLQSLLTDAILDAKIPIYFKSTNNKNRYTIDYSNNREGKLRPNSKSIIYKENNKFTISRIW
SNIYAGNKLLGQFIVLEAFKPFTESDIRLIKLLSNAISIELQKHKYYESTNITNEELLLLQLLDGKIVNREALDENIKFA
HCTFKYPLNLIGIINKNSISYIQFSYIKTFFKKIFHDSICVLYKGNIVIVASYVQDKTLYETCFKKLNKVLKDLDMLCGI
SRPFYNLLDINKYYNQSLKSIELGRHLTNNKFIFFYDSYILQHIFSLCSSEESLKDFCHPSIFKLITYDSVYKTDYLKNL
YLYVMNFKNQSKLAELMHVHRNTLHYRISKIEEIMNVDLNNVDEFFSIYLSLKILEYLGECLI
>Mature_542_residues
GILINSIIDKLKQYKPKSYINNKNITTIESVKYLDNNIKYFHSNTLYVGELSKFAVSNLILHQTNFLIISKLQMPFPIKT
NKNINIVLINEDFTLSMFNKILDIFFQYQNIDTNSLRLLEVLSKNTGLQNIINSASKLLGNPAYISNTNFKILSFTEGIK
LDHPLWQDVALKGYQQYESLQSLLTDAILDAKIPIYFKSTNNKNRYTIDYSNNREGKLRPNSKSIIYKENNKFTISRIWS
NIYAGNKLLGQFIVLEAFKPFTESDIRLIKLLSNAISIELQKHKYYESTNITNEELLLLQLLDGKIVNREALDENIKFAH
CTFKYPLNLIGIINKNSISYIQFSYIKTFFKKIFHDSICVLYKGNIVIVASYVQDKTLYETCFKKLNKVLKDLDMLCGIS
RPFYNLLDINKYYNQSLKSIELGRHLTNNKFIFFYDSYILQHIFSLCSSEESLKDFCHPSIFKLITYDSVYKTDYLKNLY
LYVMNFKNQSKLAELMHVHRNTLHYRISKIEEIMNVDLNNVDEFFSIYLSLKILEYLGECLI

Specific function: Unknown

COG id: COG2508

COG function: function code TQ; Regulator of polyketide synthase expression

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 63552; Mature: 63420

Theoretical pI: Translated: 9.35; Mature: 9.35

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.3 %Cys     (Translated Protein)
1.3 %Met     (Translated Protein)
2.6 %Cys+Met (Translated Protein)
1.3 %Cys     (Mature Protein)
1.1 %Met     (Mature Protein)
2.4 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MGILINSIIDKLKQYKPKSYINNKNITTIESVKYLDNNIKYFHSNTLYVGELSKFAVSNL
CCEEHHHHHHHHHHCCCHHHCCCCCCEEHHHHHHHCCCCEEEECCEEEEECHHHHHHHHH
ILHQTNFLIISKLQMPFPIKTNKNINIVLINEDFTLSMFNKILDIFFQYQNIDTNSLRLL
HHCCCCEEEEEECCCCCCCCCCCCEEEEEECCCCHHHHHHHHHHHHHHHCCCCCCHHHHH
EVLSKNTGLQNIINSASKLLGNPAYISNTNFKILSFTEGIKLDHPLWQDVALKGYQQYES
HHHHCCCCHHHHHHHHHHHHCCCCEEECCCEEEEEEECCCCCCCCHHHHHHHHHHHHHHH
LQSLLTDAILDAKIPIYFKSTNNKNRYTIDYSNNREGKLRPNSKSIIYKENNKFTISRIW
HHHHHHHHHHCCCCEEEEECCCCCCEEEEEECCCCCCCCCCCCCEEEEECCCCEEHHHHH
SNIYAGNKLLGQFIVLEAFKPFTESDIRLIKLLSNAISIELQKHKYYESTNITNEELLLL
HHHHCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHEEEEHHHHEECCCCCCCHHEEEE
QLLDGKIVNREALDENIKFAHCTFKYPLNLIGIINKNSISYIQFSYIKTFFKKIFHDSIC
EECCCCEECHHHHCCCCEEEEEEEECCCEEEEEEECCCCCEEEHHHHHHHHHHHHCCCEE
VLYKGNIVIVASYVQDKTLYETCFKKLNKVLKDLDMLCGISRPFYNLLDINKYYNQSLKS
EEEECCEEEEEECCCCHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHH
IELGRHLTNNKFIFFYDSYILQHIFSLCSSEESLKDFCHPSIFKLITYDSVYKTDYLKNL
HHHCCCCCCCEEEEEEHHHHHHHHHHHHCCHHHHHHHCCHHHHHHHHHCHHHHHHHHHHE
YLYVMNFKNQSKLAELMHVHRNTLHYRISKIEEIMNVDLNNVDEFFSIYLSLKILEYLGE
EEEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHH
CLI
HCC
>Mature Secondary Structure 
GILINSIIDKLKQYKPKSYINNKNITTIESVKYLDNNIKYFHSNTLYVGELSKFAVSNL
CEEHHHHHHHHHHCCCHHHCCCCCCEEHHHHHHHCCCCEEEECCEEEEECHHHHHHHHH
ILHQTNFLIISKLQMPFPIKTNKNINIVLINEDFTLSMFNKILDIFFQYQNIDTNSLRLL
HHCCCCEEEEEECCCCCCCCCCCCEEEEEECCCCHHHHHHHHHHHHHHHCCCCCCHHHHH
EVLSKNTGLQNIINSASKLLGNPAYISNTNFKILSFTEGIKLDHPLWQDVALKGYQQYES
HHHHCCCCHHHHHHHHHHHHCCCCEEECCCEEEEEEECCCCCCCCHHHHHHHHHHHHHHH
LQSLLTDAILDAKIPIYFKSTNNKNRYTIDYSNNREGKLRPNSKSIIYKENNKFTISRIW
HHHHHHHHHHCCCCEEEEECCCCCCEEEEEECCCCCCCCCCCCCEEEEECCCCEEHHHHH
SNIYAGNKLLGQFIVLEAFKPFTESDIRLIKLLSNAISIELQKHKYYESTNITNEELLLL
HHHHCCHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHEEEEHHHHEECCCCCCCHHEEEE
QLLDGKIVNREALDENIKFAHCTFKYPLNLIGIINKNSISYIQFSYIKTFFKKIFHDSIC
EECCCCEECHHHHCCCCEEEEEEEECCCEEEEEEECCCCCEEEHHHHHHHHHHHHCCCEE
VLYKGNIVIVASYVQDKTLYETCFKKLNKVLKDLDMLCGISRPFYNLLDINKYYNQSLKS
EEEECCEEEEEECCCCHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHH
IELGRHLTNNKFIFFYDSYILQHIFSLCSSEESLKDFCHPSIFKLITYDSVYKTDYLKNL
HHHCCCCCCCEEEEEEHHHHHHHHHHHHCCHHHHHHHCCHHHHHHHHHCHHHHHHHHHHE
YLYVMNFKNQSKLAELMHVHRNTLHYRISKIEEIMNVDLNNVDEFFSIYLSLKILEYLGE
EEEEEECCCHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHH
CLI
HCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA