BacMap

Definition	Prochlorococcus marinus str. NATL1A, complete genome.
Accession	NC_008819
Length	1,864,731

Click here to switch to the map view.

The map label for this gene is csoS2

Identifier: 124025317

GI number: 124025317

Start: 551232

End: 553622

Strand: Direct

Name: csoS2

Synonym: NATL1_06061

Alternate gene names: NA

Gene position: 551232-553622 (Clockwise)

Preceding gene: 124025316

Following gene: 124025318

Centisome position: 29.56

GC content: 41.95

Gene sequence:

>2391_bases
ATGGCAAAACAAACAAGTCGACAATTAGTTCTTGAACGCCGCCAGGCTCTTAGTCAAGGAGGCAAAAATGCATCTATTAA
AGGCGGCTCTACAGCTAATAGAGTCCGTTCTTCTGCTGATGCAAGAGCTACTAGGACAAACTCTGGTTTTGTGAAACCCA
ATAAATCTATGGCTAGTGCAAATAATTCTTCCTCTCAATCAAGTACTAGTGGTTTTCAATTAAGTACCTCTGGGAGCGCA
AGTAGTTCAAGATCATATAGAAGTTCCGTAGCGCAACCAAGTCGTCAGCTTGTTATTGCAAGAAGAGAAGCATTGTCACG
TAGAGGTAAATCTGCAGATAATACTAAAGATATAACTCGTGTTGAGCTTGAAAGGAAAAAGGTTCAGAGTGCTCCTTCTT
ATGACGCAAAAAATGCCGAACATTGTTGTCCAGAATGTGAGCAAAAAGCTTTAGAAGAGACTAGTAATACAACCCAAAAA
CCAGAGATCAGTTTGAAATTGAATAAGAGAACTACTGATCACCGTTCAACTGTAAAAAGAAAAGCAATTACTAATTCAAG
TAGAGCTTTTGTTTTGGCTCGGAGAGAAGCCTTGTCAAAACATGGTAAGTCTGCAGGGAAACAACCAACTACAGCTGCAT
CAGTTGCTCGACAAGGTAATCCAGATTTAACGACTAAGGAAATAGCTCAACGAGTTAGAGAACTTAAAAGTAAAACAGGT
GCCACTGGATCAAAACGCACATCAGTAACTCGTCCATGTGGTCCAAATAAGAATGGAGCGAAGCAAAATGCTAGTGTCCC
TGATGCTCATTGGAAAGTTGGTATAAGTGAGACGTCTACTGGACAAATTGTTACCGGTACTCAGGCGAATAGATCTTTGA
AAACTACTGGTAATGAGGCAAGTACATGCCGTTCAATAACTGGTACTCAGTATTTAGGTTCAGAAGTAATTGATTCTTTC
TGTAATGGATCAAATACCCAGATAAGTCAGCCTGCAAAAGTTGCAGTTACAAGTACTAGTCATGGAAATCTTGTAACTGG
TAACGAGGTTGGTAGATCAGAGAAGGTTACGGGTGACGAACCAGGAACTTGTAAAAACCTTACTGGGACTGAATATATTT
CTGCGAATCAATCTAATAATTATTGCGGAGGCGTTACCCCTTCACCCTCAAAAATTGGCTATAGCCAGACTATTGATGGT
CAAAAAGTCAGTGGAACAATGACAGGAAGGTCCGCTTTAGTTACTGGAAATGAAGCCGGATCAAATAAAGGTTTAACTGG
CGATCAGTATTTAGGTTCTGATCCACTACCTTCTGGTAGACCAGCAGAAAAGGTTGGCTCACTAACGACAATTCGCGGGA
ACGGAGTAACTGGTACCGATGTCTCTAGAAGAGAGAACGTTACAGGTAATGAGGCTGGTAGTTGTAAGAACGTGACTGGA
GATGAGTATGTGGGTGCTGGGCAATTTGATTCTTTTTGTGGAAGCAAGCCTGCTCCTGATCCAGCAAAAGTTGGTCTAAG
TATTACCAATAAAACTCAATCAGTTAGTGGAACTATGACAGGTAGATCGCATCTCGTAACAGGAGATGAACCTGGTACTT
GTAAAGCAGTAACAGGTACTCCCTATGCAGGATTAGATCAGGCAAATCAATGGTGTGACAATTCTGCATCATCTGAGGTA
GAGGCTAGAACTCCTAGGAAAACTGGTACTCCTGGAGCAAGATTGACTGGTCAGCAGCCAGGTATAGGCGGAAAAATGAC
AGGTGCTCATAAAGGCGCTTGTGAGCCTTTAACTGGAACTCCTTATGTAGGAGGCGATCAACTAGCAGACAATTGTGGTA
TTTCAACTTCTCCCGAAGGTTATGCTCATCAGGAAACTACTGAAAAAGCAGCTGCATGGACAAGTTTCAGTGTGAAATCT
CCTGCAAGGCAAGCACACATTCAAAATGAAATTAATGCAGGTGTCACCGGTACTAGTTACGAAGATAGTTCAAGAATTAC
TGGTCCATTCGACATGGCTGCAAACAAAGTGACAGGTACTGAACAATTTCGCTTTGACAGAAAACCATCAAACTCTACAA
ATAATAAAGTTGATCAAATAGTTAATGAAGAATCTAAGCAACGCCCAACCTCACAAATAACAGGAGAAGGACAATCCGCA
GGATTGAATATAACTGGTGATGATTGGGCTAGAGGAGAGCATGTCACTGGAACAGAAGGAGCATCTGCTAAGCGTAGAAA
TCCTTCTCGTCCAGGACCAATGAGTGCAATGAACGCAGCTGAATTAAAAAGAAACCAAGAGGTTCCCGAACCAGACTTCC
TGATCACTGGTTCTAGTGGCAATACAAGGGATGGCCAATTGGTTACTTTCTCTGGTGGAGCAAGAGGTTAA

Upstream 100 bases:

>100_bases
GATTAGTAGTCTTTTATTAATTAGCCCCGAAACATCTTTGGGGCTAATAATTCTTTAGAGAATTAAAAATTATTTTTTGT
AACCTCTCCATTGGGTTGAT

Downstream 100 bases:

>100_bases
ATAGTCAATGGCCTATCGTAATTTGGCCAAGAAATCTCGTCGTGGGCCTACAGCTCCTATGAAGAGGTTTGTCGACCTAG
AGACAAAGAATTTGAATTCT

Product: carboxysome shell protein CsoS2

Products: NA

Alternate protein names: Carboxysome; Tat Pathway Signal Sequence Domain Protein

Number of amino acids: Translated: 796; Mature: 795

Protein sequence:

>796_residues
MAKQTSRQLVLERRQALSQGGKNASIKGGSTANRVRSSADARATRTNSGFVKPNKSMASANNSSSQSSTSGFQLSTSGSA
SSSRSYRSSVAQPSRQLVIARREALSRRGKSADNTKDITRVELERKKVQSAPSYDAKNAEHCCPECEQKALEETSNTTQK
PEISLKLNKRTTDHRSTVKRKAITNSSRAFVLARREALSKHGKSAGKQPTTAASVARQGNPDLTTKEIAQRVRELKSKTG
ATGSKRTSVTRPCGPNKNGAKQNASVPDAHWKVGISETSTGQIVTGTQANRSLKTTGNEASTCRSITGTQYLGSEVIDSF
CNGSNTQISQPAKVAVTSTSHGNLVTGNEVGRSEKVTGDEPGTCKNLTGTEYISANQSNNYCGGVTPSPSKIGYSQTIDG
QKVSGTMTGRSALVTGNEAGSNKGLTGDQYLGSDPLPSGRPAEKVGSLTTIRGNGVTGTDVSRRENVTGNEAGSCKNVTG
DEYVGAGQFDSFCGSKPAPDPAKVGLSITNKTQSVSGTMTGRSHLVTGDEPGTCKAVTGTPYAGLDQANQWCDNSASSEV
EARTPRKTGTPGARLTGQQPGIGGKMTGAHKGACEPLTGTPYVGGDQLADNCGISTSPEGYAHQETTEKAAAWTSFSVKS
PARQAHIQNEINAGVTGTSYEDSSRITGPFDMAANKVTGTEQFRFDRKPSNSTNNKVDQIVNEESKQRPTSQITGEGQSA
GLNITGDDWARGEHVTGTEGASAKRRNPSRPGPMSAMNAAELKRNQEVPEPDFLITGSSGNTRDGQLVTFSGGARG

Sequences:

>Translated_796_residues
MAKQTSRQLVLERRQALSQGGKNASIKGGSTANRVRSSADARATRTNSGFVKPNKSMASANNSSSQSSTSGFQLSTSGSA
SSSRSYRSSVAQPSRQLVIARREALSRRGKSADNTKDITRVELERKKVQSAPSYDAKNAEHCCPECEQKALEETSNTTQK
PEISLKLNKRTTDHRSTVKRKAITNSSRAFVLARREALSKHGKSAGKQPTTAASVARQGNPDLTTKEIAQRVRELKSKTG
ATGSKRTSVTRPCGPNKNGAKQNASVPDAHWKVGISETSTGQIVTGTQANRSLKTTGNEASTCRSITGTQYLGSEVIDSF
CNGSNTQISQPAKVAVTSTSHGNLVTGNEVGRSEKVTGDEPGTCKNLTGTEYISANQSNNYCGGVTPSPSKIGYSQTIDG
QKVSGTMTGRSALVTGNEAGSNKGLTGDQYLGSDPLPSGRPAEKVGSLTTIRGNGVTGTDVSRRENVTGNEAGSCKNVTG
DEYVGAGQFDSFCGSKPAPDPAKVGLSITNKTQSVSGTMTGRSHLVTGDEPGTCKAVTGTPYAGLDQANQWCDNSASSEV
EARTPRKTGTPGARLTGQQPGIGGKMTGAHKGACEPLTGTPYVGGDQLADNCGISTSPEGYAHQETTEKAAAWTSFSVKS
PARQAHIQNEINAGVTGTSYEDSSRITGPFDMAANKVTGTEQFRFDRKPSNSTNNKVDQIVNEESKQRPTSQITGEGQSA
GLNITGDDWARGEHVTGTEGASAKRRNPSRPGPMSAMNAAELKRNQEVPEPDFLITGSSGNTRDGQLVTFSGGARG
>Mature_795_residues
AKQTSRQLVLERRQALSQGGKNASIKGGSTANRVRSSADARATRTNSGFVKPNKSMASANNSSSQSSTSGFQLSTSGSAS
SSRSYRSSVAQPSRQLVIARREALSRRGKSADNTKDITRVELERKKVQSAPSYDAKNAEHCCPECEQKALEETSNTTQKP
EISLKLNKRTTDHRSTVKRKAITNSSRAFVLARREALSKHGKSAGKQPTTAASVARQGNPDLTTKEIAQRVRELKSKTGA
TGSKRTSVTRPCGPNKNGAKQNASVPDAHWKVGISETSTGQIVTGTQANRSLKTTGNEASTCRSITGTQYLGSEVIDSFC
NGSNTQISQPAKVAVTSTSHGNLVTGNEVGRSEKVTGDEPGTCKNLTGTEYISANQSNNYCGGVTPSPSKIGYSQTIDGQ
KVSGTMTGRSALVTGNEAGSNKGLTGDQYLGSDPLPSGRPAEKVGSLTTIRGNGVTGTDVSRRENVTGNEAGSCKNVTGD
EYVGAGQFDSFCGSKPAPDPAKVGLSITNKTQSVSGTMTGRSHLVTGDEPGTCKAVTGTPYAGLDQANQWCDNSASSEVE
ARTPRKTGTPGARLTGQQPGIGGKMTGAHKGACEPLTGTPYVGGDQLADNCGISTSPEGYAHQETTEKAAAWTSFSVKSP
ARQAHIQNEINAGVTGTSYEDSSRITGPFDMAANKVTGTEQFRFDRKPSNSTNNKVDQIVNEESKQRPTSQITGEGQSAG
LNITGDDWARGEHVTGTEGASAKRRNPSRPGPMSAMNAAELKRNQEVPEPDFLITGSSGNTRDGQLVTFSGGARG

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 83455; Mature: 83324

Theoretical pI: Translated: 10.09; Mature: 10.09

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.8 %Cys     (Translated Protein)
1.0 %Met     (Translated Protein)
2.8 %Cys+Met (Translated Protein)
1.8 %Cys     (Mature Protein)
0.9 %Met     (Mature Protein)
2.6 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MAKQTSRQLVLERRQALSQGGKNASIKGGSTANRVRSSADARATRTNSGFVKPNKSMASA
CCCHHHHHHHHHHHHHHHCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCHHHHCC
NNSSSQSSTSGFQLSTSGSASSSRSYRSSVAQPSRQLVIARREALSRRGKSADNTKDITR
CCCCCCCCCCCEEEECCCCCCCHHHHHHHHCCCHHHHHHHHHHHHHHCCCCCCCCCCHHH
VELERKKVQSAPSYDAKNAEHCCPECEQKALEETSNTTQKPEISLKLNKRTTDHRSTVKR
HHHHHHHHHCCCCCCCCCHHHCCCHHHHHHHHHHCCCCCCCEEEEEECCCCCHHHHHHHH
KAITNSSRAFVLARREALSKHGKSAGKQPTTAASVARQGNPDLTTKEIAQRVRELKSKTG
HHHCCCCCEEEEHHHHHHHHHHHHCCCCCCHHHHHHHCCCCCCCHHHHHHHHHHHHHHCC
ATGSKRTSVTRPCGPNKNGAKQNASVPDAHWKVGISETSTGQIVTGTQANRSLKTTGNEA
CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEECCCCCCCCEEECCCCCCCCCCCCCHH
STCRSITGTQYLGSEVIDSFCNGSNTQISQPAKVAVTSTSHGNLVTGNEVGRSEKVTGDE
HHHHHCCCHHHHHHHHHHHHHCCCCCCCCCCCEEEEEECCCCCEEECCCCCCCCCCCCCC
PGTCKNLTGTEYISANQSNNYCGGVTPSPSKIGYSQTIDGQKVSGTMTGRSALVTGNEAG
CCCCCCCCCCEEEECCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCEEEEECCCCC
SNKGLTGDQYLGSDPLPSGRPAEKVGSLTTIRGNGVTGTDVSRRENVTGNEAGSCKNVTG
CCCCCCCCCCCCCCCCCCCCCHHHHCCEEEEECCCCCCCCCHHHCCCCCCCCCCCCCCCC
DEYVGAGQFDSFCGSKPAPDPAKVGLSITNKTQSVSGTMTGRSHLVTGDEPGTCKAVTGT
CCCCCCCCHHHHHCCCCCCCHHHCCEEEECCCCCCCEEECCCEEEEECCCCCCEEEECCC
PYAGLDQANQWCDNSASSEVEARTPRKTGTPGARLTGQQPGIGGKMTGAHKGACEPLTGT
CCCCHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
PYVGGDQLADNCGISTSPEGYAHQETTEKAAAWTSFSVKSPARQAHIQNEINAGVTGTSY
CCCCCCHHHHCCCCCCCCCCCCCHHHHHHHHHHCCCCCCCCHHHHHHHHHHCCCCCCCCC
EDSSRITGPFDMAANKVTGTEQFRFDRKPSNSTNNKVDQIVNEESKQRPTSQITGEGQSA
CCCCCCCCCHHHHCCCCCCCHHEEECCCCCCCCCHHHHHHHHHHHHCCCCHHHCCCCCCC
GLNITGDDWARGEHVTGTEGASAKRRNPSRPGPMSAMNAAELKRNQEVPEPDFLITGSSG
CEECCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHCCCCCCCCEEEECCCC
NTRDGQLVTFSGGARG
CCCCCEEEEECCCCCC
>Mature Secondary Structure 
AKQTSRQLVLERRQALSQGGKNASIKGGSTANRVRSSADARATRTNSGFVKPNKSMASA
CCHHHHHHHHHHHHHHHCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCCCHHHHCC
NNSSSQSSTSGFQLSTSGSASSSRSYRSSVAQPSRQLVIARREALSRRGKSADNTKDITR
CCCCCCCCCCCEEEECCCCCCCHHHHHHHHCCCHHHHHHHHHHHHHHCCCCCCCCCCHHH
VELERKKVQSAPSYDAKNAEHCCPECEQKALEETSNTTQKPEISLKLNKRTTDHRSTVKR
HHHHHHHHHCCCCCCCCCHHHCCCHHHHHHHHHHCCCCCCCEEEEEECCCCCHHHHHHHH
KAITNSSRAFVLARREALSKHGKSAGKQPTTAASVARQGNPDLTTKEIAQRVRELKSKTG
HHHCCCCCEEEEHHHHHHHHHHHHCCCCCCHHHHHHHCCCCCCCHHHHHHHHHHHHHHCC
ATGSKRTSVTRPCGPNKNGAKQNASVPDAHWKVGISETSTGQIVTGTQANRSLKTTGNEA
CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEECCCCCCCCEEECCCCCCCCCCCCCHH
STCRSITGTQYLGSEVIDSFCNGSNTQISQPAKVAVTSTSHGNLVTGNEVGRSEKVTGDE
HHHHHCCCHHHHHHHHHHHHHCCCCCCCCCCCEEEEEECCCCCEEECCCCCCCCCCCCCC
PGTCKNLTGTEYISANQSNNYCGGVTPSPSKIGYSQTIDGQKVSGTMTGRSALVTGNEAG
CCCCCCCCCCEEEECCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEECCCEEEEECCCCC
SNKGLTGDQYLGSDPLPSGRPAEKVGSLTTIRGNGVTGTDVSRRENVTGNEAGSCKNVTG
CCCCCCCCCCCCCCCCCCCCCHHHHCCEEEEECCCCCCCCCHHHCCCCCCCCCCCCCCCC
DEYVGAGQFDSFCGSKPAPDPAKVGLSITNKTQSVSGTMTGRSHLVTGDEPGTCKAVTGT
CCCCCCCCHHHHHCCCCCCCHHHCCEEEECCCCCCCEEECCCEEEEECCCCCCEEEECCC
PYAGLDQANQWCDNSASSEVEARTPRKTGTPGARLTGQQPGIGGKMTGAHKGACEPLTGT
CCCCHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
PYVGGDQLADNCGISTSPEGYAHQETTEKAAAWTSFSVKSPARQAHIQNEINAGVTGTSY
CCCCCCHHHHCCCCCCCCCCCCCHHHHHHHHHHCCCCCCCCHHHHHHHHHHCCCCCCCCC
EDSSRITGPFDMAANKVTGTEQFRFDRKPSNSTNNKVDQIVNEESKQRPTSQITGEGQSA
CCCCCCCCCHHHHCCCCCCCHHEEECCCCCCCCCHHHHHHHHHHHHCCCCHHHCCCCCCC
GLNITGDDWARGEHVTGTEGASAKRRNPSRPGPMSAMNAAELKRNQEVPEPDFLITGSSG
CEECCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHCCCCCCCCEEEECCCC
NTRDGQLVTFSGGARG
CCCCCEEEEECCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA