BacMap

Definition	Nostoc sp. PCC 7120, complete genome.
Accession	NC_003272
Length	6,413,771

Click here to switch to the map view.

The map label for this gene is 17230227

Identifier: 17230227

GI number: 17230227

Start: 3332484

End: 3333116

Strand: Direct

Name: 17230227

Synonym: alr2735

Alternate gene names: NA

Gene position: 3332484-3333116 (Clockwise)

Preceding gene: 17230226

Following gene: 17230229

Centisome position: 51.96

GC content: 40.13

Gene sequence:

>633_bases
ATGATGACACCAATGCAGGGTGTAGCTGCAACACCAATTAACTCACACCAGTTTGAGCCATACACTAAAGAAAATTCTGA
AGCAAACGCAGATTTTTCCTTTCAAACCCTTGCTGATGTCACCAAGGCAATTTTAAATCACGCTTTTTGGTTAGCTGAAC
AAAAACAAAATCTTTCCTTAAAAGAGTATAAAAAACTACTTTACAATCAAGGTTGGCAAGGAGAGGAAAAGAAATACCTC
AAGATTGCTGCTACCTTTGGCAAGTTTGAACCACAAGACTTTGCTCAAGTTGAGCCAAGAACAATATATCAATTAGCAGA
AAGAAATAAGCAGTATCAAAAAGTTATAGATAGACTGTTAGATTTAAGTGTGATTAACCAAGAAACGGTACGCACATTAA
TTCAAAAACAGCGTACCCCTAGAGCAGATAGACCGAAAAAACCGAGTATTTGGCGGCGCTTAAAGAATGGTGGGAGATAT
TGCCAAATTCCCCCAATCCACGAAGCCTCAGAACAAACTGGGACAACACTGCAAAGAATGATGGATGAGGAAGGATTAAG
CGCCCAACAAATCGTAGCAGAAGCGATCGCTCTCCGCCAAGCCTATAAAGAAGGGCAACTGACAATTTCCTGA

Upstream 100 bases:

>100_bases
TCATTAGGGTTTTTTAGTAAATATATAGTACAATTGTACTAAGCAGGCTTTAAGCCTGGGCGATCGCCTACTAGAAAAAC
CCTACTGTGAGATCATTACT

Downstream 100 bases:

>100_bases
AAACAGATAAGTGCTGAATGGGCTAACGCGCCGCATTCAGCACTTACTACTTACTTAATAGGATTTGCTGGTACTGGTTG
AGTTTCAAAAGTAGGGTTGA

Product: hypothetical protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 210; Mature: 210

Protein sequence:

>210_residues
MMTPMQGVAATPINSHQFEPYTKENSEANADFSFQTLADVTKAILNHAFWLAEQKQNLSLKEYKKLLYNQGWQGEEKKYL
KIAATFGKFEPQDFAQVEPRTIYQLAERNKQYQKVIDRLLDLSVINQETVRTLIQKQRTPRADRPKKPSIWRRLKNGGRY
CQIPPIHEASEQTGTTLQRMMDEEGLSAQQIVAEAIALRQAYKEGQLTIS

Sequences:

>Translated_210_residues
MMTPMQGVAATPINSHQFEPYTKENSEANADFSFQTLADVTKAILNHAFWLAEQKQNLSLKEYKKLLYNQGWQGEEKKYL
KIAATFGKFEPQDFAQVEPRTIYQLAERNKQYQKVIDRLLDLSVINQETVRTLIQKQRTPRADRPKKPSIWRRLKNGGRY
CQIPPIHEASEQTGTTLQRMMDEEGLSAQQIVAEAIALRQAYKEGQLTIS
>Mature_210_residues
MMTPMQGVAATPINSHQFEPYTKENSEANADFSFQTLADVTKAILNHAFWLAEQKQNLSLKEYKKLLYNQGWQGEEKKYL
KIAATFGKFEPQDFAQVEPRTIYQLAERNKQYQKVIDRLLDLSVINQETVRTLIQKQRTPRADRPKKPSIWRRLKNGGRY
CQIPPIHEASEQTGTTLQRMMDEEGLSAQQIVAEAIALRQAYKEGQLTIS

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): Y2735_NOSS1 (Q8YTI2)

Other databases:

- EMBL:   BA000019
- PIR:   AH2147
- RefSeq:   NP_486775.1
- GeneID:   1106332
- GenomeReviews:   BA000019_GR
- KEGG:   ana:alr2735
- NMPDR:   fig|103690.1.peg.3042
- eggNOG:   NOG77654
- HOGENOM:   HBG139698
- OMA:   VEPRTIY
- ProtClustDB:   CLSK287370
- BioCyc:   NSP103690:ALR2735-MONOMER

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 24219; Mature: 24219

Theoretical pI: Translated: 9.64; Mature: 9.64

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.5 %Cys     (Translated Protein)
2.4 %Met     (Translated Protein)
2.9 %Cys+Met (Translated Protein)
0.5 %Cys     (Mature Protein)
2.4 %Met     (Mature Protein)
2.9 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MMTPMQGVAATPINSHQFEPYTKENSEANADFSFQTLADVTKAILNHAFWLAEQKQNLSL
CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCH
KEYKKLLYNQGWQGEEKKYLKIAATFGKFEPQDFAQVEPRTIYQLAERNKQYQKVIDRLL
HHHHHHHHCCCCCCCCHHHHHHHHHHCCCCCCHHHHCCHHHHHHHHHCCHHHHHHHHHHH
DLSVINQETVRTLIQKQRTPRADRPKKPSIWRRLKNGGRYCQIPPIHEASEQTGTTLQRM
HHHHHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHCCCCEEECCCCCCCHHHHHHHHHHH
MDEEGLSAQQIVAEAIALRQAYKEGQLTIS
HHHCCCCHHHHHHHHHHHHHHHHCCCEECC
>Mature Secondary Structure
MMTPMQGVAATPINSHQFEPYTKENSEANADFSFQTLADVTKAILNHAFWLAEQKQNLSL
CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCH
KEYKKLLYNQGWQGEEKKYLKIAATFGKFEPQDFAQVEPRTIYQLAERNKQYQKVIDRLL
HHHHHHHHCCCCCCCCHHHHHHHHHHCCCCCCHHHHCCHHHHHHHHHCCHHHHHHHHHHH
DLSVINQETVRTLIQKQRTPRADRPKKPSIWRRLKNGGRYCQIPPIHEASEQTGTTLQRM
HHHHHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHCCCCEEECCCCCCCHHHHHHHHHHH
MDEEGLSAQQIVAEAIALRQAYKEGQLTIS
HHHCCCCHHHHHHHHHHHHHHHHCCCEECC

PDB accession: NA

Resolution: NA

Structure class: Alpha

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 10.0

TargetDB status: NA

Availability: NA

References: 11759840