BacMap

Definition	Trichodesmium erythraeum IMS101 chromosome, complete genome.
Accession	NC_008312
Length	7,750,108

Click here to switch to the map view.

The map label for this gene is yjcF [C]

Identifier: 113476301

GI number: 113476301

Start: 4176775

End: 4178328

Strand: Reverse

Name: yjcF [C]

Synonym: Tery_2700

Alternate gene names: 113476301

Gene position: 4178328-4176775 (Counterclockwise)

Preceding gene: 113476303

Following gene: 113476300

Centisome position: 53.91

GC content: 33.98

Gene sequence:

>1554_bases
ATGATAATCGAAGAACTTCAAGAAAAATATGCAGCCGGTGAAAGAAACTTTACTAATCTCAATCTTTTTGAGGCCAATCT
CGCTGGAATGAATCTTAGTGGTGTAAATCTTAGTGGAGTTAACCTTAGTATTGCCAACCTAAGTGGTACAAATTTAACTA
ATTCTAATCTGAGTAAAGCTAAACTTAATATTACTAAACTTAATGGAGCTCATCTGAGTGGTACAAATTTAAATGGTGCT
GATTTGAATGTAGCCAACTTAGTTCTAGTTAATTTGAAAAGAGCTCAATTAATTGGTGCTAAATTGATTAGGGCAGAATT
GATTAGAGCGCAACTGAGTGGGGCAAATTTTTCCTTAGCTGATTTAAGTGGGGCAAGTCTTGTTGAAGCCACACTCCGAA
AAACTAATCTTAGTGGTGCCAACTTAAAGGGAGCTAACTTACGTTTTGCTTTTATTACAGAATCTAATTTAATAGAGGCC
AATTTGGAAGGAGCAGACCTGAGTGGTGCAGACCTCAGCGGTTCAGACCTTAGTGGGGCTGAATTGAGAAAAAGTAATTT
GACTGGTGCTAATTTGAATGGTGCTAATTTAAGCGGGGCTAATCTACGTTGGGCTGTTTTGACTGGCGCTCAAATGAACT
GTGTTAATCTTAGTGATGCAAAACTGAGTGGTGCTGACTTAAGTAGAGCCAACTTGTTCCAAGCTAATCTTTTAAATGCT
AGCCTAGTTCATGTTAATTTATCTAGTGCCTGTTTAATTGAAGTAGATTGGATTGGAGCAGATTTAACAGGAGCAAATTT
AACCGGGGCAAAAATTTTTGGTACCTCTCGTCTAGGGATTAAAACAGAAGCTGTCACCTGTGATTGGCTTGATTTGAGCC
CTAATGGAGATCAACCTCAAGTTTATACTCTCAATACTCTGAAAATTAAAAGTTTCTTTCACGAGACTCTTCCTAAAGTG
AAGATAATTGTTGATACTCGCTTAGATATTTCTAGCCATTATGCTCTAGCTGCTACATATTATCAAATTAGCAAGTATTT
ACCAGATATAAATCAACCTCCTTGTATAGAAGTTAACTCTTGTAGAACAATTATTTCTTTTTCAATGAACAGCGATGAAA
AAATATTTGCTGTTGCTTATATCACTGTTCTACCTTTTCTTGATGGTTATAAAACTCAAGAAAATATTATCAAAATCATG
AAGATACTTAACTCTCATGATTTCAATTCTTTAACTCCTATAGTAGCTAAAATAATTCGGCAGTTAAGTACAGTTTTAAA
TAAATCAATTCAACAAGTAAATAAAATTAATAAAGACAAAGTTTTGTTGAAATTTTGTAGGGGAGTTCAGTTTTTTCAGA
CTCCAACAAAAATAACTGTAATTAATTCTAGCGGTAAAAATTTTCATGTCTATCATCACCCTAGATTTGGTAAACGAATA
GTAAATAAAGTTAGTAAAAGTACAGAAGGAGAAGTCAGAATTCAAGTACCTCAAACAGTACCATATTCTATCAATACAAT
TATTGATTTTATTGATGGCTTTCATAAACCATAA

Upstream 100 bases:

>100_bases
AGGTTCTTAAATCGAGTCCAACTGAGCCACCAATTAAACCTAATCCAACAATACCTATATTAATCATAATACAATGGGCT
TGATACCAGGGTGCGCCCTA

Downstream 100 bases:

>100_bases
ATTGAATCTCTATAGAATAATTTTGATTTTGAGAAAAAAAATATAATAACTAACTTCTCAGCGATTATTTTTTCTCGCAT
CTTAGATAATTTTTGCTAAT

Product: pentapeptide repeat-containing protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 517; Mature: 517

Protein sequence:

>517_residues
MIIEELQEKYAAGERNFTNLNLFEANLAGMNLSGVNLSGVNLSIANLSGTNLTNSNLSKAKLNITKLNGAHLSGTNLNGA
DLNVANLVLVNLKRAQLIGAKLIRAELIRAQLSGANFSLADLSGASLVEATLRKTNLSGANLKGANLRFAFITESNLIEA
NLEGADLSGADLSGSDLSGAELRKSNLTGANLNGANLSGANLRWAVLTGAQMNCVNLSDAKLSGADLSRANLFQANLLNA
SLVHVNLSSACLIEVDWIGADLTGANLTGAKIFGTSRLGIKTEAVTCDWLDLSPNGDQPQVYTLNTLKIKSFFHETLPKV
KIIVDTRLDISSHYALAATYYQISKYLPDINQPPCIEVNSCRTIISFSMNSDEKIFAVAYITVLPFLDGYKTQENIIKIM
KILNSHDFNSLTPIVAKIIRQLSTVLNKSIQQVNKINKDKVLLKFCRGVQFFQTPTKITVINSSGKNFHVYHHPRFGKRI
VNKVSKSTEGEVRIQVPQTVPYSINTIIDFIDGFHKP

Sequences:

>Translated_517_residues
MIIEELQEKYAAGERNFTNLNLFEANLAGMNLSGVNLSGVNLSIANLSGTNLTNSNLSKAKLNITKLNGAHLSGTNLNGA
DLNVANLVLVNLKRAQLIGAKLIRAELIRAQLSGANFSLADLSGASLVEATLRKTNLSGANLKGANLRFAFITESNLIEA
NLEGADLSGADLSGSDLSGAELRKSNLTGANLNGANLSGANLRWAVLTGAQMNCVNLSDAKLSGADLSRANLFQANLLNA
SLVHVNLSSACLIEVDWIGADLTGANLTGAKIFGTSRLGIKTEAVTCDWLDLSPNGDQPQVYTLNTLKIKSFFHETLPKV
KIIVDTRLDISSHYALAATYYQISKYLPDINQPPCIEVNSCRTIISFSMNSDEKIFAVAYITVLPFLDGYKTQENIIKIM
KILNSHDFNSLTPIVAKIIRQLSTVLNKSIQQVNKINKDKVLLKFCRGVQFFQTPTKITVINSSGKNFHVYHHPRFGKRI
VNKVSKSTEGEVRIQVPQTVPYSINTIIDFIDGFHKP
>Mature_517_residues
MIIEELQEKYAAGERNFTNLNLFEANLAGMNLSGVNLSGVNLSIANLSGTNLTNSNLSKAKLNITKLNGAHLSGTNLNGA
DLNVANLVLVNLKRAQLIGAKLIRAELIRAQLSGANFSLADLSGASLVEATLRKTNLSGANLKGANLRFAFITESNLIEA
NLEGADLSGADLSGSDLSGAELRKSNLTGANLNGANLSGANLRWAVLTGAQMNCVNLSDAKLSGADLSRANLFQANLLNA
SLVHVNLSSACLIEVDWIGADLTGANLTGAKIFGTSRLGIKTEAVTCDWLDLSPNGDQPQVYTLNTLKIKSFFHETLPKV
KIIVDTRLDISSHYALAATYYQISKYLPDINQPPCIEVNSCRTIISFSMNSDEKIFAVAYITVLPFLDGYKTQENIIKIM
KILNSHDFNSLTPIVAKIIRQLSTVLNKSIQQVNKINKDKVLLKFCRGVQFFQTPTKITVINSSGKNFHVYHHPRFGKRI
VNKVSKSTEGEVRIQVPQTVPYSINTIIDFIDGFHKP

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 5 pentapeptide repeat domains [H]

Homologues:

Organism=Homo sapiens, GI39753959, Length=167, Percent_Identity=38.3233532934132, Blast_Score=88, Evalue=2e-17,
Organism=Drosophila melanogaster, GI221377802, Length=202, Percent_Identity=37.1287128712871, Blast_Score=94, Evalue=2e-19,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR001646 [H]

Pfam domain/function: PF00805 Pentapeptide [H]

EC number: NA

Molecular weight: Translated: 56089; Mature: 56089

Theoretical pI: Translated: 9.51; Mature: 9.51

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.2 %Cys     (Translated Protein)
1.0 %Met     (Translated Protein)
2.1 %Cys+Met (Translated Protein)
1.2 %Cys     (Mature Protein)
1.0 %Met     (Mature Protein)
2.1 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MIIEELQEKYAAGERNFTNLNLFEANLAGMNLSGVNLSGVNLSIANLSGTNLTNSNLSKA
CCHHHHHHHHCCCCCCCCEEEEEEEEECCCEECCCEECCCEEEEEECCCCCCCCCCCCEE
KLNITKLNGAHLSGTNLNGADLNVANLVLVNLKRAQLIGAKLIRAELIRAQLSGANFSLA
EEEEEEECCCEECCCCCCCCCCEEEEEEEEEEHHHHHHHHHHHHHHHHHHHHCCCCEEEE
DLSGASLVEATLRKTNLSGANLKGANLRFAFITESNLIEANLEGADLSGADLSGSDLSGA
CCCCCHHHHHHHHHCCCCCCCCCCCCEEEEEEECCCEEEECCCCCCCCCCCCCCCCCCCH
ELRKSNLTGANLNGANLSGANLRWAVLTGAQMNCVNLSDAKLSGADLSRANLFQANLLNA
HHHHCCCCCCCCCCCCCCCCCEEEEEEECCEEEEEECCCCCCCCCCCCHHHEEHHHCCCE
SLVHVNLSSACLIEVDWIGADLTGANLTGAKIFGTSRLGIKTEAVTCDWLDLSPNGDQPQ
EEEEEECCCEEEEEEEEECCCCCCCCCCCEEEEECCCCCEEEEEEEEEEEECCCCCCCCE
VYTLNTLKIKSFFHETLPKVKIIVDTRLDISSHYALAATYYQISKYLPDINQPPCIEVNS
EEEEEEEEHHHHHHHCCCCEEEEEEECCCCCCCEEHHHHHHHHHHHCCCCCCCCEEEECC
CRTIISFSMNSDEKIFAVAYITVLPFLDGYKTQENIIKIMKILNSHDFNSLTPIVAKIIR
CEEEEEEECCCCCEEEEEEHHHHHHHCCCCCCHHHHHHHHHHHCCCCCCCHHHHHHHHHH
QLSTVLNKSIQQVNKINKDKVLLKFCRGVQFFQTPTKITVINSSGKNFHVYHHPRFGKRI
HHHHHHHHHHHHHHHCCHHHHHHHHHCCCEEECCCCEEEEEECCCCEEEEEECCCHHHHH
VNKVSKSTEGEVRIQVPQTVPYSINTIIDFIDGFHKP
HHHHHCCCCCEEEEEECCCCCCHHHHHHHHHHHCCCC
>Mature Secondary Structure
MIIEELQEKYAAGERNFTNLNLFEANLAGMNLSGVNLSGVNLSIANLSGTNLTNSNLSKA
CCHHHHHHHHCCCCCCCCEEEEEEEEECCCEECCCEECCCEEEEEECCCCCCCCCCCCEE
KLNITKLNGAHLSGTNLNGADLNVANLVLVNLKRAQLIGAKLIRAELIRAQLSGANFSLA
EEEEEEECCCEECCCCCCCCCCEEEEEEEEEEHHHHHHHHHHHHHHHHHHHHCCCCEEEE
DLSGASLVEATLRKTNLSGANLKGANLRFAFITESNLIEANLEGADLSGADLSGSDLSGA
CCCCCHHHHHHHHHCCCCCCCCCCCCEEEEEEECCCEEEECCCCCCCCCCCCCCCCCCCH
ELRKSNLTGANLNGANLSGANLRWAVLTGAQMNCVNLSDAKLSGADLSRANLFQANLLNA
HHHHCCCCCCCCCCCCCCCCCEEEEEEECCEEEEEECCCCCCCCCCCCHHHEEHHHCCCE
SLVHVNLSSACLIEVDWIGADLTGANLTGAKIFGTSRLGIKTEAVTCDWLDLSPNGDQPQ
EEEEEECCCEEEEEEEEECCCCCCCCCCCEEEEECCCCCEEEEEEEEEEEECCCCCCCCE
VYTLNTLKIKSFFHETLPKVKIIVDTRLDISSHYALAATYYQISKYLPDINQPPCIEVNS
EEEEEEEEHHHHHHHCCCCEEEEEEECCCCCCCEEHHHHHHHHHHHCCCCCCCCEEEECC
CRTIISFSMNSDEKIFAVAYITVLPFLDGYKTQENIIKIMKILNSHDFNSLTPIVAKIIR
CEEEEEEECCCCCEEEEEEHHHHHHHCCCCCCHHHHHHHHHHHCCCCCCCHHHHHHHHHH
QLSTVLNKSIQQVNKINKDKVLLKFCRGVQFFQTPTKITVINSSGKNFHVYHHPRFGKRI
HHHHHHHHHHHHHHHCCHHHHHHHHHCCCEEECCCCEEEEEECCCCEEEEEECCCHHHHH
VNKVSKSTEGEVRIQVPQTVPYSINTIIDFIDGFHKP
HHHHHCCCCCEEEEEECCCCCCHHHHHHHHHHHCCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA