BacMap

Definition	Trichodesmium erythraeum IMS101 chromosome, complete genome.
Accession	NC_008312
Length	7,750,108

Click here to switch to the map view.

The map label for this gene is cpcE [H]

Identifier: 113475509

GI number: 113475509

Start: 2821588

End: 2825619

Strand: Reverse

Name: cpcE [H]

Synonym: Tery_1841

Alternate gene names: 113475509

Gene position: 2825619-2821588 (Counterclockwise)

Preceding gene: 113475516

Following gene: 113475506

Centisome position: 36.46

GC content: 43.55

Gene sequence:

>4032_bases
ATGATCAATTGGGGGCCCTATCTAGAATCAGTTTGCCGAGAGTATGACCGTTGGTGGGAGGTTTATACTCTGACGGATGT
GGCGGGAAAAAAGCCCCATGAGCAAGGGCAAAATATTTTTCCTTCTTTCGATTTGGGTTTGATGGTACAAAGGGTTAAGT
CGGAGGAAAAGCAGGGGAAAGACCCACAAGAGAAAATTGAACGGTTGACGGTTTTGGAGGGTTTACGGAAATATGCGGCT
AATCATGTTTTATTGGTGGGAAGACCGGGGTCGGGAAAATCTACTGCTTTGGCCAGGTTGTTGTTGGAGGAGGCACATAA
GGTCTGGTCTGGGGAAAATGGCCAAATTCCTATTCTCATAGAATTGCGCTACAGTAAATCTTCTGTACTTTCGAGAATTC
AAGCTTTTATTGATAAGCACAACCACAATACATATATAGATGAAGAGACTCTGAAAAGTTTGCTGCTTCAAGGTAAATTT
TTGCTGCTATTTGATGGGTTTAATGAGATGGCGTCGGAGGAGGCGCGACAACAGGTGAGAATGTTCCGGCAAGACTACCC
AGAAACTGCTATGGTGTTTTCGACCCGAGATTTGAGTCTGGGGGGAGACTTGCGGATTGAGAAAAAGCTGGAAATGCAGC
CCCTGACAGAATCTCAAATGCAGGATTTTGTCTGTGCTTATTTGCCGGAACAGGGTGAAAATTTGTGGGGACAGTTACAG
GGGAGGTTGCGGGAGTTGGGGGAAACTCCGATGTTTTTGTTGATGTTGTGTTCGGTGTTTGACTATAACAAGGTCATACC
TGCTCATCTGGGGTTGGTATTTCGTGGTTTTACTCAGACTTATAGTGGTCGTATTAAGCAGGATGTTCTGGTTGATGAAA
GTTCTCGGCGTTGGTGGGATCGGTTATTGCAGGAGTTGGCGTGGGTGATGACAACTGGGGGGTCGAAAACTGAGATGATG
GTTGCTATTCCTCGGAAAAAGGCTGAAGATGTATTGGCGGACTTTTTGCGAGGGCAGGTGGTGGCTCCGACTGACTGTGC
CATGGGTTGGTTGGAGGATCTGTTGGAGTATCATTTGATCCAGGTGGGAGATGATGGTCAGATTTCGTTTCGCCATCAGT
TGTTGCAGGAGTATTATGCGGCGGAAAGGTTGTCGTCGCAGTTGTCTGGTTTGAGTGACTATGAGTTGCAGTGGGATTAT
TTGAATTATTTGAAGTGGACGGAAGTGGTGGCGTTGATGTTGGGGTTGGTTGAGGATGAGGTGTTAGCGGTGCGGGTGGT
AAGGCTGGCGTTGGAGGTAGATTGGTTTTTGGGGGCGAGGTTGGTGGGTGAGGTAAAAGAGAAGTTTCAGGAAGCGGCGT
TTGCTGAGGTTGATGGGTTGGAGTTGCCTGGGTTGGCGAAGGTTGTGTTGGCTGGGTTAACGATGTCGGAGGTTACTGTT
CCGAGGTTGGTTCAATTTCTAGAACACTCAGACAAGTATATGCGTGGGAGTGCAGCACATGCTCTGGGTAAAATAGCTTC
GGAAAAAGCAATTGAGGAATTAATTCCGCTCCTAAAAGACTCAGATGAATATGTGCGTTGGAGTGCAGCATATGCTCTGG
GTGAAATAGGTTCGGAAACTGCAATTGAGGGATTAATTCCACTCCTCAAAGACTCAGACTCTTTTGTGTGTTGGAGTGCA
GCAAATGCCATGGGTAAAATAGGTTCGCAAAAAGCAATTGAGGGATTAATTCCACTCCTCAAAGACTCAGACTCTTTTGT
GCGTTATGCTGCAGCAGAGGCTCTGGGTAAAATAGATTCGGAAAAAGCAATTGAGGGATTAATTCCACTCCTAAAAGACT
CAGACCCTAATGTGAATTTTTCTGCACGATCTGCTCTGAGTCAAATAGGTTCGGAAAAAGCAATTGAGCAATTAATTCCA
CTCCTAAAAGACTCAGATGAATATGTGCGTTATGCTGCAGCAGAGGCTCTGGGTAAAATAGGTTCGGAAAAAGCAATTGA
GCAATTAATTCCACTCCTCAAAGACTCAGACTCTTCTGTGCGTTCGAGAGCAGTATATGTTCTGGGTAAAATAGGTTCGG
AAAAAGCAATTGAGGGATTAATTCCACTCCTAAAAGACTCAGACGAATTTGTGCGTTATAGTGCAGTATATGTTCTGGGT
GAAATAGGTTCGGAAAAAGCAATTGAGCAATTAATTCCACTCCTAAAAGACTCAAACTCTTCTGTGAATTTTTCTGCAGC
AGAAGCTCTGGGTAAAATAGGTTCGGAAAAAGCAATTGAGGGATTAATTCCACTCCTAAAAGACTCAGACGAATTTGTGC
GTTATACTGCAGCAGAAGCTCTGGGTAAAATAGGTTCGGAAAAAGCAATTGAGCAATTAATTCCACTCCTCAAAGACTCA
GACCCTAATGTGCGTCGCAATGCAGCAGAAGCTCTGGGTGAAATAGGTTCGGAAACAGTAATTGAGCAATTAATTCCACT
CCTAAAATACTCAGACCCTAATGTGCGTTATACTGCAGCAGAAGCTCTGGGTAAAATAGGTTCGGAAAAAGCAATTGAGC
AATTAATTCCACTCCTCAAAGACTCAGACCCTAATGTGCGTTATACTGCAGCAGAAGCTCTGGGTAAAATAGGTTCGGAA
AAAGCAATTGAGCAATTAATTCCACTCCTCAAAGACTCAGACCCTAATGTGCGTCGCAATGCAGCATATGCTCTGGGTGA
AATAGGTTCGGAAAAAGCAATTGAGGGATTAATTCCACTCCTCAAAGACTCAGACTCTTTTGTGCGTTCGAGAGCAGCAT
ATGTTCTGGGTGAAATAGGTTCGGAAAAAGCAATTGAACAATTAATTCCACTCCTAAAAGACTCAGACTATTGGGTGCGC
GACCATGTAGCAGAAGCTCTGGGTAAAATAGGTTCAGAAAACACAATTATTAAGTTGACAAAAAAACTACAAAATGATAG
TTTTGTAAAACAAGATTTATATAAAATTATCAAAATTATTCAAACCATCCAACAACGGCTCCAATACTACAAACCAACCC
CCAAAATACCCATGTCTAAATCACTTTCTCACAACTACGCCCTACTAATAGGAGTCGGCGACTACAAATACCCCGACTGG
TCACTCCCCGTCACAGTCAAAGACGTTCAAGCAATCAAATCATTCCTCACAAACCCCGACCTCTGCAGTTACATAGACGA
CGAAAATCATCTCCGCCTACTATGCAACGAACAAGCAACAAAACAAAACATTTTAAACAACATAAACTGGCTCCAAGAAC
AAGCAAAAAACGACCCAGAAGCAACAATATTAGTCTATTATTCCGGTCATGGTTGGCTAGATAAATCAACCGAAAAATAT
TATTTAATCCCCCACGACACCAGCCCCATAAAACTACAAAAAACACAAAAAACAGCATTACCAGCAACAGACTTTAACAA
CGCCCTCCAGGAAATATCCGCCCAAAAACTATTAGTAATTATAGATAGTTGTCACGCCCAAGGAATGGCAACCGCCAAAG
AAACAGACCAACTAGACTTACCCGAAAACTTCAGTCAAACCGCCCTCCCCAAAAACCTAATAGAAGACCTAAAAAAAGGA
ACAGGACGGGCAGTATTCACCTCATCCACAGGATACCAGTTATCATGGATCCGCTCAGATCAAACAATGAGCATCTACAC
ATACCACCTTCTCGAAGCATTACAAGGTGGAGACAACAAACCAGGAGACAAATATGTCACCCTTTCCAACCTAATGCACC
ATGTAGGAAAAACCGTTCCCCAAAGCGCTCAACAACAAGGGGGAGAACAAACCCCCATATTCGACTTTTCCCAAACAGAA
GATTTTCCCGTAGCATTATTGCGTGGAGGCAAAGGTTTACCCGCAGAGGGAAAGGAAAAAATACAACTAGAAGCACAAGA
GAATATTCGCAACGCAATAACAGTACAACAAGGTAATGCCGCTGGTGGAGACGTTAAAAATCAAGTCTTTATTGACAAGA
TAGAAGGAGGAGGAGGAATAACCTTTAGTTAG

Upstream 100 bases:

>100_bases
TATTCAATATTATTGGATTTTGGTTAACTCCGGCAGTAGTCTGGATGAAAGGTTAAAATTAAGGTCTAAACTTCTAACTT
TTAACTTCTAAATTCTAAAT

Downstream 100 bases:

>100_bases
TAAAAGTTGTTGGGGTTGAAGAACGAAACCAAACAAATTACCGCCCCAACTCACAGCAATGAAACCAAAAAAAATTAACC
CCCAAAATAGTTGAGGTCAG

Product: peptidase C14, caspase catalytic subunit p20

Products: NA

Alternate protein names: Phycocyanin operon protein CpcE [H]

Number of amino acids: Translated: 1343; Mature: 1343

Protein sequence:

>1343_residues
MINWGPYLESVCREYDRWWEVYTLTDVAGKKPHEQGQNIFPSFDLGLMVQRVKSEEKQGKDPQEKIERLTVLEGLRKYAA
NHVLLVGRPGSGKSTALARLLLEEAHKVWSGENGQIPILIELRYSKSSVLSRIQAFIDKHNHNTYIDEETLKSLLLQGKF
LLLFDGFNEMASEEARQQVRMFRQDYPETAMVFSTRDLSLGGDLRIEKKLEMQPLTESQMQDFVCAYLPEQGENLWGQLQ
GRLRELGETPMFLLMLCSVFDYNKVIPAHLGLVFRGFTQTYSGRIKQDVLVDESSRRWWDRLLQELAWVMTTGGSKTEMM
VAIPRKKAEDVLADFLRGQVVAPTDCAMGWLEDLLEYHLIQVGDDGQISFRHQLLQEYYAAERLSSQLSGLSDYELQWDY
LNYLKWTEVVALMLGLVEDEVLAVRVVRLALEVDWFLGARLVGEVKEKFQEAAFAEVDGLELPGLAKVVLAGLTMSEVTV
PRLVQFLEHSDKYMRGSAAHALGKIASEKAIEELIPLLKDSDEYVRWSAAYALGEIGSETAIEGLIPLLKDSDSFVCWSA
ANAMGKIGSQKAIEGLIPLLKDSDSFVRYAAAEALGKIDSEKAIEGLIPLLKDSDPNVNFSARSALSQIGSEKAIEQLIP
LLKDSDEYVRYAAAEALGKIGSEKAIEQLIPLLKDSDSSVRSRAVYVLGKIGSEKAIEGLIPLLKDSDEFVRYSAVYVLG
EIGSEKAIEQLIPLLKDSNSSVNFSAAEALGKIGSEKAIEGLIPLLKDSDEFVRYTAAEALGKIGSEKAIEQLIPLLKDS
DPNVRRNAAEALGEIGSETVIEQLIPLLKYSDPNVRYTAAEALGKIGSEKAIEQLIPLLKDSDPNVRYTAAEALGKIGSE
KAIEQLIPLLKDSDPNVRRNAAYALGEIGSEKAIEGLIPLLKDSDSFVRSRAAYVLGEIGSEKAIEQLIPLLKDSDYWVR
DHVAEALGKIGSENTIIKLTKKLQNDSFVKQDLYKIIKIIQTIQQRLQYYKPTPKIPMSKSLSHNYALLIGVGDYKYPDW
SLPVTVKDVQAIKSFLTNPDLCSYIDDENHLRLLCNEQATKQNILNNINWLQEQAKNDPEATILVYYSGHGWLDKSTEKY
YLIPHDTSPIKLQKTQKTALPATDFNNALQEISAQKLLVIIDSCHAQGMATAKETDQLDLPENFSQTALPKNLIEDLKKG
TGRAVFTSSTGYQLSWIRSDQTMSIYTYHLLEALQGGDNKPGDKYVTLSNLMHHVGKTVPQSAQQQGGEQTPIFDFSQTE
DFPVALLRGGKGLPAEGKEKIQLEAQENIRNAITVQQGNAAGGDVKNQVFIDKIEGGGGITFS

Sequences:

>Translated_1343_residues
MINWGPYLESVCREYDRWWEVYTLTDVAGKKPHEQGQNIFPSFDLGLMVQRVKSEEKQGKDPQEKIERLTVLEGLRKYAA
NHVLLVGRPGSGKSTALARLLLEEAHKVWSGENGQIPILIELRYSKSSVLSRIQAFIDKHNHNTYIDEETLKSLLLQGKF
LLLFDGFNEMASEEARQQVRMFRQDYPETAMVFSTRDLSLGGDLRIEKKLEMQPLTESQMQDFVCAYLPEQGENLWGQLQ
GRLRELGETPMFLLMLCSVFDYNKVIPAHLGLVFRGFTQTYSGRIKQDVLVDESSRRWWDRLLQELAWVMTTGGSKTEMM
VAIPRKKAEDVLADFLRGQVVAPTDCAMGWLEDLLEYHLIQVGDDGQISFRHQLLQEYYAAERLSSQLSGLSDYELQWDY
LNYLKWTEVVALMLGLVEDEVLAVRVVRLALEVDWFLGARLVGEVKEKFQEAAFAEVDGLELPGLAKVVLAGLTMSEVTV
PRLVQFLEHSDKYMRGSAAHALGKIASEKAIEELIPLLKDSDEYVRWSAAYALGEIGSETAIEGLIPLLKDSDSFVCWSA
ANAMGKIGSQKAIEGLIPLLKDSDSFVRYAAAEALGKIDSEKAIEGLIPLLKDSDPNVNFSARSALSQIGSEKAIEQLIP
LLKDSDEYVRYAAAEALGKIGSEKAIEQLIPLLKDSDSSVRSRAVYVLGKIGSEKAIEGLIPLLKDSDEFVRYSAVYVLG
EIGSEKAIEQLIPLLKDSNSSVNFSAAEALGKIGSEKAIEGLIPLLKDSDEFVRYTAAEALGKIGSEKAIEQLIPLLKDS
DPNVRRNAAEALGEIGSETVIEQLIPLLKYSDPNVRYTAAEALGKIGSEKAIEQLIPLLKDSDPNVRYTAAEALGKIGSE
KAIEQLIPLLKDSDPNVRRNAAYALGEIGSEKAIEGLIPLLKDSDSFVRSRAAYVLGEIGSEKAIEQLIPLLKDSDYWVR
DHVAEALGKIGSENTIIKLTKKLQNDSFVKQDLYKIIKIIQTIQQRLQYYKPTPKIPMSKSLSHNYALLIGVGDYKYPDW
SLPVTVKDVQAIKSFLTNPDLCSYIDDENHLRLLCNEQATKQNILNNINWLQEQAKNDPEATILVYYSGHGWLDKSTEKY
YLIPHDTSPIKLQKTQKTALPATDFNNALQEISAQKLLVIIDSCHAQGMATAKETDQLDLPENFSQTALPKNLIEDLKKG
TGRAVFTSSTGYQLSWIRSDQTMSIYTYHLLEALQGGDNKPGDKYVTLSNLMHHVGKTVPQSAQQQGGEQTPIFDFSQTE
DFPVALLRGGKGLPAEGKEKIQLEAQENIRNAITVQQGNAAGGDVKNQVFIDKIEGGGGITFS
>Mature_1343_residues
MINWGPYLESVCREYDRWWEVYTLTDVAGKKPHEQGQNIFPSFDLGLMVQRVKSEEKQGKDPQEKIERLTVLEGLRKYAA
NHVLLVGRPGSGKSTALARLLLEEAHKVWSGENGQIPILIELRYSKSSVLSRIQAFIDKHNHNTYIDEETLKSLLLQGKF
LLLFDGFNEMASEEARQQVRMFRQDYPETAMVFSTRDLSLGGDLRIEKKLEMQPLTESQMQDFVCAYLPEQGENLWGQLQ
GRLRELGETPMFLLMLCSVFDYNKVIPAHLGLVFRGFTQTYSGRIKQDVLVDESSRRWWDRLLQELAWVMTTGGSKTEMM
VAIPRKKAEDVLADFLRGQVVAPTDCAMGWLEDLLEYHLIQVGDDGQISFRHQLLQEYYAAERLSSQLSGLSDYELQWDY
LNYLKWTEVVALMLGLVEDEVLAVRVVRLALEVDWFLGARLVGEVKEKFQEAAFAEVDGLELPGLAKVVLAGLTMSEVTV
PRLVQFLEHSDKYMRGSAAHALGKIASEKAIEELIPLLKDSDEYVRWSAAYALGEIGSETAIEGLIPLLKDSDSFVCWSA
ANAMGKIGSQKAIEGLIPLLKDSDSFVRYAAAEALGKIDSEKAIEGLIPLLKDSDPNVNFSARSALSQIGSEKAIEQLIP
LLKDSDEYVRYAAAEALGKIGSEKAIEQLIPLLKDSDSSVRSRAVYVLGKIGSEKAIEGLIPLLKDSDEFVRYSAVYVLG
EIGSEKAIEQLIPLLKDSNSSVNFSAAEALGKIGSEKAIEGLIPLLKDSDEFVRYTAAEALGKIGSEKAIEQLIPLLKDS
DPNVRRNAAEALGEIGSETVIEQLIPLLKYSDPNVRYTAAEALGKIGSEKAIEQLIPLLKDSDPNVRYTAAEALGKIGSE
KAIEQLIPLLKDSDPNVRRNAAYALGEIGSEKAIEGLIPLLKDSDSFVRSRAAYVLGEIGSEKAIEQLIPLLKDSDYWVR
DHVAEALGKIGSENTIIKLTKKLQNDSFVKQDLYKIIKIIQTIQQRLQYYKPTPKIPMSKSLSHNYALLIGVGDYKYPDW
SLPVTVKDVQAIKSFLTNPDLCSYIDDENHLRLLCNEQATKQNILNNINWLQEQAKNDPEATILVYYSGHGWLDKSTEKY
YLIPHDTSPIKLQKTQKTALPATDFNNALQEISAQKLLVIIDSCHAQGMATAKETDQLDLPENFSQTALPKNLIEDLKKG
TGRAVFTSSTGYQLSWIRSDQTMSIYTYHLLEALQGGDNKPGDKYVTLSNLMHHVGKTVPQSAQQQGGEQTPIFDFSQTE
DFPVALLRGGKGLPAEGKEKIQLEAQENIRNAITVQQGNAAGGDVKNQVFIDKIEGGGGITFS

Specific function: Required for the chromophorylation of the CpcA gene product [H]

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the CpcE/RpcE/PecE family [H]

Homologues:

Organism=Homo sapiens, GI294774572, Length=506, Percent_Identity=25.6916996047431, Blast_Score=69, Evalue=3e-11,
Organism=Caenorhabditis elegans, GI17531753, Length=271, Percent_Identity=27.6752767527675, Blast_Score=76, Evalue=1e-13,
Organism=Saccharomyces cerevisiae, GI6322531, Length=247, Percent_Identity=31.1740890688259, Blast_Score=67, Evalue=1e-11,
Organism=Drosophila melanogaster, GI24651728, Length=290, Percent_Identity=26.8965517241379, Blast_Score=81, Evalue=5e-15,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR011989
- InterPro:   IPR016024
- InterPro:   IPR004155 [H]

Pfam domain/function: PF03130 HEAT_PBS [H]

EC number: NA

Molecular weight: Translated: 149413; Mature: 149413

Theoretical pI: Translated: 4.86; Mature: 4.86

Prosite motif: PS50077 HEAT_REPEAT

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.6 %Cys     (Translated Protein)
1.6 %Met     (Translated Protein)
2.2 %Cys+Met (Translated Protein)
0.6 %Cys     (Mature Protein)
1.6 %Met     (Mature Protein)
2.2 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MINWGPYLESVCREYDRWWEVYTLTDVAGKKPHEQGQNIFPSFDLGLMVQRVKSEEKQGK
CCCCCHHHHHHHHHHHHHEEEEEEEHHCCCCCHHCCCCCCCCCCHHHHHHHHHHHHHCCC
DPQEKIERLTVLEGLRKYAANHVLLVGRPGSGKSTALARLLLEEAHKVWSGENGQIPILI
CHHHHHHHHHHHHHHHHHCCCCEEEEECCCCCHHHHHHHHHHHHHHHHHCCCCCCEEEEE
ELRYSKSSVLSRIQAFIDKHNHNTYIDEETLKSLLLQGKFLLLFDGFNEMASEEARQQVR
EEECCHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHCCCEEEEECCHHHHHHHHHHHHHH
MFRQDYPETAMVFSTRDLSLGGDLRIEKKLEMQPLTESQMQDFVCAYLPEQGENLWGQLQ
HHHHCCCCCEEEEEECCCCCCCCEEECCCCCCCCCCHHHHHHHHHHHCCCCCCHHHHHHH
GRLRELGETPMFLLMLCSVFDYNKVIPAHLGLVFRGFTQTYSGRIKQDVLVDESSRRWWD
HHHHHHCCCHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHCCCCHHHHHCCCCHHHHHH
RLLQELAWVMTTGGSKTEMMVAIPRKKAEDVLADFLRGQVVAPTDCAMGWLEDLLEYHLI
HHHHHHHHHHHCCCCCCEEEEEECCHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHEE
QVGDDGQISFRHQLLQEYYAAERLSSQLSGLSDYELQWDYLNYLKWTEVVALMLGLVEDE
EECCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCEEHHHHHHHHHHHHHHHHHHHHHHH
VLAVRVVRLALEVDWFLGARLVGEVKEKFQEAAFAEVDGLELPGLAKVVLAGLTMSEVTV
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHCCCHHHCCH
PRLVQFLEHSDKYMRGSAAHALGKIASEKAIEELIPLLKDSDEYVRWSAAYALGEIGSET
HHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCHH
AIEGLIPLLKDSDSFVCWSAANAMGKIGSQKAIEGLIPLLKDSDSFVRYAAAEALGKIDS
HHHHHHHHHCCCCCEEEEEHHHHHHHCCCHHHHHHHHHHHCCCCHHHHHHHHHHHHCCCH
EKAIEGLIPLLKDSDPNVNFSARSALSQIGSEKAIEQLIPLLKDSDEYVRYAAAEALGKI
HHHHHHHHHHHCCCCCCCCHHHHHHHHHHCHHHHHHHHHHHHCCCHHHHHHHHHHHHHHC
GSEKAIEQLIPLLKDSDSSVRSRAVYVLGKIGSEKAIEGLIPLLKDSDEFVRYSAVYVLG
CCHHHHHHHHHHHCCCCHHHHHHHHHEEECCCCHHHHHHHHHHHCCCHHHHHHHHHHHHH
EIGSEKAIEQLIPLLKDSNSSVNFSAAEALGKIGSEKAIEGLIPLLKDSDEFVRYTAAEA
HCCCHHHHHHHHHHHHCCCCCCCHHHHHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHHHH
LGKIGSEKAIEQLIPLLKDSDPNVRRNAAEALGEIGSETVIEQLIPLLKYSDPNVRYTAA
HHHCCCHHHHHHHHHHHCCCCCCHHHHHHHHHHHCCHHHHHHHHHHHHHCCCCCCEEEHH
EALGKIGSEKAIEQLIPLLKDSDPNVRYTAAEALGKIGSEKAIEQLIPLLKDSDPNVRRN
HHHHCCCCHHHHHHHHHHHCCCCCCEEEEHHHHHHCCCCHHHHHHHHHHHCCCCCCCHHH
AAYALGEIGSEKAIEGLIPLLKDSDSFVRSRAAYVLGEIGSEKAIEQLIPLLKDSDYWVR
HHHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHCCCCCHHH
DHVAEALGKIGSENTIIKLTKKLQNDSFVKQDLYKIIKIIQTIQQRLQYYKPTPKIPMSK
HHHHHHHHCCCCCCHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCC
SLSHNYALLIGVGDYKYPDWSLPVTVKDVQAIKSFLTNPDLCSYIDDENHLRLLCNEQAT
CCCCCEEEEEECCCCCCCCCCCCEEHHHHHHHHHHCCCCCHHHHCCCCCCEEEEECCHHH
KQNILNNINWLQEQAKNDPEATILVYYSGHGWLDKSTEKYYLIPHDTSPIKLQKTQKTAL
HHHHHHHHHHHHHHHCCCCCEEEEEEECCCCCCCCCCCEEEEEECCCCCEEEECCHHHCC
PATDFNNALQEISAQKLLVIIDSCHAQGMATAKETDQLDLPENFSQTALPKNLIEDLKKG
CCCHHHHHHHHHHHHHEEEEEECCCCCCCCCCCCCCCCCCCCCCCHHCCCHHHHHHHHCC
TGRAVFTSSTGYQLSWIRSDQTMSIYTYHLLEALQGGDNKPGDKYVTLSNLMHHVGKTVP
CCCEEEECCCCCEEEEEECCCCHHHHHHHHHHHHHCCCCCCCCCEEEHHHHHHHHCCCCC
QSAQQQGGEQTPIFDFSQTEDFPVALLRGGKGLPAEGKEKIQLEAQENIRNAITVQQGNA
HHHHHCCCCCCCCCCCCCCCCCCCCEEECCCCCCCCCCHHEEEEHHHHHHHHEEEECCCC
AGGDVKNQVFIDKIEGGGGITFS
CCCCCCCCEEEEEECCCCCCCCC
>Mature Secondary Structure
MINWGPYLESVCREYDRWWEVYTLTDVAGKKPHEQGQNIFPSFDLGLMVQRVKSEEKQGK
CCCCCHHHHHHHHHHHHHEEEEEEEHHCCCCCHHCCCCCCCCCCHHHHHHHHHHHHHCCC
DPQEKIERLTVLEGLRKYAANHVLLVGRPGSGKSTALARLLLEEAHKVWSGENGQIPILI
CHHHHHHHHHHHHHHHHHCCCCEEEEECCCCCHHHHHHHHHHHHHHHHHCCCCCCEEEEE
ELRYSKSSVLSRIQAFIDKHNHNTYIDEETLKSLLLQGKFLLLFDGFNEMASEEARQQVR
EEECCHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHCCCEEEEECCHHHHHHHHHHHHHH
MFRQDYPETAMVFSTRDLSLGGDLRIEKKLEMQPLTESQMQDFVCAYLPEQGENLWGQLQ
HHHHCCCCCEEEEEECCCCCCCCEEECCCCCCCCCCHHHHHHHHHHHCCCCCCHHHHHHH
GRLRELGETPMFLLMLCSVFDYNKVIPAHLGLVFRGFTQTYSGRIKQDVLVDESSRRWWD
HHHHHHCCCHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHCCCCHHHHHCCCCHHHHHH
RLLQELAWVMTTGGSKTEMMVAIPRKKAEDVLADFLRGQVVAPTDCAMGWLEDLLEYHLI
HHHHHHHHHHHCCCCCCEEEEEECCHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHEE
QVGDDGQISFRHQLLQEYYAAERLSSQLSGLSDYELQWDYLNYLKWTEVVALMLGLVEDE
EECCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCEEHHHHHHHHHHHHHHHHHHHHHHH
VLAVRVVRLALEVDWFLGARLVGEVKEKFQEAAFAEVDGLELPGLAKVVLAGLTMSEVTV
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHCCCHHHCCH
PRLVQFLEHSDKYMRGSAAHALGKIASEKAIEELIPLLKDSDEYVRWSAAYALGEIGSET
HHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCHH
AIEGLIPLLKDSDSFVCWSAANAMGKIGSQKAIEGLIPLLKDSDSFVRYAAAEALGKIDS
HHHHHHHHHCCCCCEEEEEHHHHHHHCCCHHHHHHHHHHHCCCCHHHHHHHHHHHHCCCH
EKAIEGLIPLLKDSDPNVNFSARSALSQIGSEKAIEQLIPLLKDSDEYVRYAAAEALGKI
HHHHHHHHHHHCCCCCCCCHHHHHHHHHHCHHHHHHHHHHHHCCCHHHHHHHHHHHHHHC
GSEKAIEQLIPLLKDSDSSVRSRAVYVLGKIGSEKAIEGLIPLLKDSDEFVRYSAVYVLG
CCHHHHHHHHHHHCCCCHHHHHHHHHEEECCCCHHHHHHHHHHHCCCHHHHHHHHHHHHH
EIGSEKAIEQLIPLLKDSNSSVNFSAAEALGKIGSEKAIEGLIPLLKDSDEFVRYTAAEA
HCCCHHHHHHHHHHHHCCCCCCCHHHHHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHHHH
LGKIGSEKAIEQLIPLLKDSDPNVRRNAAEALGEIGSETVIEQLIPLLKYSDPNVRYTAA
HHHCCCHHHHHHHHHHHCCCCCCHHHHHHHHHHHCCHHHHHHHHHHHHHCCCCCCEEEHH
EALGKIGSEKAIEQLIPLLKDSDPNVRYTAAEALGKIGSEKAIEQLIPLLKDSDPNVRRN
HHHHCCCCHHHHHHHHHHHCCCCCCEEEEHHHHHHCCCCHHHHHHHHHHHCCCCCCCHHH
AAYALGEIGSEKAIEGLIPLLKDSDSFVRSRAAYVLGEIGSEKAIEQLIPLLKDSDYWVR
HHHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHCCCCCHHH
DHVAEALGKIGSENTIIKLTKKLQNDSFVKQDLYKIIKIIQTIQQRLQYYKPTPKIPMSK
HHHHHHHHCCCCCCHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCC
SLSHNYALLIGVGDYKYPDWSLPVTVKDVQAIKSFLTNPDLCSYIDDENHLRLLCNEQAT
CCCCCEEEEEECCCCCCCCCCCCEEHHHHHHHHHHCCCCCHHHHCCCCCCEEEEECCHHH
KQNILNNINWLQEQAKNDPEATILVYYSGHGWLDKSTEKYYLIPHDTSPIKLQKTQKTAL
HHHHHHHHHHHHHHHCCCCCEEEEEEECCCCCCCCCCCEEEEEECCCCCEEEECCHHHCC
PATDFNNALQEISAQKLLVIIDSCHAQGMATAKETDQLDLPENFSQTALPKNLIEDLKKG
CCCHHHHHHHHHHHHHEEEEEECCCCCCCCCCCCCCCCCCCCCCCHHCCCHHHHHHHHCC
TGRAVFTSSTGYQLSWIRSDQTMSIYTYHLLEALQGGDNKPGDKYVTLSNLMHHVGKTVP
CCCEEEECCCCCEEEEEECCCCHHHHHHHHHHHHHCCCCCCCCCEEEHHHHHHHHCCCCC
QSAQQQGGEQTPIFDFSQTEDFPVALLRGGKGLPAEGKEKIQLEAQENIRNAITVQQGNA
HHHHHCCCCCCCCCCCCCCCCCCCCEEECCCCCCCCCCHHEEEEHHHHHHHHEEEECCCC
AGGDVKNQVFIDKIEGGGGITFS
CCCCCCCCEEEEEECCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 12240834 [H]