BacMap

Definition	Shigella flexneri 2a str. 2457T, complete genome.
Accession	NC_004741
Length	4,599,354

Click here to switch to the map view.

The map label for this gene is rpoC

Identifier: 30064729

GI number: 30064729

Start: 3563893

End: 3568116

Strand: Reverse

Name: rpoC

Synonym: S3674

Alternate gene names: 30064729

Gene position: 3568116-3563893 (Counterclockwise)

Preceding gene: 30064730

Following gene: 30064722

Centisome position: 77.58

GC content: 53.91

Gene sequence:

>4224_bases
GTGAAAGATTTATTAAAGTTTCTGAAAGCGCAGACTAAAACCGAAGAGTTTGATGCGATCAAAATTGCTCTGGCTTCGCC
AGACATGATCCGTTCATGGTCTTTCGGTGAAGTTAAAAAGCCGGAAACCATCAACTACCGTACGTTCAAACCAGAACGTG
ACGGCCTTTTCTGCGCCCGTATCTTTGGGCCGGTAAAAGATTACGAGTGCCTGTGCGGTAAGTACAAGCGCCTGAAACAC
CGTGGCGTCATCTGTGAGAAGTGCGGCGTTGAAGTGACCCAGACTAAAGTACGCCGTGAGCGTATGGGCCACATCGAACT
GGCTTCCCCGACTGCGCACATCTGGTTCCTGAAATCGCTGCCGTCCCGTATCGGTCTGCTGCTCGATATGCCGCTGCGCG
ATATCGAACGCGTACTGTACTTTGAATCCTATGTGGTTATCGAAGGCGGTATGACCAACCTGGAACGTCAGCAGATCCTG
ACTGAAGAGCAGTATCTGGACGCGCTGGAAGAGTTCGGTGACGAATTCGACGCGAAGATGGGTGCGGAAGCAATCCAGGC
TCTGCTGAAGAGCATGGATCTGGAGCAAGAGTGCGAACAGCTGCGTGAAGAGCTGAACGAAACCAACTCCGAAACCAAGC
GTAAAAAGCTGACCAAGCGTATCAAACTGCTGGAAGCGTTCGTTCAGTCTGGTAACAAACCAGAGTGGATGATCCTGACC
GTTCTGCCGGTACTGCCGCCAGATCTGCGTCCGCTGGTTCCGCTGGATGGTGGTCGTTTCGCGACTTCTGACCTGAACGA
TCTGTATCGTCGCGTCATTAACCGTAACAACCGTCTGAAACGTCTGCTGGATCTGGCTGCGCCGGACATCATCGTACGTA
ACGAAAAACGTATGCTGCAGGAAGCGGTAGACGCCCTGCTGGATAACGGTCGTCGCGGTCGTGCGATCACCGGTTCTAAC
AAGCGTCCTCTGAAATCTTTGGCCGACATGATCAAAGGTAAACAGGGTCGTTTCCGTCAGAACCTGCTCGGTAAGCGTGT
TGACTACTCCGGTCGTTCTGTAATCACCGTAGGTCCATACCTGCGTCTGCATCAGTGCGGTCTGCCGAAGAAAATGGCGC
TGGAGCTGTTCAAACCGTTCATCTACGGCAAGCTGGAACTGCGTGGTCTTGCTACCACCATTAAAGCTGCGAAGAAAATG
GTTGAGCGCGAAGAAGCTGTCGTTTGGGATATCCTGGACGAAGTTATCCGCGAACACCCGGTACTGCTGAACCGTGCACC
GACTCTGCACCGTCTGGGTATCCAGGCATTTGAACCGGTACTGATCGAAGGTAAAGCTATCCAGCTGCACCCGCTGGTTT
GTGCGGCATATAACGCCGACTTCGATGGTGACCAGATGGCTGTTCACGTACCGCTGACGCTGGAAGCCCAGCTGGAAGCG
CGTGCGCTGATGATGTCTACCAACAACATCCTGTCCCCGGCGAACGGCGAACCAATCATCGTTCCGTCTCAGGACGTTGT
ACTGGGTCTGTACTACATGACCCGTGACTGTGTTAACGCCAAAGGCGAAGGCATGGTGCTGACTGGCCCGAAAGAAGCAG
AACGTCTGTATCGCTCTGGTCTGGCTTCTCTGCATGCGCGCGTTAAAGTGCGTATCACCGAGTATGAAAAAGATGCTAAC
GGTGAATTAGTAGCGAAAACCAGCCTGAAAGACACGACTGTTGGCCGTGCCATTCTGTGGATGATTGTACCGAAAGGTCT
GCCTTACTCCATCGTCAACCAGGCGCTGGGTAAAAAAGCAATCTCCAAAATGCTGAACACCTGCTACCGCATTCTCGGTC
TGAAACCGACCGTTATTTTTGCGGACCAGATCATGTACACCGGCTTCGCCTATGCAGCGCGTTCTGGTGCATCTGTTGGC
ATCGATGACATGGTCATCCCGGAGAAGAAACACGAAATCATCTCCGAGGCAGAAGCAGAAGTTGCTGAAATTCAGGAGCA
GTTCCAGTCTGGTCTGGTAACTGCGGGCGAACGCTACAACAAAGTTATCGATATCTGGGCTGCGGCGAACGATCGTGTAT
CCAAAGCGATGATGGATAACCTGCAAACTGAAACCGTTATTAACCGTGACGGTCAGGAAGAGAAGCAGGTTTCCTTCAAC
AGCATCTACATGATGGCCGACTCCGGTGCGCGTGGTTCTGCGGCACAGATTCGTCAGCTTGCTGGTATGCGTGGTCTGAT
GGCAAAGCCGGATGGCTCCATCATCGAAACGCCAATCACCGCGAACTTCCGTGAAGGTCTGAACGTACTCCAGTACTTCA
TCTCCACCCACGGTGCTCGTAAAGGTCTGGCGGATACCGCACTGAAAACTGCGAACTCCGGTTACCTGACTCGTCGTCTG
GTTGACGTGGCGCAGGACCTGGTGGTTACCGAAGACGATTGTGGTACCCATGAAGGTATCATGATGACTCCGGTTATCGA
GGGGGGTGACGTTAAAGAGCCGCTGCGCGATCGCGTACTGGGTCGTGTAACTGCTGAAGACGTTCTGAAGCCGGGTACTG
CTGATATTCTCGTTCCGCGCAACACGCTGCTGCACGAACAGTGGTGTGACCTGCTGGAAGAGAACTCTGTCGACGCGGTA
AAAGTACGTTCTGTTGTATCTTGTGACACCGACTTTGGTGTATGTGCGCACTGCTACGGTCGTGACCTGGCGCGTGGCCA
CATCATCAACAAAGGTGAAGCAATCGGTGTTATCGCGGCACAGTCCATCGGTGAACCGGGTACACAGCTGACCATGCGTA
CGTTCCACATCGGTGGTGCGGCATCTCGTGCGGCTGCTGAATCCAGCATCCAGGTGAAAAACAAAGGTAGCATCAAGCTC
AGCAACGTGAAGTCGGTTGTGAACTCCAGCGGTAAACTGGTTATCACTTCCCGTAACACCGAACTGAAACTGATCGACGA
ATTCGGTCGTACCAAAGAAAGCTACAAAGTGCCTTACGGTGCGGTACTGGCGAAAGGCGATGGCGAACAGGTTGCTGGCG
GCGAAACCGTTGCAAACTGGGACCCGCACACCATGCCGGTTATCACCGAAGTAAGCGGTTTTGTACGCTTTACTGACATG
ATCGACGGCCAGACCATTACTCGTCAGACCGACGAACTGACCGGTCTGTCTTCGCTGGTGGTTCTGGATTCCGCAGAACG
TACCGCAGGTGGTAAAGATCTGCGTCCGGCACTGAAAATCGTTGATGCTCAGGGTAACGACGTTCTGATCCCAGGTACCG
ATATGCCTGCGCAGTACTTCCTGCCGGGTAAAGCGATTGTTCAGCTGGAAGATGGCGTACAGATCAGCTCTGGTGACACC
TTGGCGCGTATTCCGCAGGAATCCGGCGGTACCAAGGACATCACCGGTGGTCTGCCGCGCGTTGCGGACCTGTTCGAAGC
TCGTCGTCCGAAAGAGCCGGCAATCCTGGCTGAAATCAGCGGTATCGTTTCCTTCGGTAAAGAAACCAAAGGTAAACGTC
GTCTGGTTATCACCCCGGTAGACGGTAGCGATCCGTACGAAGAGATGATTCCGAAATGGCGTCAGCTCAACGTGTTCGAA
GGTGAACGTGTAGAACGTGGTGACGTAATTTCCGACGGTCCGGAAGCGCCGCACGACATTCTGCGTCTGCGTGGTGTTCA
TGCTGTGACTCGTTACATCGTTAACGAAGTACAGGACGTATACCGTCTGCAGGGCGTAAAGATTAACGATAAACACATCG
AAGTTATCGTTCGTCAGATGCTGCGTAAAGCTACCATCGTTAACGCGGGCAGCTCCGACTTCCTGGAAGGCGAACAGGTT
GAATACTCTCGCGTCAAGATCGCAAACCGCGAACTGGAAGCGAACGGCAAAGTGGGTGCAACTTACTCCCGCGATCTGCT
GGGTATCACCAAAGCGTCTCTGGCAACCGAGTCCTTCATCTCCGCGGCATCGTTCCAGGAGACCACTCGCGTGCTGACCG
AAGCAGCCGTTGCGGGCAAACGCGACGAACTGCGCGGCCTGAAAGAGAACGTTATCGTGGGTCGTCTGATCCCGGCAGGT
ACCGGTTACGCGTACCACCAGGATCGTATGCGTCGCCGTGCTGCGGGTGAAGCTCCGGCTGCACCGCAGGTGACTGCAGA
AGACGCATCTGCCAGCCTGGCAGAACTGCTGAACGCAGGTCTGGGCGGTTCTGATAACGAGTAA

Upstream 100 bases:

>100_bases
AACATCGAACTGGAAGACGAGTAATTCTCGCTCAAACAGGTCACTGCTGTCGGGGTAAAACCCGGCAGCGGATTGTGCTA
ACTCCGACGGGAGCAAATCC

Downstream 100 bases:

>100_bases
TCGTTAATCCGCAAATAACGTAAAAACCCGCTTCGGCGGGTTTTTTTATGGGTGTTATTCAGAGGGCAAATTCTTCACGG
AAAATATTAAGAAAGGCAGG

Product: DNA-directed RNA polymerase subunit beta'

Products: NA

Alternate protein names: RNAP subunit beta'; RNA polymerase subunit beta'; Transcriptase subunit beta' [H]

Number of amino acids: Translated: 1407; Mature: 1407

Protein sequence:

>1407_residues
MKDLLKFLKAQTKTEEFDAIKIALASPDMIRSWSFGEVKKPETINYRTFKPERDGLFCARIFGPVKDYECLCGKYKRLKH
RGVICEKCGVEVTQTKVRRERMGHIELASPTAHIWFLKSLPSRIGLLLDMPLRDIERVLYFESYVVIEGGMTNLERQQIL
TEEQYLDALEEFGDEFDAKMGAEAIQALLKSMDLEQECEQLREELNETNSETKRKKLTKRIKLLEAFVQSGNKPEWMILT
VLPVLPPDLRPLVPLDGGRFATSDLNDLYRRVINRNNRLKRLLDLAAPDIIVRNEKRMLQEAVDALLDNGRRGRAITGSN
KRPLKSLADMIKGKQGRFRQNLLGKRVDYSGRSVITVGPYLRLHQCGLPKKMALELFKPFIYGKLELRGLATTIKAAKKM
VEREEAVVWDILDEVIREHPVLLNRAPTLHRLGIQAFEPVLIEGKAIQLHPLVCAAYNADFDGDQMAVHVPLTLEAQLEA
RALMMSTNNILSPANGEPIIVPSQDVVLGLYYMTRDCVNAKGEGMVLTGPKEAERLYRSGLASLHARVKVRITEYEKDAN
GELVAKTSLKDTTVGRAILWMIVPKGLPYSIVNQALGKKAISKMLNTCYRILGLKPTVIFADQIMYTGFAYAARSGASVG
IDDMVIPEKKHEIISEAEAEVAEIQEQFQSGLVTAGERYNKVIDIWAAANDRVSKAMMDNLQTETVINRDGQEEKQVSFN
SIYMMADSGARGSAAQIRQLAGMRGLMAKPDGSIIETPITANFREGLNVLQYFISTHGARKGLADTALKTANSGYLTRRL
VDVAQDLVVTEDDCGTHEGIMMTPVIEGGDVKEPLRDRVLGRVTAEDVLKPGTADILVPRNTLLHEQWCDLLEENSVDAV
KVRSVVSCDTDFGVCAHCYGRDLARGHIINKGEAIGVIAAQSIGEPGTQLTMRTFHIGGAASRAAAESSIQVKNKGSIKL
SNVKSVVNSSGKLVITSRNTELKLIDEFGRTKESYKVPYGAVLAKGDGEQVAGGETVANWDPHTMPVITEVSGFVRFTDM
IDGQTITRQTDELTGLSSLVVLDSAERTAGGKDLRPALKIVDAQGNDVLIPGTDMPAQYFLPGKAIVQLEDGVQISSGDT
LARIPQESGGTKDITGGLPRVADLFEARRPKEPAILAEISGIVSFGKETKGKRRLVITPVDGSDPYEEMIPKWRQLNVFE
GERVERGDVISDGPEAPHDILRLRGVHAVTRYIVNEVQDVYRLQGVKINDKHIEVIVRQMLRKATIVNAGSSDFLEGEQV
EYSRVKIANRELEANGKVGATYSRDLLGITKASLATESFISAASFQETTRVLTEAAVAGKRDELRGLKENVIVGRLIPAG
TGYAYHQDRMRRRAAGEAPAAPQVTAEDASASLAELLNAGLGGSDNE

Sequences:

>Translated_1407_residues
MKDLLKFLKAQTKTEEFDAIKIALASPDMIRSWSFGEVKKPETINYRTFKPERDGLFCARIFGPVKDYECLCGKYKRLKH
RGVICEKCGVEVTQTKVRRERMGHIELASPTAHIWFLKSLPSRIGLLLDMPLRDIERVLYFESYVVIEGGMTNLERQQIL
TEEQYLDALEEFGDEFDAKMGAEAIQALLKSMDLEQECEQLREELNETNSETKRKKLTKRIKLLEAFVQSGNKPEWMILT
VLPVLPPDLRPLVPLDGGRFATSDLNDLYRRVINRNNRLKRLLDLAAPDIIVRNEKRMLQEAVDALLDNGRRGRAITGSN
KRPLKSLADMIKGKQGRFRQNLLGKRVDYSGRSVITVGPYLRLHQCGLPKKMALELFKPFIYGKLELRGLATTIKAAKKM
VEREEAVVWDILDEVIREHPVLLNRAPTLHRLGIQAFEPVLIEGKAIQLHPLVCAAYNADFDGDQMAVHVPLTLEAQLEA
RALMMSTNNILSPANGEPIIVPSQDVVLGLYYMTRDCVNAKGEGMVLTGPKEAERLYRSGLASLHARVKVRITEYEKDAN
GELVAKTSLKDTTVGRAILWMIVPKGLPYSIVNQALGKKAISKMLNTCYRILGLKPTVIFADQIMYTGFAYAARSGASVG
IDDMVIPEKKHEIISEAEAEVAEIQEQFQSGLVTAGERYNKVIDIWAAANDRVSKAMMDNLQTETVINRDGQEEKQVSFN
SIYMMADSGARGSAAQIRQLAGMRGLMAKPDGSIIETPITANFREGLNVLQYFISTHGARKGLADTALKTANSGYLTRRL
VDVAQDLVVTEDDCGTHEGIMMTPVIEGGDVKEPLRDRVLGRVTAEDVLKPGTADILVPRNTLLHEQWCDLLEENSVDAV
KVRSVVSCDTDFGVCAHCYGRDLARGHIINKGEAIGVIAAQSIGEPGTQLTMRTFHIGGAASRAAAESSIQVKNKGSIKL
SNVKSVVNSSGKLVITSRNTELKLIDEFGRTKESYKVPYGAVLAKGDGEQVAGGETVANWDPHTMPVITEVSGFVRFTDM
IDGQTITRQTDELTGLSSLVVLDSAERTAGGKDLRPALKIVDAQGNDVLIPGTDMPAQYFLPGKAIVQLEDGVQISSGDT
LARIPQESGGTKDITGGLPRVADLFEARRPKEPAILAEISGIVSFGKETKGKRRLVITPVDGSDPYEEMIPKWRQLNVFE
GERVERGDVISDGPEAPHDILRLRGVHAVTRYIVNEVQDVYRLQGVKINDKHIEVIVRQMLRKATIVNAGSSDFLEGEQV
EYSRVKIANRELEANGKVGATYSRDLLGITKASLATESFISAASFQETTRVLTEAAVAGKRDELRGLKENVIVGRLIPAG
TGYAYHQDRMRRRAAGEAPAAPQVTAEDASASLAELLNAGLGGSDNE
>Mature_1407_residues
MKDLLKFLKAQTKTEEFDAIKIALASPDMIRSWSFGEVKKPETINYRTFKPERDGLFCARIFGPVKDYECLCGKYKRLKH
RGVICEKCGVEVTQTKVRRERMGHIELASPTAHIWFLKSLPSRIGLLLDMPLRDIERVLYFESYVVIEGGMTNLERQQIL
TEEQYLDALEEFGDEFDAKMGAEAIQALLKSMDLEQECEQLREELNETNSETKRKKLTKRIKLLEAFVQSGNKPEWMILT
VLPVLPPDLRPLVPLDGGRFATSDLNDLYRRVINRNNRLKRLLDLAAPDIIVRNEKRMLQEAVDALLDNGRRGRAITGSN
KRPLKSLADMIKGKQGRFRQNLLGKRVDYSGRSVITVGPYLRLHQCGLPKKMALELFKPFIYGKLELRGLATTIKAAKKM
VEREEAVVWDILDEVIREHPVLLNRAPTLHRLGIQAFEPVLIEGKAIQLHPLVCAAYNADFDGDQMAVHVPLTLEAQLEA
RALMMSTNNILSPANGEPIIVPSQDVVLGLYYMTRDCVNAKGEGMVLTGPKEAERLYRSGLASLHARVKVRITEYEKDAN
GELVAKTSLKDTTVGRAILWMIVPKGLPYSIVNQALGKKAISKMLNTCYRILGLKPTVIFADQIMYTGFAYAARSGASVG
IDDMVIPEKKHEIISEAEAEVAEIQEQFQSGLVTAGERYNKVIDIWAAANDRVSKAMMDNLQTETVINRDGQEEKQVSFN
SIYMMADSGARGSAAQIRQLAGMRGLMAKPDGSIIETPITANFREGLNVLQYFISTHGARKGLADTALKTANSGYLTRRL
VDVAQDLVVTEDDCGTHEGIMMTPVIEGGDVKEPLRDRVLGRVTAEDVLKPGTADILVPRNTLLHEQWCDLLEENSVDAV
KVRSVVSCDTDFGVCAHCYGRDLARGHIINKGEAIGVIAAQSIGEPGTQLTMRTFHIGGAASRAAAESSIQVKNKGSIKL
SNVKSVVNSSGKLVITSRNTELKLIDEFGRTKESYKVPYGAVLAKGDGEQVAGGETVANWDPHTMPVITEVSGFVRFTDM
IDGQTITRQTDELTGLSSLVVLDSAERTAGGKDLRPALKIVDAQGNDVLIPGTDMPAQYFLPGKAIVQLEDGVQISSGDT
LARIPQESGGTKDITGGLPRVADLFEARRPKEPAILAEISGIVSFGKETKGKRRLVITPVDGSDPYEEMIPKWRQLNVFE
GERVERGDVISDGPEAPHDILRLRGVHAVTRYIVNEVQDVYRLQGVKINDKHIEVIVRQMLRKATIVNAGSSDFLEGEQV
EYSRVKIANRELEANGKVGATYSRDLLGITKASLATESFISAASFQETTRVLTEAAVAGKRDELRGLKENVIVGRLIPAG
TGYAYHQDRMRRRAAGEAPAAPQVTAEDASASLAELLNAGLGGSDNE

Specific function: DNA-dependent RNA polymerase catalyzes the transcription of DNA into RNA using the four ribonucleoside triphosphates as substrates [H]

COG id: COG0086

COG function: function code K; DNA-directed RNA polymerase, beta' subunit/160 kD subunit

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the RNA polymerase beta' chain family [H]

Homologues:

Organism=Homo sapiens, GI4505939, Length=921, Percent_Identity=26.1672095548317, Blast_Score=206, Evalue=1e-52,
Organism=Homo sapiens, GI103471997, Length=600, Percent_Identity=27.3333333333333, Blast_Score=137, Evalue=6e-32,
Organism=Homo sapiens, GI39725938, Length=308, Percent_Identity=31.4935064935065, Blast_Score=136, Evalue=1e-31,
Organism=Escherichia coli, GI2367335, Length=1407, Percent_Identity=100, Blast_Score=2886, Evalue=0.0,
Organism=Caenorhabditis elegans, GI71987878, Length=911, Percent_Identity=24.5883644346872, Blast_Score=183, Evalue=5e-46,
Organism=Caenorhabditis elegans, GI25145495, Length=319, Percent_Identity=31.6614420062696, Blast_Score=149, Evalue=1e-35,
Organism=Saccharomyces cerevisiae, GI6320061, Length=660, Percent_Identity=26.0606060606061, Blast_Score=173, Evalue=2e-43,
Organism=Saccharomyces cerevisiae, GI6324690, Length=763, Percent_Identity=25.8191349934469, Blast_Score=171, Evalue=8e-43,
Organism=Drosophila melanogaster, GI17530899, Length=841, Percent_Identity=25.2080856123662, Blast_Score=188, Evalue=2e-47,
Organism=Drosophila melanogaster, GI281360912, Length=322, Percent_Identity=29.8136645962733, Blast_Score=134, Evalue=6e-31,
Organism=Drosophila melanogaster, GI17647875, Length=328, Percent_Identity=28.6585365853659, Blast_Score=101, Evalue=3e-21,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR000722
- InterPro:   IPR006592
- InterPro:   IPR007080
- InterPro:   IPR007066
- InterPro:   IPR007083
- InterPro:   IPR007081
- InterPro:   IPR012754 [H]

Pfam domain/function: PF04997 RNA_pol_Rpb1_1; PF00623 RNA_pol_Rpb1_2; PF04983 RNA_pol_Rpb1_3; PF05000 RNA_pol_Rpb1_4; PF04998 RNA_pol_Rpb1_5 [H]

EC number: =2.7.7.6 [H]

Molecular weight: Translated: 155162; Mature: 155162

Theoretical pI: Translated: 7.07; Mature: 7.07

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.1 %Cys     (Translated Protein)
2.6 %Met     (Translated Protein)
3.6 %Cys+Met (Translated Protein)
1.1 %Cys     (Mature Protein)
2.6 %Met     (Mature Protein)
3.6 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MKDLLKFLKAQTKTEEFDAIKIALASPDMIRSWSFGEVKKPETINYRTFKPERDGLFCAR
CHHHHHHHHHHCCCCCCCEEEEEECCCHHHHCCCCCCCCCCCCCCEEECCCCCCCEEEEH
IFGPVKDYECLCGKYKRLKHRGVICEKCGVEVTQTKVRRERMGHIELASPTAHIWFLKSL
HHCCCCHHHHHHHHHHHHHHCCCCHHHCCCHHHHHHHHHHHCCCEEECCCCEEEHHHHHH
PSRIGLLLDMPLRDIERVLYFESYVVIEGGMTNLERQQILTEEQYLDALEEFGDEFDAKM
HHHHCEEECCCHHHHHHHHHHHEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHH
GAEAIQALLKSMDLEQECEQLREELNETNSETKRKKLTKRIKLLEAFVQSGNKPEWMILT
HHHHHHHHHHHCCHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHCCCCCCEEEEE
VLPVLPPDLRPLVPLDGGRFATSDLNDLYRRVINRNNRLKRLLDLAAPDIIVRNEKRMLQ
EECCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHCCCHHHHHHHHHCCCCEEEECHHHHHH
EAVDALLDNGRRGRAITGSNKRPLKSLADMIKGKQGRFRQNLLGKRVDYSGRSVITVGPY
HHHHHHHCCCCCCCEECCCCCCHHHHHHHHHCCCCCHHHHHHHCCCCCCCCCEEEEECCC
LRLHQCGLPKKMALELFKPFIYGKLELRGLATTIKAAKKMVEREEAVVWDILDEVIREHP
HHHHHCCCCHHHHHHHHHHHHHCEEEEHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC
VLLNRAPTLHRLGIQAFEPVLIEGKAIQLHPLVCAAYNADFDGDQMAVHVPLTLEAQLEA
EEECCCCCHHHHCHHHCCCEEECCCEEEEECEEEEEECCCCCCCCEEEEEEEEEECCHHH
RALMMSTNNILSPANGEPIIVPSQDVVLGLYYMTRDCVNAKGEGMVLTGPKEAERLYRSG
HHHEEECCCCCCCCCCCEEEECCCHHHHHHHHHHHHHHCCCCCEEEEECCHHHHHHHHHH
LASLHARVKVRITEYEKDANGELVAKTSLKDTTVGRAILWMIVPKGLPYSIVNQALGKKA
HHHHEEEEEEEEEEECCCCCCCEEEECCCCCHHHHHEEEEEEECCCCCHHHHHHHHHHHH
ISKMLNTCYRILGLKPTVIFADQIMYTGFAYAARSGASVGIDDMVIPEKKHEIISEAEAE
HHHHHHHHHHHHCCCCCEEEHHHHHHHHHHHHHCCCCCCCCCCCCCCCHHHHHHHHHHHH
VAEIQEQFQSGLVTAGERYNKVIDIWAAANDRVSKAMMDNLQTETVINRDGQEEKQVSFN
HHHHHHHHHCCCCCCCHHHCCEEEEEECCCHHHHHHHHHCCCHHHHHCCCCCHHHHCEEE
SIYMMADSGARGSAAQIRQLAGMRGLMAKPDGSIIETPITANFREGLNVLQYFISTHGAR
EEEEEECCCCCCCHHHHHHHHCCCCCCCCCCCCEEECCCCCCHHHHHHHHHHHHHHCCCC
KGLADTALKTANSGYLTRRLVDVAQDLVVTEDDCGTHEGIMMTPVIEGGDVKEPLRDRVL
CCHHHHHHHHCCCCHHHHHHHHHHHHHEEECCCCCCCCCEEEEEEECCCCCCHHHHHHHH
GRVTAEDVLKPGTADILVPRNTLLHEQWCDLLEENSVDAVKVRSVVSCDTDFGVCAHCYG
HHCCHHHHHCCCCCEEEECCHHHHHHHHHHHHHCCCCCHHHHHHHHCCCCCCCHHHHHHC
RDLARGHIINKGEAIGVIAAQSIGEPGTQLTMRTFHIGGAASRAAAESSIQVKNKGSIKL
CHHHCCCEECCCCEEEEEEECCCCCCCCEEEEEEEECCCCHHHHHCCCCEEEECCCCEEE
SNVKSVVNSSGKLVITSRNTELKLIDEFGRTKESYKVPYGAVLAKGDGEQVAGGETVANW
HHHHHHHCCCCCEEEEECCCCEEEHHHHCCCCHHCCCCCCEEEECCCCCCCCCCCEECCC
DPHTMPVITEVSGFVRFTDMIDGQTITRQTDELTGLSSLVVLDSAERTAGGKDLRPALKI
CCCCCHHHHHHHHHEEEHHHHCCCCHHCCHHHHCCCCCEEEEECCHHCCCCCCCCCHHEE
VDAQGNDVLIPGTDMPAQYFLPGKAIVQLEDGVQISSGDTLARIPQESGGTKDITGGLPR
EECCCCEEEECCCCCCCEEECCCCEEEEEECCEEECCCCCCEECCCCCCCCCCCCCCCHH
VADLFEARRPKEPAILAEISGIVSFGKETKGKRRLVITPVDGSDPYEEMIPKWRQLNVFE
HHHHHHHCCCCCCHHHHHHHHHHHHCCCCCCCEEEEEEECCCCCCHHHHCCHHHCCCCCC
GERVERGDVISDGPEAPHDILRLRGVHAVTRYIVNEVQDVYRLQGVKINDKHIEVIVRQM
CCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCEECHHHHHHHHHHH
LRKATIVNAGSSDFLEGEQVEYSRVKIANRELEANGKVGATYSRDLLGITKASLATESFI
HHHHHEECCCCCCCCCCCCCHHHHHEEECCEECCCCCCCCCCCCHHHHHHHHHHHHHHHH
SAASFQETTRVLTEAAVAGKRDELRGLKENVIVGRLIPAGTGYAYHQDRMRRRAAGEAPA
HHHHHHHHHHHHHHHHHCCCHHHHHCHHHCCEEEEEECCCCCCHHHHHHHHHHHCCCCCC
APQVTAEDASASLAELLNAGLGGSDNE
CCCCCHHHHHHHHHHHHHCCCCCCCCC
>Mature Secondary Structure
MKDLLKFLKAQTKTEEFDAIKIALASPDMIRSWSFGEVKKPETINYRTFKPERDGLFCAR
CHHHHHHHHHHCCCCCCCEEEEEECCCHHHHCCCCCCCCCCCCCCEEECCCCCCCEEEEH
IFGPVKDYECLCGKYKRLKHRGVICEKCGVEVTQTKVRRERMGHIELASPTAHIWFLKSL
HHCCCCHHHHHHHHHHHHHHCCCCHHHCCCHHHHHHHHHHHCCCEEECCCCEEEHHHHHH
PSRIGLLLDMPLRDIERVLYFESYVVIEGGMTNLERQQILTEEQYLDALEEFGDEFDAKM
HHHHCEEECCCHHHHHHHHHHHEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHH
GAEAIQALLKSMDLEQECEQLREELNETNSETKRKKLTKRIKLLEAFVQSGNKPEWMILT
HHHHHHHHHHHCCHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHCCCCCCEEEEE
VLPVLPPDLRPLVPLDGGRFATSDLNDLYRRVINRNNRLKRLLDLAAPDIIVRNEKRMLQ
EECCCCCCCCCCCCCCCCCCCCCHHHHHHHHHHCCCHHHHHHHHHCCCCEEEECHHHHHH
EAVDALLDNGRRGRAITGSNKRPLKSLADMIKGKQGRFRQNLLGKRVDYSGRSVITVGPY
HHHHHHHCCCCCCCEECCCCCCHHHHHHHHHCCCCCHHHHHHHCCCCCCCCCEEEEECCC
LRLHQCGLPKKMALELFKPFIYGKLELRGLATTIKAAKKMVEREEAVVWDILDEVIREHP
HHHHHCCCCHHHHHHHHHHHHHCEEEEHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC
VLLNRAPTLHRLGIQAFEPVLIEGKAIQLHPLVCAAYNADFDGDQMAVHVPLTLEAQLEA
EEECCCCCHHHHCHHHCCCEEECCCEEEEECEEEEEECCCCCCCCEEEEEEEEEECCHHH
RALMMSTNNILSPANGEPIIVPSQDVVLGLYYMTRDCVNAKGEGMVLTGPKEAERLYRSG
HHHEEECCCCCCCCCCCEEEECCCHHHHHHHHHHHHHHCCCCCEEEEECCHHHHHHHHHH
LASLHARVKVRITEYEKDANGELVAKTSLKDTTVGRAILWMIVPKGLPYSIVNQALGKKA
HHHHEEEEEEEEEEECCCCCCCEEEECCCCCHHHHHEEEEEEECCCCCHHHHHHHHHHHH
ISKMLNTCYRILGLKPTVIFADQIMYTGFAYAARSGASVGIDDMVIPEKKHEIISEAEAE
HHHHHHHHHHHHCCCCCEEEHHHHHHHHHHHHHCCCCCCCCCCCCCCCHHHHHHHHHHHH
VAEIQEQFQSGLVTAGERYNKVIDIWAAANDRVSKAMMDNLQTETVINRDGQEEKQVSFN
HHHHHHHHHCCCCCCCHHHCCEEEEEECCCHHHHHHHHHCCCHHHHHCCCCCHHHHCEEE
SIYMMADSGARGSAAQIRQLAGMRGLMAKPDGSIIETPITANFREGLNVLQYFISTHGAR
EEEEEECCCCCCCHHHHHHHHCCCCCCCCCCCCEEECCCCCCHHHHHHHHHHHHHHCCCC
KGLADTALKTANSGYLTRRLVDVAQDLVVTEDDCGTHEGIMMTPVIEGGDVKEPLRDRVL
CCHHHHHHHHCCCCHHHHHHHHHHHHHEEECCCCCCCCCEEEEEEECCCCCCHHHHHHHH
GRVTAEDVLKPGTADILVPRNTLLHEQWCDLLEENSVDAVKVRSVVSCDTDFGVCAHCYG
HHCCHHHHHCCCCCEEEECCHHHHHHHHHHHHHCCCCCHHHHHHHHCCCCCCCHHHHHHC
RDLARGHIINKGEAIGVIAAQSIGEPGTQLTMRTFHIGGAASRAAAESSIQVKNKGSIKL
CHHHCCCEECCCCEEEEEEECCCCCCCCEEEEEEEECCCCHHHHHCCCCEEEECCCCEEE
SNVKSVVNSSGKLVITSRNTELKLIDEFGRTKESYKVPYGAVLAKGDGEQVAGGETVANW
HHHHHHHCCCCCEEEEECCCCEEEHHHHCCCCHHCCCCCCEEEECCCCCCCCCCCEECCC
DPHTMPVITEVSGFVRFTDMIDGQTITRQTDELTGLSSLVVLDSAERTAGGKDLRPALKI
CCCCCHHHHHHHHHEEEHHHHCCCCHHCCHHHHCCCCCEEEEECCHHCCCCCCCCCHHEE
VDAQGNDVLIPGTDMPAQYFLPGKAIVQLEDGVQISSGDTLARIPQESGGTKDITGGLPR
EECCCCEEEECCCCCCCEEECCCCEEEEEECCEEECCCCCCEECCCCCCCCCCCCCCCHH
VADLFEARRPKEPAILAEISGIVSFGKETKGKRRLVITPVDGSDPYEEMIPKWRQLNVFE
HHHHHHHCCCCCCHHHHHHHHHHHHCCCCCCCEEEEEEECCCCCCHHHHCCHHHCCCCCC
GERVERGDVISDGPEAPHDILRLRGVHAVTRYIVNEVQDVYRLQGVKINDKHIEVIVRQM
CCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCEECHHHHHHHHHHH
LRKATIVNAGSSDFLEGEQVEYSRVKIANRELEANGKVGATYSRDLLGITKASLATESFI
HHHHHEECCCCCCCCCCCCCHHHHHEEECCEECCCCCCCCCCCCHHHHHHHHHHHHHHHH
SAASFQETTRVLTEAAVAGKRDELRGLKENVIVGRLIPAGTGYAYHQDRMRRRAAGEAPA
HHHHHHHHHHHHHHHHHCCCHHHHHCHHHCCEEEEEECCCCCCHHHHHHHHHHHCCCCCC
APQVTAEDASASLAELLNAGLGGSDNE
CCCCCHHHHHHHHHHHHHCCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA