BacMap

Definition	Escherichia coli 55989, complete genome.
Accession	NC_011748
Length	5,154,862

Click here to switch to the map view.

The map label for this gene is pic

Identifier: 218696582

GI number: 218696582

Start: 3360967

End: 3365085

Strand: Reverse

Name: pic

Synonym: EC55989_3279

Alternate gene names: 218696582

Gene position: 3365085-3360967 (Counterclockwise)

Preceding gene: 218696583

Following gene: 218696580

Centisome position: 65.28

GC content: 49.58

Gene sequence:

>4119_bases
GTGAATAAAGTTTATTCTCTTAAATATTGCCCCGTCACCGGGGGGCTTATTGCTGTCTCTGAACTTGCCCGCAGGGTAAT
AAAAAAGACATGCCGAAGATTAACGCATATTCTTCTGGCTGGCATTCCAGCAATCTGTCTGTGTTACTCTCAGATATCCC
AGGCGGGTATTGTCCGTTCCGATATTGCCTATCAGATTTATCGTGATTTCGCCGAAAACAAAGGGCTTTTTGTACCTGGT
GCCAATGATATTCCGGTATATGATAAGGACGGAAAACTTGTGGGAAGACTGGGTAAAGCCCCAATGGCCGATTTCAGCAG
TGTGAGCTCAAATGGCGTTGCTACGCTTGTATCGCCTCAGTATATCGTCAGCGTAAAGCATAACGGAGGATATCGGAGTG
TGAGCTTTGGTAATGGGAAAAATACATATTCCCTTGTTGACCGTAATAACCACCCTTCTATTGACTTCCATGCTCCACGT
CTGAATAAACTGGTTACAGAAGTTATTCCCTCAGCGGTAACATCAGAAGGAACCAAAGCCAATGCTTATAAATACACTGA
ACGTTACACCGCTTTTTATCGGGTGGGTAGTGGTACGCAGTACACTAAGGACAAGGACGGAAATTTAGTTAAGGTTGCCG
GTGGATATGCTTTTAAAACAGGAGGAACCACAGGAGTTCCTCTGATATCTGATGCAACAATAGTCTCTAATCCCGGGCAA
ACTTATAATCCTGTAAACGGCCCTTTACCTGACTATGGAGCCCCTGGGGATAGTGGTTCTCCTTTGTTTGCTTATGATAA
ACAACAAAAAAAATGGGTTATTGTTGCTGTATTAAGAGCATATGCAGGTATTAATGGTGCTACGAACTGGTGGAATGTCA
TACCAACAGATTATCTGAACCAGGTTATGCAGGACGATTTCGATGCCCCCGTAGACTTTGTTTCCGGACTGGGCCCCCTG
AACTGGACATACGACAAAACATCAGGCACAGGTACCCTGAGCCAGGGCAGTAAAAACTGGACCATGCACGGGCAGAAAGA
CAATGACCTCAATGCCGGTAAAAATCTGGTATTCAGCGGGCAGAATGGTGCAATTATCCTGAAAGACAGTGTGACTCAGG
GTGCCGGTTATCTCGAATTTAAAGACAGTTACACCGTATCTGCTGAATCCGGAAAAACATGGACGGGTGCCGGCATTATT
ACTGACAAGGGGACGAATGTAACCTGGAAGGTCAACGGCGTTGCCGGTGACAACTTGCATAAGCTGGGGGAAGGAACCCT
GACCATAAACGGAACAGGTGTAAACCCGGGAGGACTGAAAACGGGAGACGGTATCGTTGTACTTAACCAGCAGGCAGACA
CTGCAGGTAATATCCAGGCCTTCAGTTCAGTGAACCTCGCCAGCGGACGTCCGACCGTGGTGCTCGGGGATGCCCGTCAG
GTCAATCCGGATAACATTTCATGGGGATACCGGGGAGGTAAGCTTGACCTTAATGGTAATGCCGTTACCTTCACCCGACT
GCAGGCTGCTGATTACGGGGCGGTGATTACAAATAATGCACAGCAAAAATCCCAGCTTTTACTGGATCTTAAGGCTCAGG
ATACAAATGTCAGTGAACCGACGATTGGAAATATATCCCCCTTTGGTGGTACCGGCACTCCAGGAAACCTGTACAGCATG
ATACTCAACAGCCAGACCCGCTTCTATATTCTGAAATCTGCCAGCTATGGTAACACTCTGTGGGGGAACAGCCTGAATGA
TCCGGCTCAGTGGGAGTTTGTTGGCATGGACAAAAACAAAGCAGTTCAGACAGTAAAAGATAGGATCCTGGCCGGGCGGG
CAAAACAACCCGTTATCTTTCATGGTCAGCTGACCGGGAATATGGATGTCGCCATTCCACAGGTGCCGGGGGGAAGAAAG
GTCATCTTTGATGGTAGCGTGAACCTGCCGGAAGGTACCCTGAGTCAGGACAGTGGCACCCTGATATTCCAGGGACATCC
GGTTATCCATGCCTCCATCAGTGGCAGTGCACCGGTCAGCCTGAACCAGAAAGACTGGGAAAACCGTCAGTTTACAATGA
AAACACTGTCGCTGAAAGACGCTGACTTCCATCTTTCACGTAACGCCTCGCTGAACAGTGACATTAAGTCGGATAACAGC
CATATCACACTGGGAAGTGACAGGGCATTTGTGGATAAAAATGACGGAACAGGAAATTATGTCATTCCGGAGGAAGGTAC
CTCTGTCCCGGACACCGTGAATGACAGGAGCCAGTATGAAGGGAATATTACGCTGAACCATAACTCAGCCCTGGATATCG
GCAGCAGGTTCACCGGGGGGATTGACGCTTATGACAGTGCCGTCAGCATCACCTCTCCGGACGTCCTGTTGACAGCCCCG
GGTGCTTTTGCCGGCAGTTCACTGACAGTGCATGATGGCGGTCATCTTACAGCACTGAACGGTCTTTTCAGCGACGGGCA
TATTCAGGCCGGTAAGAACGGCAAAATCACCCTGAGCGGTACACCGGTTAAAGATACGGCTAATCAGTATGCCCCTGCTG
TATATCTGACGGACGGATATGACCTGACCGGCGATAACGCAGCACTGGAAATTACCCGTGGAGCACATGCTTCCGGTGAT
ATTCATGCCTCTGCGGCATCAACAGTTACCATCGGGTCTGACACGCCGGCAGAACTGGCTTCTGCGGAAACGGCTGCATC
GGCGTTTGCCGGCAGTCTTCTTGAGGGCTATAACGCAGCATTCAATGGTGCCATAACCGGTGGCAGGGCTGATGTCAGTA
TGCATAATGCACTGTGGACTCTGGGTGGGGACTCTGCCATCCACAGTCTTACCGTCAGAAACAGCCGTATTAGTTCTGAA
GGAGACCGTACATTCCGTACCCTGACGGTGAATAAACTGGATGCAACAGGCAGTGATTTTGTTTTGCGTACGGACCTGAA
AAATGCCGATAAAATTAATGTGACTGAAAAAGCCACTGGTTCAGATAACAGCCTGAACGTCAGCTTTATGAATAATCCTG
CTCAGGGACAGGCCCTGAATATTCCTCTGGTCACGGCACCGGCGGGAACTTCAGCAGAGATGTTTAAGGCCGGCACCCGG
GTGACAGGTTTCAGTCGGGTGACCCCAACCCTGCATGTTGATACCAGTGGTGGCAATACGAAGTGGATACTGGATGGTTT
TAAAGCGGAGGCTGATAAAGCCGCTGCCGCGAAGGCTGACAGTTTCATGAATGCCGGGTATAAAAACTTCATGACGGAAG
TTAACAATCTGAACAAACGTATGGGTGACCTGCGTGACACAAACGGTGATGCCGGTGCCTGGGCGCGCATCATGAGTGGT
GCCGGTTCTGCAGACGGTGGTTACAGTGATAATTACACCCATGTTCAGGTCGGCTTTGACAAAAAACATGAACTGGACGG
TGTGGACCTGTTTACCGGTGTCACGATGACCTATACCGACAGCAGTGCAGACAGCCATGCATTCAGCGGAAAGACGAAAT
CGGTGGGGGGCGGTCTGTATGCTTCAGCATTGTTTGAGTCCGGTGCCTATATCGATTTGATTGGTAAATATATTCACCAT
GACAATGATTACACAGGTAACTTTGCTAGCCTGGGAACGAAACACTACAACACCCATTCCTGGTATGCCGGTGCTGAAAC
GGGTTACCGCTATCACCTGACAGAGGACACGTTCATTGAGCCGCAGGCTGAACTGGTTTACGGCGCCGTGTCCGGGAAAA
CATTCCGCTGGAAAGACGGTGATATGGACCTGAGCATGAAGAACAGGGACTTCAGTCCGCTGGTTGGAAGAACAGGGGTT
GAACTGGGCAAGACCTTCAGTGGTAAGGACTGGAGTGTGACGGCCCGTGCCGGAACCAGCTGGCAGTTTGACCTGCTGAA
TAATGGAGAGACCGTACTGCGTGATGCGTCCGGGGAGAAACGGATAAAAGGAGAGAAGGACAGCCGGATGCTGTTTAATG
TTGGTATGAATGCGCAGATAAAGGACAATATGCGCTTTGGTCTGGAGTTTGAGAAGTCAGCCTTTGGTAAATATAACGTG
GATAATGCGGTAAACGCGAATTTCCGGTATATGTTCTGA

Upstream 100 bases:

>100_bases
AGTAACTATATTTTCCTTTCTGGTGATAACGTCGGGTTATCATTAGCTTCTTCAGCTATTTTACTTTTATATCCCTTGTA
AACATCATGGAGAATCCATA

Downstream 100 bases:

>100_bases
TGTGGGGGTAAAGGGCTGCCGGAAGGCAGCCTTTCTCAGAGACTCTTAAAATATAAAACTGAAGGTCTTCGGTAAGGGGG
AGTGTATTAGACGTCAACTA

Product: Serine protease pic precursor (ShMu)

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 1372; Mature: 1372

Protein sequence:

>1372_residues
MNKVYSLKYCPVTGGLIAVSELARRVIKKTCRRLTHILLAGIPAICLCYSQISQAGIVRSDIAYQIYRDFAENKGLFVPG
ANDIPVYDKDGKLVGRLGKAPMADFSSVSSNGVATLVSPQYIVSVKHNGGYRSVSFGNGKNTYSLVDRNNHPSIDFHAPR
LNKLVTEVIPSAVTSEGTKANAYKYTERYTAFYRVGSGTQYTKDKDGNLVKVAGGYAFKTGGTTGVPLISDATIVSNPGQ
TYNPVNGPLPDYGAPGDSGSPLFAYDKQQKKWVIVAVLRAYAGINGATNWWNVIPTDYLNQVMQDDFDAPVDFVSGLGPL
NWTYDKTSGTGTLSQGSKNWTMHGQKDNDLNAGKNLVFSGQNGAIILKDSVTQGAGYLEFKDSYTVSAESGKTWTGAGII
TDKGTNVTWKVNGVAGDNLHKLGEGTLTINGTGVNPGGLKTGDGIVVLNQQADTAGNIQAFSSVNLASGRPTVVLGDARQ
VNPDNISWGYRGGKLDLNGNAVTFTRLQAADYGAVITNNAQQKSQLLLDLKAQDTNVSEPTIGNISPFGGTGTPGNLYSM
ILNSQTRFYILKSASYGNTLWGNSLNDPAQWEFVGMDKNKAVQTVKDRILAGRAKQPVIFHGQLTGNMDVAIPQVPGGRK
VIFDGSVNLPEGTLSQDSGTLIFQGHPVIHASISGSAPVSLNQKDWENRQFTMKTLSLKDADFHLSRNASLNSDIKSDNS
HITLGSDRAFVDKNDGTGNYVIPEEGTSVPDTVNDRSQYEGNITLNHNSALDIGSRFTGGIDAYDSAVSITSPDVLLTAP
GAFAGSSLTVHDGGHLTALNGLFSDGHIQAGKNGKITLSGTPVKDTANQYAPAVYLTDGYDLTGDNAALEITRGAHASGD
IHASAASTVTIGSDTPAELASAETAASAFAGSLLEGYNAAFNGAITGGRADVSMHNALWTLGGDSAIHSLTVRNSRISSE
GDRTFRTLTVNKLDATGSDFVLRTDLKNADKINVTEKATGSDNSLNVSFMNNPAQGQALNIPLVTAPAGTSAEMFKAGTR
VTGFSRVTPTLHVDTSGGNTKWILDGFKAEADKAAAAKADSFMNAGYKNFMTEVNNLNKRMGDLRDTNGDAGAWARIMSG
AGSADGGYSDNYTHVQVGFDKKHELDGVDLFTGVTMTYTDSSADSHAFSGKTKSVGGGLYASALFESGAYIDLIGKYIHH
DNDYTGNFASLGTKHYNTHSWYAGAETGYRYHLTEDTFIEPQAELVYGAVSGKTFRWKDGDMDLSMKNRDFSPLVGRTGV
ELGKTFSGKDWSVTARAGTSWQFDLLNNGETVLRDASGEKRIKGEKDSRMLFNVGMNAQIKDNMRFGLEFEKSAFGKYNV
DNAVNANFRYMF

Sequences:

>Translated_1372_residues
MNKVYSLKYCPVTGGLIAVSELARRVIKKTCRRLTHILLAGIPAICLCYSQISQAGIVRSDIAYQIYRDFAENKGLFVPG
ANDIPVYDKDGKLVGRLGKAPMADFSSVSSNGVATLVSPQYIVSVKHNGGYRSVSFGNGKNTYSLVDRNNHPSIDFHAPR
LNKLVTEVIPSAVTSEGTKANAYKYTERYTAFYRVGSGTQYTKDKDGNLVKVAGGYAFKTGGTTGVPLISDATIVSNPGQ
TYNPVNGPLPDYGAPGDSGSPLFAYDKQQKKWVIVAVLRAYAGINGATNWWNVIPTDYLNQVMQDDFDAPVDFVSGLGPL
NWTYDKTSGTGTLSQGSKNWTMHGQKDNDLNAGKNLVFSGQNGAIILKDSVTQGAGYLEFKDSYTVSAESGKTWTGAGII
TDKGTNVTWKVNGVAGDNLHKLGEGTLTINGTGVNPGGLKTGDGIVVLNQQADTAGNIQAFSSVNLASGRPTVVLGDARQ
VNPDNISWGYRGGKLDLNGNAVTFTRLQAADYGAVITNNAQQKSQLLLDLKAQDTNVSEPTIGNISPFGGTGTPGNLYSM
ILNSQTRFYILKSASYGNTLWGNSLNDPAQWEFVGMDKNKAVQTVKDRILAGRAKQPVIFHGQLTGNMDVAIPQVPGGRK
VIFDGSVNLPEGTLSQDSGTLIFQGHPVIHASISGSAPVSLNQKDWENRQFTMKTLSLKDADFHLSRNASLNSDIKSDNS
HITLGSDRAFVDKNDGTGNYVIPEEGTSVPDTVNDRSQYEGNITLNHNSALDIGSRFTGGIDAYDSAVSITSPDVLLTAP
GAFAGSSLTVHDGGHLTALNGLFSDGHIQAGKNGKITLSGTPVKDTANQYAPAVYLTDGYDLTGDNAALEITRGAHASGD
IHASAASTVTIGSDTPAELASAETAASAFAGSLLEGYNAAFNGAITGGRADVSMHNALWTLGGDSAIHSLTVRNSRISSE
GDRTFRTLTVNKLDATGSDFVLRTDLKNADKINVTEKATGSDNSLNVSFMNNPAQGQALNIPLVTAPAGTSAEMFKAGTR
VTGFSRVTPTLHVDTSGGNTKWILDGFKAEADKAAAAKADSFMNAGYKNFMTEVNNLNKRMGDLRDTNGDAGAWARIMSG
AGSADGGYSDNYTHVQVGFDKKHELDGVDLFTGVTMTYTDSSADSHAFSGKTKSVGGGLYASALFESGAYIDLIGKYIHH
DNDYTGNFASLGTKHYNTHSWYAGAETGYRYHLTEDTFIEPQAELVYGAVSGKTFRWKDGDMDLSMKNRDFSPLVGRTGV
ELGKTFSGKDWSVTARAGTSWQFDLLNNGETVLRDASGEKRIKGEKDSRMLFNVGMNAQIKDNMRFGLEFEKSAFGKYNV
DNAVNANFRYMF
>Mature_1372_residues
MNKVYSLKYCPVTGGLIAVSELARRVIKKTCRRLTHILLAGIPAICLCYSQISQAGIVRSDIAYQIYRDFAENKGLFVPG
ANDIPVYDKDGKLVGRLGKAPMADFSSVSSNGVATLVSPQYIVSVKHNGGYRSVSFGNGKNTYSLVDRNNHPSIDFHAPR
LNKLVTEVIPSAVTSEGTKANAYKYTERYTAFYRVGSGTQYTKDKDGNLVKVAGGYAFKTGGTTGVPLISDATIVSNPGQ
TYNPVNGPLPDYGAPGDSGSPLFAYDKQQKKWVIVAVLRAYAGINGATNWWNVIPTDYLNQVMQDDFDAPVDFVSGLGPL
NWTYDKTSGTGTLSQGSKNWTMHGQKDNDLNAGKNLVFSGQNGAIILKDSVTQGAGYLEFKDSYTVSAESGKTWTGAGII
TDKGTNVTWKVNGVAGDNLHKLGEGTLTINGTGVNPGGLKTGDGIVVLNQQADTAGNIQAFSSVNLASGRPTVVLGDARQ
VNPDNISWGYRGGKLDLNGNAVTFTRLQAADYGAVITNNAQQKSQLLLDLKAQDTNVSEPTIGNISPFGGTGTPGNLYSM
ILNSQTRFYILKSASYGNTLWGNSLNDPAQWEFVGMDKNKAVQTVKDRILAGRAKQPVIFHGQLTGNMDVAIPQVPGGRK
VIFDGSVNLPEGTLSQDSGTLIFQGHPVIHASISGSAPVSLNQKDWENRQFTMKTLSLKDADFHLSRNASLNSDIKSDNS
HITLGSDRAFVDKNDGTGNYVIPEEGTSVPDTVNDRSQYEGNITLNHNSALDIGSRFTGGIDAYDSAVSITSPDVLLTAP
GAFAGSSLTVHDGGHLTALNGLFSDGHIQAGKNGKITLSGTPVKDTANQYAPAVYLTDGYDLTGDNAALEITRGAHASGD
IHASAASTVTIGSDTPAELASAETAASAFAGSLLEGYNAAFNGAITGGRADVSMHNALWTLGGDSAIHSLTVRNSRISSE
GDRTFRTLTVNKLDATGSDFVLRTDLKNADKINVTEKATGSDNSLNVSFMNNPAQGQALNIPLVTAPAGTSAEMFKAGTR
VTGFSRVTPTLHVDTSGGNTKWILDGFKAEADKAAAAKADSFMNAGYKNFMTEVNNLNKRMGDLRDTNGDAGAWARIMSG
AGSADGGYSDNYTHVQVGFDKKHELDGVDLFTGVTMTYTDSSADSHAFSGKTKSVGGGLYASALFESGAYIDLIGKYIHH
DNDYTGNFASLGTKHYNTHSWYAGAETGYRYHLTEDTFIEPQAELVYGAVSGKTFRWKDGDMDLSMKNRDFSPLVGRTGV
ELGKTFSGKDWSVTARAGTSWQFDLLNNGETVLRDASGEKRIKGEKDSRMLFNVGMNAQIKDNMRFGLEFEKSAFGKYNV
DNAVNANFRYMF

Specific function: Involved in intestinal colonization, displays in vitro mucinolytic activity, serum resistance, and hemagglutination. Important to penetrate the intestinal mucus layer

COG id: COG3468

COG function: function code MU; Type V secretory pathway, adhesin AidA

Gene ontology:

Cell location: Serine protease pic translocator:Cell outer membrane; Multi-pass membrane protein. Note=The cleaved C-terminal fragment (autotransporter domain) is localized in the outer membrane (By similarity)

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 peptidase S6 domain

Homologues:

Organism=Escherichia coli, GI1787452, Length=507, Percent_Identity=22.879684418146, Blast_Score=80, Evalue=7e-16,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): PIC_ECO44 (Q7BS42)

Other databases:

- EMBL:   AF097644
- EMBL:   FN554766
- MEROPS:   S06.005
- EnsemblBacteria:   EBESCT00000211556
- GenomeReviews:   FN554766_GR
- GeneTree:   EBGT00050000008323
- GO:   GO:0009405
- GO:   GO:0006508
- InterPro:   IPR005546
- InterPro:   IPR006315
- InterPro:   IPR012332
- InterPro:   IPR011050
- InterPro:   IPR000710
- Gene3D:   G3DSA:2.160.20.20
- PRINTS:   PR00921
- SMART:   SM00869
- TIGRFAMs:   TIGR01414

Pfam domain/function: PF03797 Autotransporter; PF02395 Peptidase_S6; SSF103515 Auto_transptbeta; SSF51126 Pectin_lyas_like

EC number: NA

Molecular weight: Translated: 146455; Mature: 146455

Theoretical pI: Translated: 6.76; Mature: 6.76

Prosite motif: PS51208 AUTOTRANSPORTER

Important sites: ACT_SITE 127-127 ACT_SITE 155-155 ACT_SITE 258-258

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.3 %Cys     (Translated Protein)
1.6 %Met     (Translated Protein)
1.9 %Cys+Met (Translated Protein)
0.3 %Cys     (Mature Protein)
1.6 %Met     (Mature Protein)
1.9 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MNKVYSLKYCPVTGGLIAVSELARRVIKKTCRRLTHILLAGIPAICLCYSQISQAGIVRS
CCCEEEEEECCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHH
DIAYQIYRDFAENKGLFVPGANDIPVYDKDGKLVGRLGKAPMADFSSVSSNGVATLVSPQ
HHHHHHHHHHHHCCCEEECCCCCCCEECCCCHHEECCCCCCCCCHHHCCCCCEEEEECCE
YIVSVKHNGGYRSVSFGNGKNTYSLVDRNNHPSIDFHAPRLNKLVTEVIPSAVTSEGTKA
EEEEEEECCCEEEEEECCCCCEEEEEECCCCCCEEEECHHHHHHHHHHHHHHHHCCCCCC
NAYKYTERYTAFYRVGSGTQYTKDKDGNLVKVAGGYAFKTGGTTGVPLISDATIVSNPGQ
CEEEEHEEEEEEEEECCCCCCCCCCCCCEEEEECCEEEECCCCCCCCEEECCEEECCCCC
TYNPVNGPLPDYGAPGDSGSPLFAYDKQQKKWVIVAVLRAYAGINGATNWWNVIPTDYLN
CCCCCCCCCCCCCCCCCCCCEEEEECCCCCCEEEEEHHHHHHCCCCCCCCCCCCCHHHHH
QVMQDDFDAPVDFVSGLGPLNWTYDKTSGTGTLSQGSKNWTMHGQKDNDLNAGKNLVFSG
HHHHCCCCCCHHHHHCCCCCCEEEECCCCCEECCCCCCCCEECCCCCCCCCCCCEEEEEC
QNGAIILKDSVTQGAGYLEFKDSYTVSAESGKTWTGAGIITDKGTNVTWKVNGVAGDNLH
CCCEEEEECCCCCCCCEEEECCCEEEECCCCCEEECCEEEEECCCEEEEEEECCCCCCHH
KLGEGTLTINGTGVNPGGLKTGDGIVVLNQQADTAGNIQAFSSVNLASGRPTVVLGDARQ
HCCCCEEEEEECCCCCCCCCCCCCEEEEECCCCCCCCEEEEEEEEECCCCCEEEECCCCC
VNPDNISWGYRGGKLDLNGNAVTFTRLQAADYGAVITNNAQQKSQLLLDLKAQDTNVSEP
CCCCCCCCCCCCCEEEECCCEEEEEEEECCCCCEEEECCHHHCCEEEEEEECCCCCCCCC
TIGNISPFGGTGTPGNLYSMILNSQTRFYILKSASYGNTLWGNSLNDPAQWEFVGMDKNK
CCCCCCCCCCCCCCHHHHHEECCCCEEEEEEEECCCCCCCCCCCCCCCCCEEEEECCCCH
AVQTVKDRILAGRAKQPVIFHGQLTGNMDVAIPQVPGGRKVIFDGSVNLPEGTLSQDSGT
HHHHHHHHHHCCCCCCCEEEEEEECCCEEEEEECCCCCCEEEECCCCCCCCCCCCCCCCE
LIFQGHPVIHASISGSAPVSLNQKDWENRQFTMKTLSLKDADFHLSRNASLNSDIKSDNS
EEEECCCEEEEECCCCCCEECCCCCCCCCEEEEEEEEECCCCEEEECCCCCCCCCCCCCC
HITLGSDRAFVDKNDGTGNYVIPEEGTSVPDTVNDRSQYEGNITLNHNSALDIGSRFTGG
EEEECCCCEEEECCCCCCCEEECCCCCCCCCCCCCCHHCCCEEEECCCCCCCCCCCCCCC
IDAYDSAVSITSPDVLLTAPGAFAGSSLTVHDGGHLTALNGLFSDGHIQAGKNGKITLSG
CCCCCCEEEECCCCEEEECCCCCCCCEEEEECCCCEEEEECCCCCCCEECCCCCEEEECC
TPVKDTANQYAPAVYLTDGYDLTGDNAALEITRGAHASGDIHASAASTVTIGSDTPAELA
CCCHHCHHHCCCEEEEECCEEECCCCEEEEEECCCCCCCCEEECCCCEEEECCCCCHHHH
SAETAASAFAGSLLEGYNAAFNGAITGGRADVSMHNALWTLGGDSAIHSLTVRNSRISSE
HHHHHHHHHHHHHHHHCCCCCCCEEECCCCCEEECCEEEEECCCCCEEEEEEECCCCCCC
GDRTFRTLTVNKLDATGSDFVLRTDLKNADKINVTEKATGSDNSLNVSFMNNPAQGQALN
CCCEEEEEEEEEECCCCCCEEEEECCCCCCEEEEEECCCCCCCEEEEEEECCCCCCCEEE
IPLVTAPAGTSAEMFKAGTRVTGFSRVTPTLHVDTSGGNTKWILDGFKAEADKAAAAKAD
EEEEECCCCCCHHHHHCCCCCCCCEECCCEEEEECCCCCEEEEEECCCCCCCHHHHHHHH
SFMNAGYKNFMTEVNNLNKRMGDLRDTNGDAGAWARIMSGAGSADGGYSDNYTHVQVGFD
HHHHCCHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHCCCCCCCCCCCCCEEEEEECCC
KKHELDGVDLFTGVTMTYTDSSADSHAFSGKTKSVGGGLYASALFESGAYIDLIGKYIHH
CCCCCCCEEEEECEEEEEECCCCCCCCCCCCCCCCCCCHHHHHHHCCCCCHHHHHHHHHC
DNDYTGNFASLGTKHYNTHSWYAGAETGYRYHLTEDTFIEPQAELVYGAVSGKTFRWKDG
CCCCCCCHHHCCCCCCCCCCEECCCCCCEEEEECCCCEECCCHHEEEEEECCCEEEECCC
DMDLSMKNRDFSPLVGRTGVELGKTFSGKDWSVTARAGTSWQFDLLNNGETVLRDASGEK
CEEEEECCCCCCCCCCCCCHHHCCCCCCCCEEEEEECCCCEEEEEECCCCEEEECCCCCC
RIKGEKDSRMLFNVGMNAQIKDNMRFGLEFEKSAFGKYNVDNAVNANFRYMF
CCCCCCCCEEEEEECCCCEECCCCEECEEECCCCCCCCCCCCCCCCCEEEEC
>Mature Secondary Structure
MNKVYSLKYCPVTGGLIAVSELARRVIKKTCRRLTHILLAGIPAICLCYSQISQAGIVRS
CCCEEEEEECCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHH
DIAYQIYRDFAENKGLFVPGANDIPVYDKDGKLVGRLGKAPMADFSSVSSNGVATLVSPQ
HHHHHHHHHHHHCCCEEECCCCCCCEECCCCHHEECCCCCCCCCHHHCCCCCEEEEECCE
YIVSVKHNGGYRSVSFGNGKNTYSLVDRNNHPSIDFHAPRLNKLVTEVIPSAVTSEGTKA
EEEEEEECCCEEEEEECCCCCEEEEEECCCCCCEEEECHHHHHHHHHHHHHHHHCCCCCC
NAYKYTERYTAFYRVGSGTQYTKDKDGNLVKVAGGYAFKTGGTTGVPLISDATIVSNPGQ
CEEEEHEEEEEEEEECCCCCCCCCCCCCEEEEECCEEEECCCCCCCCEEECCEEECCCCC
TYNPVNGPLPDYGAPGDSGSPLFAYDKQQKKWVIVAVLRAYAGINGATNWWNVIPTDYLN
CCCCCCCCCCCCCCCCCCCCEEEEECCCCCCEEEEEHHHHHHCCCCCCCCCCCCCHHHHH
QVMQDDFDAPVDFVSGLGPLNWTYDKTSGTGTLSQGSKNWTMHGQKDNDLNAGKNLVFSG
HHHHCCCCCCHHHHHCCCCCCEEEECCCCCEECCCCCCCCEECCCCCCCCCCCCEEEEEC
QNGAIILKDSVTQGAGYLEFKDSYTVSAESGKTWTGAGIITDKGTNVTWKVNGVAGDNLH
CCCEEEEECCCCCCCCEEEECCCEEEECCCCCEEECCEEEEECCCEEEEEEECCCCCCHH
KLGEGTLTINGTGVNPGGLKTGDGIVVLNQQADTAGNIQAFSSVNLASGRPTVVLGDARQ
HCCCCEEEEEECCCCCCCCCCCCCEEEEECCCCCCCCEEEEEEEEECCCCCEEEECCCCC
VNPDNISWGYRGGKLDLNGNAVTFTRLQAADYGAVITNNAQQKSQLLLDLKAQDTNVSEP
CCCCCCCCCCCCCEEEECCCEEEEEEEECCCCCEEEECCHHHCCEEEEEEECCCCCCCCC
TIGNISPFGGTGTPGNLYSMILNSQTRFYILKSASYGNTLWGNSLNDPAQWEFVGMDKNK
CCCCCCCCCCCCCCHHHHHEECCCCEEEEEEEECCCCCCCCCCCCCCCCCEEEEECCCCH
AVQTVKDRILAGRAKQPVIFHGQLTGNMDVAIPQVPGGRKVIFDGSVNLPEGTLSQDSGT
HHHHHHHHHHCCCCCCCEEEEEEECCCEEEEEECCCCCCEEEECCCCCCCCCCCCCCCCE
LIFQGHPVIHASISGSAPVSLNQKDWENRQFTMKTLSLKDADFHLSRNASLNSDIKSDNS
EEEECCCEEEEECCCCCCEECCCCCCCCCEEEEEEEEECCCCEEEECCCCCCCCCCCCCC
HITLGSDRAFVDKNDGTGNYVIPEEGTSVPDTVNDRSQYEGNITLNHNSALDIGSRFTGG
EEEECCCCEEEECCCCCCCEEECCCCCCCCCCCCCCHHCCCEEEECCCCCCCCCCCCCCC
IDAYDSAVSITSPDVLLTAPGAFAGSSLTVHDGGHLTALNGLFSDGHIQAGKNGKITLSG
CCCCCCEEEECCCCEEEECCCCCCCCEEEEECCCCEEEEECCCCCCCEECCCCCEEEECC
TPVKDTANQYAPAVYLTDGYDLTGDNAALEITRGAHASGDIHASAASTVTIGSDTPAELA
CCCHHCHHHCCCEEEEECCEEECCCCEEEEEECCCCCCCCEEECCCCEEEECCCCCHHHH
SAETAASAFAGSLLEGYNAAFNGAITGGRADVSMHNALWTLGGDSAIHSLTVRNSRISSE
HHHHHHHHHHHHHHHHCCCCCCCEEECCCCCEEECCEEEEECCCCCEEEEEEECCCCCCC
GDRTFRTLTVNKLDATGSDFVLRTDLKNADKINVTEKATGSDNSLNVSFMNNPAQGQALN
CCCEEEEEEEEEECCCCCCEEEEECCCCCCEEEEEECCCCCCCEEEEEEECCCCCCCEEE
IPLVTAPAGTSAEMFKAGTRVTGFSRVTPTLHVDTSGGNTKWILDGFKAEADKAAAAKAD
EEEEECCCCCCHHHHHCCCCCCCCEECCCEEEEECCCCCEEEEEECCCCCCCHHHHHHHH
SFMNAGYKNFMTEVNNLNKRMGDLRDTNGDAGAWARIMSGAGSADGGYSDNYTHVQVGFD
HHHHCCHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHCCCCCCCCCCCCCEEEEEECCC
KKHELDGVDLFTGVTMTYTDSSADSHAFSGKTKSVGGGLYASALFESGAYIDLIGKYIHH
CCCCCCCEEEEECEEEEEECCCCCCCCCCCCCCCCCCCHHHHHHHCCCCCHHHHHHHHHC
DNDYTGNFASLGTKHYNTHSWYAGAETGYRYHLTEDTFIEPQAELVYGAVSGKTFRWKDG
CCCCCCCHHHCCCCCCCCCCEECCCCCCEEEEECCCCEECCCHHEEEEEECCCEEEECCC
DMDLSMKNRDFSPLVGRTGVELGKTFSGKDWSVTARAGTSWQFDLLNNGETVLRDASGEK
CEEEEECCCCCCCCCCCCCHHHCCCCCCCCEEEEEECCCCEEEEEECCCCEEEECCCCCC
RIKGEKDSRMLFNVGMNAQIKDNMRFGLEFEKSAFGKYNVDNAVNANFRYMF
CCCCCCCCEEEEEECCCCEECCCCEECEEECCCCCCCCCCCCCCCCCEEEEC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 10531204