| Definition | Streptococcus pyogenes M1 GAS chromosome, complete genome. |
|---|---|
| Accession | NC_002737 |
| Length | 1,852,441 |
Click here to switch to the map view.
The map label for this gene is epf [H]
Identifier: 15674788
GI number: 15674788
Start: 591680
End: 597817
Strand: Direct
Name: epf [H]
Synonym: SPy_0737
Alternate gene names: 15674788
Gene position: 591680-597817 (Clockwise)
Preceding gene: 15674785
Following gene: 15674789
Centisome position: 31.94
GC content: 38.3
Gene sequence:
>6138_bases ATGCGTAAGGTCAAAAAAGTCTTTGTTAGTTCATGTATGCTTTTAACAGTGGGCCTCGGAGTTGCCGTACCTACTGGATT CAGCCAATCTAATGGCGTGATGGTTGTAAAGGCTGCGGAAGTGCCGGCGACAGATTTATCACGTCAGGCGTCTGATTCGG AGAGGGTAGATGAATCGTCTTTATTGCAGAAAGAAAACTTATCAGTAGATTCATTTAAATTAGAAAATTTAAATGGATGG GAAGCTGAAAATGATACAGCAGGTAATTTGGGGAAATTTAAAGATCCAGATAGTTCGGGCTATCAAAATATTTTGACATC ATCTGGAAAGAATATCAGTGTAGCTGTTGCTCCCAAAGGTTCAGGTAAAATGAACATTAAAGTAACTAAAAGATCAAATT TTCAGGGTGGATATTATGTAGGTGGTCTTAGAACTCAAACTCCGGTATTGAAGTTAAATGATGTTTATCGATATTCTTTT ACAACTAAAAAATTATCAGGAAATTCTTCAGAGTTCAAAACGAGAGTTAAGCCCGTTGAATCTAATAATAAACTAGGGAA AGAGCTTGTTATTAGGGTGGATAATAAAAATGTATCTACTAAGCATGATTGGCTTCCAGACATCTCTGATGGAACTCATA CTGTGGACTTCACTGGTCTTGATAAAAAATTATCTGTTGCTTTCAGATTTTCTCCAAGACAAACTTCGAATGTTGTTTAC GAATTTTCTAACATAAATATAAAAAACATTAGTCCTGCATCAGTGCCGGCTATTCCTTCGAAAGTTTTAGAGGGAACCAG CGTCTTGTCGGGTACTGCAATATCTTCTGGAGATACATTAGAAAAAAGAAAATCGTTTGATGGCGATATCCTAAGAGTTT ATAAAGATAGCAAAATCATTGCTAGAACAGTAATAAAAGGCAATAAGTGGGATGTTAAACTTTCAAAGCCTCTTATTGCA GGTGAAAAATTAGATTTTGAGATTTTGCATCCGAGATCTCAAAACGTTAGTAAAAAAATTTCAAAACAAGTCGAAGCTAA ACCATTTGATCCAGCTTCCTATAAAGAAAAAGTTATAGCCAAATTAAAGCCGGTTTATGAAGCTACTAGTGAAAAAATCA CAAATGATGCTTGGTTGGATGAAAATGCGAAGGATTTGCAAAAACAAAAATTAGAAGAACAATATATTTCTGGAAAAGTA GCGATATCAGAGGCTGGAACTAAACAAGAAGCTATAGATGCAGCATATAATAAATATTCAAGTCAAACAGATCCAGACTC TCTTCCTAGTCAGTATAAACAAGGTAATAAAGAAAATGAACAAGAAAAAGGGCGTCAAGATTTAATCCAGACTCGTGATC TGACGTTGAAAGCCATTCAAGAAGACAAATGGCTAACAGAGCAGGAGAAAACAATTCAAAAAGAAGAAGCATTAAAAGCT TTTGAAACTGGTATAGAAAGTGTTAATCAAACAGTATCATTAGAACAGTTGAAGCAACGGTTAATAGTGTATAAAGCTTC TGAAAAAGATTCAGAGAAAAAAGAATATCCTGAGTCAATTCCTAATCAGCATATTCCAGGGAAAGAAAAAGAAGTTAAAG CTGCTAAACAAGAAGAACTTAAAAAATTACATGACACAACTCTTGAAAAAATCAATCAAGATAAATGGTTGACGCCAGAC CAACAAGCTGAACAGTTAAAACAAGCGGAAGTTACTTTTAAAAAAGGCCAAGAAGCAATTAAAAGTGCTCAGACTTTAAC TCAGCTTGAGACAGACTTAGCTGATTATGTTTCTGAGAATGAAGGTAAGGGAAATTCTATTCCCGATAAATACAAATCTG GCAATAAAGATGATTTGGTAAATAAGGCTGAAGTTAAACTTAAGGAAGCTCACGAAGCTACTAAACAAGCAATTGAAAAA GATCCATGGTTGAGTCCGGAACAGAAAAAAGCTCAAAAAGAAAAAGCCAAAGCAAGACTAGATGAGGGCTTGAAAGCTCT TAAAGCTGCAGATAGTTTAGAGATTCTTAAAGTGACAGAAGAAGCTTTCGTTGATAAAGAAAAAAATCCAGATTCAATTC CAAATCAACATAAAGCTGGAACTGCTGATCAAGCTAGAAAACAAGCTTTAGATAGTTTAGATAAGGAGGTTCAAAAAGAG TTAGAGTCAATTGATAACGATAATACTCTAACAACTGATGAGAAAGCAGCTGCTAAGAAAAAAGTCAATGACGCTTATGA TGTAGCTAAGCAAACAGCTATGGAAGCCAATTCTTATGAAGATTTGACTACTATTAAAGATGAGTTCTTATCTAATTTAC CTCATAAACAAGGAACGCCGCTTAAAGATCAACAATCTGATGCTATTGCAGAATTAGAGAAGAAGCAGCAAGAAATTGAA AAAGCTATTGAGGGTGATAAAACATTACCAAGAGACGAAAAAGAGAAACAAATTGCTGACTCTAAGGAACGCTTAAAATC TGACACGCAAAAAGTTAAAGATGCTAAAAATGCTGATGCTATTAAAAAAGCATTTGAAGAAGGGAAAGTGAATATTCCTC AAGCACATATCCCAGGTGATTTGAACAAGGATAAAGAAAAACTTCTTGCAGAATTGAAGCAAAAAGCAGATGATACTGAA AAAGCTATTGATGTTGATAAAACTCTGACAGAAGATGAGAAAAAAGAGCAAAAAGTCAAAACAAAAGCTGAACTTGAAAA AGCTAAAACTGATGTTAAAAATACTCAGACACGTGAAGAACTAGATAAAAAAGTTCCAGAACTTAAGAAAGCTATTGAAG ACACTCACGTTAAAGGTAATCTTGAAGGTGTTAAGAATAAGGCTATTGAAGATCTTAAAAAAGCTCATACTGAAACAGTT GCTAAAATAAATGGTGATGATACCCTTGACAAAGCTACTAAAGAAGCTCAAGTGAAAGAAGCTGACAAAGCTTTGGCAGC AGGTAAAGATGCGATCACTAAAGCAGATGATGCTGATAAAGTAAGTACAGCTGTTACAGAGCACACACCAAAAATTAAAG CAGCACATAAAACTGGTGACCTTAAAAAAGCTCAAGTAGATGCTAACACAGCTCTTGACAAAGCAGCTGAAAAAGAACGT GGAGAAATCAATAAAGATGCTACACTAACGACAGAAGATAAAGCAAAACAACTGAAAGAAGTTGAGACAGCTCTTACTAA AGCTAAAGATAACGTGAAAGCTGCTAAGACAGCAGACGCTATCAATGACGCACGTGATAAAGGCGTAGCAACAATTGATG CCGTCCATAAAGCAGGTCAAGACTTAGGTGCTCGTAAGTCAGGTCAAGTCGCTAAACTTGAAGAAGCAGCTAAAGCAACG AAAGACAAGATTTCAGCTGATCCAACTTTGACAAGCAAAGAAAAAGAAGAGCAATCTAAAGCTGTTGACGCTGAACTTAA GAAAGCGATAGAAGCTGTTAACGCAGCTGACACAGCTGACAAGGTTGACGATGCTCTTGGTGAAGGTGTTACAGACATCA AGAACCAACACAAGTCAGGTGACTCTATCGACGCTCGTCGTGAGGCTCATGGTAAGGAACTTGATAGAGTCGCTCAAGAA ACTAAAGGTGCGATTGAAAAAGACCCTACTTTGACGACTGAAGAAAAAGCTAAACAAGTTAAAGACGTAGATGCCGCTAA AGAAAGAGGCATGGCTAAGCTTAATGAAGCTAAAGATGCTGATGCTTTAGACAAAGCTTACGGTGAAGGTGTTACAGACA TCAAGAACCAACACAAGTCAGGTGACCCTGTCGACGCTCGTCGTGGATTACACAACAAGTCAATCGACGAAGTGGCGCAA GCAACTAAGGACGCTATCACAGCAGATACGACTTTGACTGAAGCTGAAAAAGAAACACAACGTGGCAATGTTGATAAAGA AGCAACTAAAGCTAAAGAAGAACTTGCTAAGGCTAAAGATGCTGATGCTTTAGACAAAGCGTACGGTGACGGTGTAACCA GCATCAAGAACCAACACAAGTCAGGTAAAGGTCTTGACGTTCGTAAAGATGAGCACAAGAAAGCTCTTGAAGCTGTTGCT AAACGTGTCACTGCTGAAATTGAGGCTGATCCAACCTTAACACCAGAAGTGAGAGAACAACAAAAAGCAGAGGTTCAAAA AGAGCTTGAACTTGCGACTGATAAGATTGCTGAAGCTAAAGATGCAGATGAAGCAGACAAAGCTTACGGTGACGGTGTCA CAGCGATCGAAAATGCCCACGTTATTGGTAAAGGTATCGAAGCTCGTAAAGACCTTGCTAAGAAAGACCTTGCTGAAGCT GCTGCTAAGACAAAAGCTCTCATTATTGAAGACAAAACGCTTACTGATGATCAACGTAAAGAACAGTTATTAGGTGTTGA TACAGAGTATGCTAAAGGTATCGAGAATATTGATGCAGCTAAGGATGCTGCAGGTGTTGATAAAGCATATAGTGACGGTG TTCGTGACATCCTGGCACAGTACAAAGAAGGTCAAAACCTTAATGATCGTCGTAATGCTGCCAAAGAATTTCTTCTTAAA GAAGCAGACAAAGTGACGAAACTAATCAATGATGATCCAACCTTGACTCATGACCAAAAAGTTGATCAAATCAACAAAGT TGAACAAGCTAAGTTAGACGCAATCAAGTCTGTTGATGATGCTCAAACAGCTGATGCTATCAATGATGCTCTTGGTAAGG GTATTGAAAACATCAACAACCAATACCAACATGGCGATGGCGTTGATGTTCGTAAAGCGACTGCCAAAGGCGATCTTGAA AAAGAAGCTGCTAAAGTGAAAGCTCTTATTGCTAAGGATCCGACCTTAACTCAAGCTGATAAAGACAAACAAACAGCAGC GGTTGACGCAGCTAAGAATACAGCAATTGCAGCGGTTGATAAAGCGACAACAACTGAAGGCATTAACCAAGAACTTGGTA AAGGCATCACAGCTATCAATAAAGCTTACCGTCCAGGTGAAGGTGTTAAAGCACGTAAAGAAGCCGCTAAAGCTGATCTT GAAAAAGAAGCTGCTAAAGTGAAAGCTCTTATTACTAACGACCCAACCTTAACAAAAGCTGATAAAGCTAAACAAACAGA AGCTGTTGCTAAAGCCCTTAAAGCTGCTATCGCAGCGGTTGATAAAGCGACAACAGCTGAAGGCATTAACCAAGAACTTG GTAAAGGCATCACAGCTATCAATAAAGCTTACCGTCCAGGTGAAGGTGTTAAAGCACGTAAAGAAGCCGCTAAGGCTGAT CTTGAAAGAGAAGCTGCTAAGGTTCGTGAAGCTATCGCTAACGACCCAACCTTAACAAAAGCTGATAAAGCTAAACAAAC AGAAGCTGTTGCTAAAGCTCTTAAAGCTGCTATCGCAGCGGTTGATAAAGCGACAACAGCTGAAGGCATTAACCAAGAAC TTGGTAAAGGCATCACAGCTATCAACAAAGCTTACCGTCCAGGTGAAGGTGTTGAAGCACATAAAGAAGCTGCTAAAGCT AATCTTGAAAAAGTAGCTAAAGAAACTAAAGCTCTTATTTCAGGAGACCGTTACTTGAGCGAAACTGAAAAAGCAGTCCA AAAACAAGCTGTTGAGCAAGCTCTTGCGAAAGCACTTGGTCAAGTTGAGGCTGCTAAGACAGTTGAAGCTGTTAAGTTGG CAGAAAACCTTGGTACTGTAGCTATCCGTTCAGCATATGTTGCTGGTTTAGCTAAAGATACTGATCAAGCAACAGCTGCT CTTAACGAAGCGAAACAAGCTGCTATTGAAGCTCTTAAACAAGCTGCGGCAGAAACACTTGCTAAGATTACAACTGATGC TAAATTGACTGAAGCTCAAAAAGCTGAACAATCAGAAAATGTATCATTAGCGCTTAAGACGGCTATTGCGACTGTTCGTT CAGCACAATCTATTGCGTCTGTGAAAGAAGCAAAAGATAAAGGTATTACTGCTATCCGTGCAGCCTATGTGCCTAATAAG GCAGTCGCAAAATCATCGTCAGCGAACCATCTTCCAAAATCAGGTGATGCAAACTCAATTGTTCTTGTTGGCTTAGGAGT TATGTCTCTTCTTTTAGGTATGGTGCTTTATAGCAAGAAAAAAGAAAGTAAAGACTAA
Upstream 100 bases:
>100_bases GTCTACTGGCTGACAACGTCAAATAAGATAGGCATGAAAAAATAAGGGGGAATACAGAATGTTTTTAAAACACCAAGATG TGAAACAAAAAAATTGGAGA
Downstream 100 bases:
>100_bases GAACCTGGCTTTATCCAAATTGCTTTCTACTATATTTTCAAACCAAGGTGATTTTGAAATCACCTTGGTTTTTTGGATCG TAAGGGCCCAAGAACGGAGT
Product: putative extracellular matrix binding protein
Products: NA
Alternate protein names: ECM-binding protein homolog [H]
Number of amino acids: Translated: 2045; Mature: 2045
Protein sequence:
>2045_residues MRKVKKVFVSSCMLLTVGLGVAVPTGFSQSNGVMVVKAAEVPATDLSRQASDSERVDESSLLQKENLSVDSFKLENLNGW EAENDTAGNLGKFKDPDSSGYQNILTSSGKNISVAVAPKGSGKMNIKVTKRSNFQGGYYVGGLRTQTPVLKLNDVYRYSF TTKKLSGNSSEFKTRVKPVESNNKLGKELVIRVDNKNVSTKHDWLPDISDGTHTVDFTGLDKKLSVAFRFSPRQTSNVVY EFSNINIKNISPASVPAIPSKVLEGTSVLSGTAISSGDTLEKRKSFDGDILRVYKDSKIIARTVIKGNKWDVKLSKPLIA GEKLDFEILHPRSQNVSKKISKQVEAKPFDPASYKEKVIAKLKPVYEATSEKITNDAWLDENAKDLQKQKLEEQYISGKV AISEAGTKQEAIDAAYNKYSSQTDPDSLPSQYKQGNKENEQEKGRQDLIQTRDLTLKAIQEDKWLTEQEKTIQKEEALKA FETGIESVNQTVSLEQLKQRLIVYKASEKDSEKKEYPESIPNQHIPGKEKEVKAAKQEELKKLHDTTLEKINQDKWLTPD QQAEQLKQAEVTFKKGQEAIKSAQTLTQLETDLADYVSENEGKGNSIPDKYKSGNKDDLVNKAEVKLKEAHEATKQAIEK DPWLSPEQKKAQKEKAKARLDEGLKALKAADSLEILKVTEEAFVDKEKNPDSIPNQHKAGTADQARKQALDSLDKEVQKE LESIDNDNTLTTDEKAAAKKKVNDAYDVAKQTAMEANSYEDLTTIKDEFLSNLPHKQGTPLKDQQSDAIAELEKKQQEIE KAIEGDKTLPRDEKEKQIADSKERLKSDTQKVKDAKNADAIKKAFEEGKVNIPQAHIPGDLNKDKEKLLAELKQKADDTE KAIDVDKTLTEDEKKEQKVKTKAELEKAKTDVKNTQTREELDKKVPELKKAIEDTHVKGNLEGVKNKAIEDLKKAHTETV AKINGDDTLDKATKEAQVKEADKALAAGKDAITKADDADKVSTAVTEHTPKIKAAHKTGDLKKAQVDANTALDKAAEKER GEINKDATLTTEDKAKQLKEVETALTKAKDNVKAAKTADAINDARDKGVATIDAVHKAGQDLGARKSGQVAKLEEAAKAT KDKISADPTLTSKEKEEQSKAVDAELKKAIEAVNAADTADKVDDALGEGVTDIKNQHKSGDSIDARREAHGKELDRVAQE TKGAIEKDPTLTTEEKAKQVKDVDAAKERGMAKLNEAKDADALDKAYGEGVTDIKNQHKSGDPVDARRGLHNKSIDEVAQ ATKDAITADTTLTEAEKETQRGNVDKEATKAKEELAKAKDADALDKAYGDGVTSIKNQHKSGKGLDVRKDEHKKALEAVA KRVTAEIEADPTLTPEVREQQKAEVQKELELATDKIAEAKDADEADKAYGDGVTAIENAHVIGKGIEARKDLAKKDLAEA AAKTKALIIEDKTLTDDQRKEQLLGVDTEYAKGIENIDAAKDAAGVDKAYSDGVRDILAQYKEGQNLNDRRNAAKEFLLK EADKVTKLINDDPTLTHDQKVDQINKVEQAKLDAIKSVDDAQTADAINDALGKGIENINNQYQHGDGVDVRKATAKGDLE KEAAKVKALIAKDPTLTQADKDKQTAAVDAAKNTAIAAVDKATTTEGINQELGKGITAINKAYRPGEGVKARKEAAKADL EKEAAKVKALITNDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGEGVKARKEAAKAD LEREAAKVREAIANDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGEGVEAHKEAAKA NLEKVAKETKALISGDRYLSETEKAVQKQAVEQALAKALGQVEAAKTVEAVKLAENLGTVAIRSAYVAGLAKDTDQATAA LNEAKQAAIEALKQAAAETLAKITTDAKLTEAQKAEQSENVSLALKTAIATVRSAQSIASVKEAKDKGITAIRAAYVPNK AVAKSSSANHLPKSGDANSIVLVGLGVMSLLLGMVLYSKKKESKD
Sequences:
>Translated_2045_residues MRKVKKVFVSSCMLLTVGLGVAVPTGFSQSNGVMVVKAAEVPATDLSRQASDSERVDESSLLQKENLSVDSFKLENLNGW EAENDTAGNLGKFKDPDSSGYQNILTSSGKNISVAVAPKGSGKMNIKVTKRSNFQGGYYVGGLRTQTPVLKLNDVYRYSF TTKKLSGNSSEFKTRVKPVESNNKLGKELVIRVDNKNVSTKHDWLPDISDGTHTVDFTGLDKKLSVAFRFSPRQTSNVVY EFSNINIKNISPASVPAIPSKVLEGTSVLSGTAISSGDTLEKRKSFDGDILRVYKDSKIIARTVIKGNKWDVKLSKPLIA GEKLDFEILHPRSQNVSKKISKQVEAKPFDPASYKEKVIAKLKPVYEATSEKITNDAWLDENAKDLQKQKLEEQYISGKV AISEAGTKQEAIDAAYNKYSSQTDPDSLPSQYKQGNKENEQEKGRQDLIQTRDLTLKAIQEDKWLTEQEKTIQKEEALKA FETGIESVNQTVSLEQLKQRLIVYKASEKDSEKKEYPESIPNQHIPGKEKEVKAAKQEELKKLHDTTLEKINQDKWLTPD QQAEQLKQAEVTFKKGQEAIKSAQTLTQLETDLADYVSENEGKGNSIPDKYKSGNKDDLVNKAEVKLKEAHEATKQAIEK DPWLSPEQKKAQKEKAKARLDEGLKALKAADSLEILKVTEEAFVDKEKNPDSIPNQHKAGTADQARKQALDSLDKEVQKE LESIDNDNTLTTDEKAAAKKKVNDAYDVAKQTAMEANSYEDLTTIKDEFLSNLPHKQGTPLKDQQSDAIAELEKKQQEIE KAIEGDKTLPRDEKEKQIADSKERLKSDTQKVKDAKNADAIKKAFEEGKVNIPQAHIPGDLNKDKEKLLAELKQKADDTE KAIDVDKTLTEDEKKEQKVKTKAELEKAKTDVKNTQTREELDKKVPELKKAIEDTHVKGNLEGVKNKAIEDLKKAHTETV AKINGDDTLDKATKEAQVKEADKALAAGKDAITKADDADKVSTAVTEHTPKIKAAHKTGDLKKAQVDANTALDKAAEKER GEINKDATLTTEDKAKQLKEVETALTKAKDNVKAAKTADAINDARDKGVATIDAVHKAGQDLGARKSGQVAKLEEAAKAT KDKISADPTLTSKEKEEQSKAVDAELKKAIEAVNAADTADKVDDALGEGVTDIKNQHKSGDSIDARREAHGKELDRVAQE TKGAIEKDPTLTTEEKAKQVKDVDAAKERGMAKLNEAKDADALDKAYGEGVTDIKNQHKSGDPVDARRGLHNKSIDEVAQ ATKDAITADTTLTEAEKETQRGNVDKEATKAKEELAKAKDADALDKAYGDGVTSIKNQHKSGKGLDVRKDEHKKALEAVA KRVTAEIEADPTLTPEVREQQKAEVQKELELATDKIAEAKDADEADKAYGDGVTAIENAHVIGKGIEARKDLAKKDLAEA AAKTKALIIEDKTLTDDQRKEQLLGVDTEYAKGIENIDAAKDAAGVDKAYSDGVRDILAQYKEGQNLNDRRNAAKEFLLK EADKVTKLINDDPTLTHDQKVDQINKVEQAKLDAIKSVDDAQTADAINDALGKGIENINNQYQHGDGVDVRKATAKGDLE KEAAKVKALIAKDPTLTQADKDKQTAAVDAAKNTAIAAVDKATTTEGINQELGKGITAINKAYRPGEGVKARKEAAKADL EKEAAKVKALITNDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGEGVKARKEAAKAD LEREAAKVREAIANDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGEGVEAHKEAAKA NLEKVAKETKALISGDRYLSETEKAVQKQAVEQALAKALGQVEAAKTVEAVKLAENLGTVAIRSAYVAGLAKDTDQATAA LNEAKQAAIEALKQAAAETLAKITTDAKLTEAQKAEQSENVSLALKTAIATVRSAQSIASVKEAKDKGITAIRAAYVPNK AVAKSSSANHLPKSGDANSIVLVGLGVMSLLLGMVLYSKKKESKD >Mature_2045_residues MRKVKKVFVSSCMLLTVGLGVAVPTGFSQSNGVMVVKAAEVPATDLSRQASDSERVDESSLLQKENLSVDSFKLENLNGW EAENDTAGNLGKFKDPDSSGYQNILTSSGKNISVAVAPKGSGKMNIKVTKRSNFQGGYYVGGLRTQTPVLKLNDVYRYSF TTKKLSGNSSEFKTRVKPVESNNKLGKELVIRVDNKNVSTKHDWLPDISDGTHTVDFTGLDKKLSVAFRFSPRQTSNVVY EFSNINIKNISPASVPAIPSKVLEGTSVLSGTAISSGDTLEKRKSFDGDILRVYKDSKIIARTVIKGNKWDVKLSKPLIA GEKLDFEILHPRSQNVSKKISKQVEAKPFDPASYKEKVIAKLKPVYEATSEKITNDAWLDENAKDLQKQKLEEQYISGKV AISEAGTKQEAIDAAYNKYSSQTDPDSLPSQYKQGNKENEQEKGRQDLIQTRDLTLKAIQEDKWLTEQEKTIQKEEALKA FETGIESVNQTVSLEQLKQRLIVYKASEKDSEKKEYPESIPNQHIPGKEKEVKAAKQEELKKLHDTTLEKINQDKWLTPD QQAEQLKQAEVTFKKGQEAIKSAQTLTQLETDLADYVSENEGKGNSIPDKYKSGNKDDLVNKAEVKLKEAHEATKQAIEK DPWLSPEQKKAQKEKAKARLDEGLKALKAADSLEILKVTEEAFVDKEKNPDSIPNQHKAGTADQARKQALDSLDKEVQKE LESIDNDNTLTTDEKAAAKKKVNDAYDVAKQTAMEANSYEDLTTIKDEFLSNLPHKQGTPLKDQQSDAIAELEKKQQEIE KAIEGDKTLPRDEKEKQIADSKERLKSDTQKVKDAKNADAIKKAFEEGKVNIPQAHIPGDLNKDKEKLLAELKQKADDTE KAIDVDKTLTEDEKKEQKVKTKAELEKAKTDVKNTQTREELDKKVPELKKAIEDTHVKGNLEGVKNKAIEDLKKAHTETV AKINGDDTLDKATKEAQVKEADKALAAGKDAITKADDADKVSTAVTEHTPKIKAAHKTGDLKKAQVDANTALDKAAEKER GEINKDATLTTEDKAKQLKEVETALTKAKDNVKAAKTADAINDARDKGVATIDAVHKAGQDLGARKSGQVAKLEEAAKAT KDKISADPTLTSKEKEEQSKAVDAELKKAIEAVNAADTADKVDDALGEGVTDIKNQHKSGDSIDARREAHGKELDRVAQE TKGAIEKDPTLTTEEKAKQVKDVDAAKERGMAKLNEAKDADALDKAYGEGVTDIKNQHKSGDPVDARRGLHNKSIDEVAQ ATKDAITADTTLTEAEKETQRGNVDKEATKAKEELAKAKDADALDKAYGDGVTSIKNQHKSGKGLDVRKDEHKKALEAVA KRVTAEIEADPTLTPEVREQQKAEVQKELELATDKIAEAKDADEADKAYGDGVTAIENAHVIGKGIEARKDLAKKDLAEA AAKTKALIIEDKTLTDDQRKEQLLGVDTEYAKGIENIDAAKDAAGVDKAYSDGVRDILAQYKEGQNLNDRRNAAKEFLLK EADKVTKLINDDPTLTHDQKVDQINKVEQAKLDAIKSVDDAQTADAINDALGKGIENINNQYQHGDGVDVRKATAKGDLE KEAAKVKALIAKDPTLTQADKDKQTAAVDAAKNTAIAAVDKATTTEGINQELGKGITAINKAYRPGEGVKARKEAAKADL EKEAAKVKALITNDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGEGVKARKEAAKAD LEREAAKVREAIANDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGEGVEAHKEAAKA NLEKVAKETKALISGDRYLSETEKAVQKQAVEQALAKALGQVEAAKTVEAVKLAENLGTVAIRSAYVAGLAKDTDQATAA LNEAKQAAIEALKQAAAETLAKITTDAKLTEAQKAEQSENVSLALKTAIATVRSAQSIASVKEAKDKGITAIRAAYVPNK AVAKSSSANHLPKSGDANSIVLVGLGVMSLLLGMVLYSKKKESKD
Specific function: Unknown
COG id: NA
COG function: NA
Gene ontology:
Cell location: Cell membrane; Single-pass membrane protein (Potential) [H]
Metaboloic importance: NA
Operon status: Not Known
Operon components: None
Similarity: Contains 59 FIVAR domains [H]
Homologues:
None
Paralogues:
None
Copy number: NA
Swissprot (AC and ID): NA
Other databases:
- InterPro: IPR011439 - InterPro: IPR011490 - InterPro: IPR020840 - InterPro: IPR002988 - InterPro: IPR005877 - InterPro: IPR009063 - InterPro: IPR006530 [H]
Pfam domain/function: PF07564 DUF1542; PF07554 FIVAR; PF01468 GA; PF04650 YSIRK_signal [H]
EC number: NA
Molecular weight: Translated: 221963; Mature: 221963
Theoretical pI: Translated: 6.94; Mature: 6.94
Prosite motif: PS50847 GRAM_POS_ANCHORING
Important sites: NA
Signals:
None
Transmembrane regions:
None
Cys/Met content:
0.0 %Cys (Translated Protein) 0.4 %Met (Translated Protein) 0.4 %Cys+Met (Translated Protein) 0.0 %Cys (Mature Protein) 0.4 %Met (Mature Protein) 0.4 %Cys+Met (Mature Protein)
Secondary structure:
>Translated Secondary Structure MRKVKKVFVSSCMLLTVGLGVAVPTGFSQSNGVMVVKAAEVPATDLSRQASDSERVDESS CCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCHHHHHHHCCCHHHCCHHH LLQKENLSVDSFKLENLNGWEAENDTAGNLGKFKDPDSSGYQNILTSSGKNISVAVAPKG HHHHHCCCCCCEEECCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHCCCCEEEEEEECCC SGKMNIKVTKRSNFQGGYYVGGLRTQTPVLKLNDVYRYSFTTKKLSGNSSEFKTRVKPVE CCEEEEEEEECCCCCCCEEECCCCCCCCEEEECCCEEEEEEHHHCCCCCHHHHHHCCCCC SNNKLGKELVIRVDNKNVSTKHDWLPDISDGTHTVDFTGLDKKLSVAFRFSPRQTSNVVY CCCCCCCEEEEEECCCCCCCCCCCCCCCCCCCEEEEECCCCCEEEEEEEECCCCCCCEEE EFSNINIKNISPASVPAIPSKVLEGTSVLSGTAISSGDTLEKRKSFDGDILRVYKDSKII EECCCCCCCCCCCCCCCCHHHHHCCCHHHCCCCCCCCCHHHHHHCCCCCEEEHHHCCHHH ARTVIKGNKWDVKLSKPLIAGEKLDFEILHPRSQNVSKKISKQVEAKPFDPASYKEKVIA HHHHHCCCCCEEEECCCEECCCCCCEEEECCCCCCHHHHHHHHHCCCCCCCHHHHHHHHH KLKPVYEATSEKITNDAWLDENAKDLQKQKLEEQYISGKVAISEAGTKQEAIDAAYNKYS HHHHHHHHHHHHHCCCHHCCCCHHHHHHHHHHHHHHCCCEEECCCCCHHHHHHHHHHHCC SQTDPDSLPSQYKQGNKENEQEKGRQDLIQTRDLTLKAIQEDKWLTEQEKTIQKEEALKA CCCCCHHCCHHHHCCCCCCHHHHHHHHHHHHHCHHHHHHHHHHCCCHHHHHHHHHHHHHH FETGIESVNQTVSLEQLKQRLIVYKASEKDSEKKEYPESIPNQHIPGKEKEVKAAKQEEL HHHHHHHHHHHHHHHHHHHHHHEEECCCCCCHHHHCHHHCCCCCCCCCHHHHHHHHHHHH KKLHDTTLEKINQDKWLTPDQQAEQLKQAEVTFKKGQEAIKSAQTLTQLETDLADYVSEN HHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC EGKGNSIPDKYKSGNKDDLVNKAEVKLKEAHEATKQAIEKDPWLSPEQKKAQKEKAKARL CCCCCCCCHHHCCCCHHHCCHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHH DEGLKALKAADSLEILKVTEEAFVDKEKNPDSIPNQHKAGTADQARKQALDSLDKEVQKE HHHHHHHHHHCCHHHHHHHHHHHHCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHH LESIDNDNTLTTDEKAAAKKKVNDAYDVAKQTAMEANSYEDLTTIKDEFLSNLPHKQGTP HHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCCCCC LKDQQSDAIAELEKKQQEIEKAIEGDKTLPRDEKEKQIADSKERLKSDTQKVKDAKNADA CCCCHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCHHH IKKAFEEGKVNIPQAHIPGDLNKDKEKLLAELKQKADDTEKAIDVDKTLTEDEKKEQKVK HHHHHHCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHH TKAELEKAKTDVKNTQTREELDKKVPELKKAIEDTHVKGNLEGVKNKAIEDLKKAHTETV HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHH AKINGDDTLDKATKEAQVKEADKALAAGKDAITKADDADKVSTAVTEHTPKIKAAHKTGD HHCCCCHHHHHHHHHHHHHHHHHHHHCCCHHHCCCCCHHHHHHHHHHCCCCCEEHHCCCC LKKAQVDANTALDKAAEKERGEINKDATLTTEDKAKQLKEVETALTKAKDNVKAAKTADA CHHHHCCHHHHHHHHHHHHHCCCCCCCEECCHHHHHHHHHHHHHHHHHHHHHHHHHHHHH INDARDKGVATIDAVHKAGQDLGARKSGQVAKLEEAAKATKDKISADPTLTSKEKEEQSK HHHHHHCCCHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHH AVDAELKKAIEAVNAADTADKVDDALGEGVTDIKNQHKSGDSIDARREAHGKELDRVAQE HHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHH TKGAIEKDPTLTTEEKAKQVKDVDAAKERGMAKLNEAKDADALDKAYGEGVTDIKNQHKS HCCCCCCCCCCCHHHHHHHHHHHHHHHHCCHHHHHHHCCHHHHHHHHCCCHHHHHHCCCC GDPVDARRGLHNKSIDEVAQATKDAITADTTLTEAEKETQRGNVDKEATKAKEELAKAKD CCCCHHHHCCCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHCCCCCHHHHHHHHHHHHHCC ADALDKAYGDGVTSIKNQHKSGKGLDVRKDEHKKALEAVAKRVTAEIEADPTLTPEVREQ CHHHHHHHCCCHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHH QKAEVQKELELATDKIAEAKDADEADKAYGDGVTAIENAHVIGKGIEARKDLAKKDLAEA HHHHHHHHHHHHHHHHHHHCCCCHHHHHHCCCCHHHHCCHHHHCCHHHHHHHHHHHHHHH AAKTKALIIEDKTLTDDQRKEQLLGVDTEYAKGIENIDAAKDAAGVDKAYSDGVRDILAQ HHHCCEEEEECCCCCCHHHHHHHHCCCHHHHHCHHHHHHHHHHHCCHHHHHHHHHHHHHH YKEGQNLNDRRNAAKEFLLKEADKVTKLINDDPTLTHDQKVDQINKVEQAKLDAIKSVDD HHCCCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCH AQTADAINDALGKGIENINNQYQHGDGVDVRKATAKGDLEKEAAKVKALIAKDPTLTQAD HHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHCCCHHHHHHHHHHHHHCCCCCCCCC KDKQTAAVDAAKNTAIAAVDKATTTEGINQELGKGITAINKAYRPGEGVKARKEAAKADL CCHHHHHHHHHCCCCEEECCCHHHHHHHHHHHHCHHHHHHHHCCCCCCCHHHHHHHHHHH EKEAAKVKALITNDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAI HHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCHHHHH NKAYRPGEGVKARKEAAKADLEREAAKVREAIANDPTLTKADKAKQTEAVAKALKAAIAA HHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHHH VDKATTAEGINQELGKGITAINKAYRPGEGVEAHKEAAKANLEKVAKETKALISGDRYLS HHHHHHHHHHHHHHHCHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCHHHHH ETEKAVQKQAVEQALAKALGQVEAAKTVEAVKLAENLGTVAIRSAYVAGLAKDTDQATAA HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHH LNEAKQAAIEALKQAAAETLAKITTDAKLTEAQKAEQSENVSLALKTAIATVRSAQSIAS HHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHH VKEAKDKGITAIRAAYVPNKAVAKSSSANHLPKSGDANSIVLVGLGVMSLLLGMVLYSKK HHHHHHCCCHHHHHHHCCCHHHHCCCCCCCCCCCCCCCCEEEHHHHHHHHHHHHHHHHHH KESKD HCCCC >Mature Secondary Structure MRKVKKVFVSSCMLLTVGLGVAVPTGFSQSNGVMVVKAAEVPATDLSRQASDSERVDESS CCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCHHHHHHHCCCHHHCCHHH LLQKENLSVDSFKLENLNGWEAENDTAGNLGKFKDPDSSGYQNILTSSGKNISVAVAPKG HHHHHCCCCCCEEECCCCCCCCCCCCCCCCCCCCCCCCCHHHHHHHCCCCEEEEEEECCC SGKMNIKVTKRSNFQGGYYVGGLRTQTPVLKLNDVYRYSFTTKKLSGNSSEFKTRVKPVE CCEEEEEEEECCCCCCCEEECCCCCCCCEEEECCCEEEEEEHHHCCCCCHHHHHHCCCCC SNNKLGKELVIRVDNKNVSTKHDWLPDISDGTHTVDFTGLDKKLSVAFRFSPRQTSNVVY CCCCCCCEEEEEECCCCCCCCCCCCCCCCCCCEEEEECCCCCEEEEEEEECCCCCCCEEE EFSNINIKNISPASVPAIPSKVLEGTSVLSGTAISSGDTLEKRKSFDGDILRVYKDSKII EECCCCCCCCCCCCCCCCHHHHHCCCHHHCCCCCCCCCHHHHHHCCCCCEEEHHHCCHHH ARTVIKGNKWDVKLSKPLIAGEKLDFEILHPRSQNVSKKISKQVEAKPFDPASYKEKVIA HHHHHCCCCCEEEECCCEECCCCCCEEEECCCCCCHHHHHHHHHCCCCCCCHHHHHHHHH KLKPVYEATSEKITNDAWLDENAKDLQKQKLEEQYISGKVAISEAGTKQEAIDAAYNKYS HHHHHHHHHHHHHCCCHHCCCCHHHHHHHHHHHHHHCCCEEECCCCCHHHHHHHHHHHCC SQTDPDSLPSQYKQGNKENEQEKGRQDLIQTRDLTLKAIQEDKWLTEQEKTIQKEEALKA CCCCCHHCCHHHHCCCCCCHHHHHHHHHHHHHCHHHHHHHHHHCCCHHHHHHHHHHHHHH FETGIESVNQTVSLEQLKQRLIVYKASEKDSEKKEYPESIPNQHIPGKEKEVKAAKQEEL HHHHHHHHHHHHHHHHHHHHHHEEECCCCCCHHHHCHHHCCCCCCCCCHHHHHHHHHHHH KKLHDTTLEKINQDKWLTPDQQAEQLKQAEVTFKKGQEAIKSAQTLTQLETDLADYVSEN HHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC EGKGNSIPDKYKSGNKDDLVNKAEVKLKEAHEATKQAIEKDPWLSPEQKKAQKEKAKARL CCCCCCCCHHHCCCCHHHCCHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHH DEGLKALKAADSLEILKVTEEAFVDKEKNPDSIPNQHKAGTADQARKQALDSLDKEVQKE HHHHHHHHHHCCHHHHHHHHHHHHCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHH LESIDNDNTLTTDEKAAAKKKVNDAYDVAKQTAMEANSYEDLTTIKDEFLSNLPHKQGTP HHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHCCCCCCCC LKDQQSDAIAELEKKQQEIEKAIEGDKTLPRDEKEKQIADSKERLKSDTQKVKDAKNADA CCCCHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCHHH IKKAFEEGKVNIPQAHIPGDLNKDKEKLLAELKQKADDTEKAIDVDKTLTEDEKKEQKVK HHHHHHCCCCCCCCCCCCCCCCCCHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHH TKAELEKAKTDVKNTQTREELDKKVPELKKAIEDTHVKGNLEGVKNKAIEDLKKAHTETV HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHH AKINGDDTLDKATKEAQVKEADKALAAGKDAITKADDADKVSTAVTEHTPKIKAAHKTGD HHCCCCHHHHHHHHHHHHHHHHHHHHCCCHHHCCCCCHHHHHHHHHHCCCCCEEHHCCCC LKKAQVDANTALDKAAEKERGEINKDATLTTEDKAKQLKEVETALTKAKDNVKAAKTADA CHHHHCCHHHHHHHHHHHHHCCCCCCCEECCHHHHHHHHHHHHHHHHHHHHHHHHHHHHH INDARDKGVATIDAVHKAGQDLGARKSGQVAKLEEAAKATKDKISADPTLTSKEKEEQSK HHHHHHCCCHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHH AVDAELKKAIEAVNAADTADKVDDALGEGVTDIKNQHKSGDSIDARREAHGKELDRVAQE HHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHH TKGAIEKDPTLTTEEKAKQVKDVDAAKERGMAKLNEAKDADALDKAYGEGVTDIKNQHKS HCCCCCCCCCCCHHHHHHHHHHHHHHHHCCHHHHHHHCCHHHHHHHHCCCHHHHHHCCCC GDPVDARRGLHNKSIDEVAQATKDAITADTTLTEAEKETQRGNVDKEATKAKEELAKAKD CCCCHHHHCCCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHCCCCCHHHHHHHHHHHHHCC ADALDKAYGDGVTSIKNQHKSGKGLDVRKDEHKKALEAVAKRVTAEIEADPTLTPEVREQ CHHHHHHHCCCHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHH QKAEVQKELELATDKIAEAKDADEADKAYGDGVTAIENAHVIGKGIEARKDLAKKDLAEA HHHHHHHHHHHHHHHHHHHCCCCHHHHHHCCCCHHHHCCHHHHCCHHHHHHHHHHHHHHH AAKTKALIIEDKTLTDDQRKEQLLGVDTEYAKGIENIDAAKDAAGVDKAYSDGVRDILAQ HHHCCEEEEECCCCCCHHHHHHHHCCCHHHHHCHHHHHHHHHHHCCHHHHHHHHHHHHHH YKEGQNLNDRRNAAKEFLLKEADKVTKLINDDPTLTHDQKVDQINKVEQAKLDAIKSVDD HHCCCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCH AQTADAINDALGKGIENINNQYQHGDGVDVRKATAKGDLEKEAAKVKALIAKDPTLTQAD HHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHCCCHHHHHHHHHHHHHCCCCCCCCC KDKQTAAVDAAKNTAIAAVDKATTTEGINQELGKGITAINKAYRPGEGVKARKEAAKADL CCHHHHHHHHHCCCCEEECCCHHHHHHHHHHHHCHHHHHHHHCCCCCCCHHHHHHHHHHH EKEAAKVKALITNDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAI HHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCHHHHH NKAYRPGEGVKARKEAAKADLEREAAKVREAIANDPTLTKADKAKQTEAVAKALKAAIAA HHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHHH VDKATTAEGINQELGKGITAINKAYRPGEGVEAHKEAAKANLEKVAKETKALISGDRYLS HHHHHHHHHHHHHHHCHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCHHHHH ETEKAVQKQAVEQALAKALGQVEAAKTVEAVKLAENLGTVAIRSAYVAGLAKDTDQATAA HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHH LNEAKQAAIEALKQAAAETLAKITTDAKLTEAQKAEQSENVSLALKTAIATVRSAQSIAS HHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHH VKEAKDKGITAIRAAYVPNKAVAKSSSANHLPKSGDANSIVLVGLGVMSLLLGMVLYSKK HHHHHHCCCHHHHHHHCCCHHHHCCCCCCCCCCCCCCCCEEEHHHHHHHHHHHHHHHHHH KESKD HCCCC
PDB accession: NA
Resolution: NA
Structure class: Alpha
Cofactors: NA
Metal ions: NA
Kcat value (1/min): NA
Specific activity: NA
Km value (mM): NA
Substrates: NA
Specific reaction: NA
General reaction: NA
Inhibitor: NA
Structure determination priority: 6.0
TargetDB status: NA
Availability: NA
References: NA