BacMap

Definition	Shigella flexneri 2a str. 2457T, complete genome.
Accession	NC_004741
Length	4,599,354

Click here to switch to the map view.

The map label for this gene is fhiA

Identifier: 30061846

GI number: 30061846

Start: 298315

End: 300054

Strand: Reverse

Name: fhiA

Synonym: S0299

Alternate gene names: 30061846

Gene position: 300054-298315 (Counterclockwise)

Preceding gene: 30061854

Following gene: 30061843

Centisome position: 6.52

GC content: 58.39

Gene sequence:

>1740_bases
ATGCTTTCACGCTCGGATTTACTGACGCTGTTGACAATCAACTTTATCGTCGTCACCAAAGAGGCCGAGCGTATTTCCGA
GGTTTCTGCCCGCTTTACCCTGGACGCGATGCCCGGCAAACAGATGGCGATTGACGCCGATCTTAACGCCGGATTGATCA
ACCAGGCGCAGGCGCAAACCCGGCGTAAAGATGTTGCCAGCGAGGCCGATTTCTACGGCGCGATGGACGGGGCATCGAAG
TTTGTACGCGGAGACGCCATCGCCGGGATGATGATTCTGGCGATCAACCTGAGCGGCGGCGTCTGTATCGGCATCTTCAA
ATACAACCTGAGCGCCGACGCCGCCTTCCAGCAATACGTGCTGATGACCATCGGCGACGGCCTGGTGGCGCAGATCCCTT
CCCTGCTGCTCTCCACCGCGGCGGCGATTATCGTCACCCGCGTCAGCGACAACGGCGATATCGCCCATGACGTGCGCCAC
CAGTTGCTGGCAAGCCCGTCGGTGCTCTACACCGCCACCGGGATCATGTTCGTGCTGGCGGTGGTGCCGGGGATGCCGCA
TCTGCCGTTTTTGCTGTTCAGCGCCCTGCTTGGCTTTACCGGCTGGCGGATGAGCAAACGCCCGCAGGCGGCGAAGGCGG
AAGAGAAAAGCCTCGAAACGCTGACCCGCACCATCACTGAAACCAGCGAACAACAGGTCAGTTGGGAAACTATTCCGCTG
ATCGAGCCCATCAGCTTAAGCCTCGGCTACAAGCTGGTGGCGCTGGTGGACAAAGCGCAGGGCAACCCGCTCACCCAGCG
GATTCGCGGCGTTCGGCAGGTGATTTCCGACGGTAACGGCGTGCTGCTGCCGGAGATCCGCATTCGGGAAAACTTCCGCC
TCAAGCCCAGCCAGTACGCTATTTTCATCAACGGCATTGAGGCTGATGAAGCGGATATTCCGGCGGATAAACTGATGGCG
CTGCCCTCCAGCGAAACCTACGGCGAGATTGACGGCGTGCTGGGGAACGACCCGGCGTACGGGATACCGGTCACCTGGAT
CCAGCCTGCGCAGAAAGCGAAGGCTCTGAATATGGGGTATCAGGTGATCGACAGCGCCAGTGTGATTGCCACCCATGTGA
ACAAGATTGTGCGCAGCTATATTCCTGATTTGTTTAACTATGATGACATCACGCAGTTGCATAACCGTTTGTCGTCGATG
GCACCGCGCCTGGCGGAGGATTTAAGCGCGGCGCTCAATTACAGCCAATTGCTGAAAGTGTACCGGGCGCTGCTGACCGA
AGGCGTTTCCCTGCGCGATATCGTCACCATCGCCACCGTGCTGGTCGCCAGTAGCACGGTGACTAAAGATCATATTCTGC
TGGCGGCCGATGTGCGCCTGGCGCTGCGGCGCAGCATTACTCATCCGTTCGTTCGCAAGCAGGAGCTGACGGTGTATACG
CTGAATAATGAGCTGGAAAATCTGCTGACCAACGTAGTGAATCAGGCGCAACAGGCCGGCAAAGTGATGCTCGACAGCGT
GCCGGTTGACCCGAATATGCTCAACCAGTTCCAGAGCACGATGCCACAGGTGAAAGAGCAGATGAAAGCGGCGGGGAAAG
ATCCGGTGCTGCTGGTGCCGCCGCAGCTACGCCCTTTGCTGCCGCGTTATGCAAGGTTGTTTGCGCCGGGGCTGCATGTG
CTGTCGTATAACGAAGTGCCGGATGAGCTGGAGTTGAAGATTATGGGGGCGTTGATGTAA

Upstream 100 bases:

>100_bases
CGCCACGGTGGCAGGTTTTGGCGGATGAGACGGGCTGATTTTATTTAACGGCGACAGCCCACCACCGTTAAAAATCGACT
GCCCGTGCAGCGCGGCGATA

Downstream 100 bases:

>100_bases
GAATCCGGCATCGGTGCACAATTGCCGGATGCGGCGTAAACGCCTTATCCGGCCTACCGTTCAGGCACAAGTTTTTAGGC
ATGATAAGACGCGCCAGCGT

Product: flagellar biosynthetic protein FlhA

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 579; Mature: 579

Protein sequence:

>579_residues
MLSRSDLLTLLTINFIVVTKEAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQTRRKDVASEADFYGAMDGASK
FVRGDAIAGMMILAINLSGGVCIGIFKYNLSADAAFQQYVLMTIGDGLVAQIPSLLLSTAAAIIVTRVSDNGDIAHDVRH
QLLASPSVLYTATGIMFVLAVVPGMPHLPFLLFSALLGFTGWRMSKRPQAAKAEEKSLETLTRTITETSEQQVSWETIPL
IEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYAIFINGIEADEADIPADKLMA
LPSSETYGEIDGVLGNDPAYGIPVTWIQPAQKAKALNMGYQVIDSASVIATHVNKIVRSYIPDLFNYDDITQLHNRLSSM
APRLAEDLSAALNYSQLLKVYRALLTEGVSLRDIVTIATVLVASSTVTKDHILLAADVRLALRRSITHPFVRKQELTVYT
LNNELENLLTNVVNQAQQAGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVPPQLRPLLPRYARLFAPGLHV
LSYNEVPDELELKIMGALM

Sequences:

>Translated_579_residues
MLSRSDLLTLLTINFIVVTKEAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQTRRKDVASEADFYGAMDGASK
FVRGDAIAGMMILAINLSGGVCIGIFKYNLSADAAFQQYVLMTIGDGLVAQIPSLLLSTAAAIIVTRVSDNGDIAHDVRH
QLLASPSVLYTATGIMFVLAVVPGMPHLPFLLFSALLGFTGWRMSKRPQAAKAEEKSLETLTRTITETSEQQVSWETIPL
IEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYAIFINGIEADEADIPADKLMA
LPSSETYGEIDGVLGNDPAYGIPVTWIQPAQKAKALNMGYQVIDSASVIATHVNKIVRSYIPDLFNYDDITQLHNRLSSM
APRLAEDLSAALNYSQLLKVYRALLTEGVSLRDIVTIATVLVASSTVTKDHILLAADVRLALRRSITHPFVRKQELTVYT
LNNELENLLTNVVNQAQQAGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVPPQLRPLLPRYARLFAPGLHV
LSYNEVPDELELKIMGALM
>Mature_579_residues
MLSRSDLLTLLTINFIVVTKEAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQTRRKDVASEADFYGAMDGASK
FVRGDAIAGMMILAINLSGGVCIGIFKYNLSADAAFQQYVLMTIGDGLVAQIPSLLLSTAAAIIVTRVSDNGDIAHDVRH
QLLASPSVLYTATGIMFVLAVVPGMPHLPFLLFSALLGFTGWRMSKRPQAAKAEEKSLETLTRTITETSEQQVSWETIPL
IEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYAIFINGIEADEADIPADKLMA
LPSSETYGEIDGVLGNDPAYGIPVTWIQPAQKAKALNMGYQVIDSASVIATHVNKIVRSYIPDLFNYDDITQLHNRLSSM
APRLAEDLSAALNYSQLLKVYRALLTEGVSLRDIVTIATVLVASSTVTKDHILLAADVRLALRRSITHPFVRKQELTVYT
LNNELENLLTNVVNQAQQAGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVPPQLRPLLPRYARLFAPGLHV
LSYNEVPDELELKIMGALM

Specific function: Not Known. [C]

COG id: COG1298

COG function: function code NU; Flagellar biosynthesis pathway, component FlhA

Gene ontology:

Cell location: Cell inner membrane; Multi-pass membrane protein (Potential) [H]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the FHIPEP (flagella/HR/invasion proteins export pore) family [H]

Homologues:

Organism=Escherichia coli, GI1788187, Length=564, Percent_Identity=40.6028368794326, Blast_Score=406, Evalue=1e-114,

Paralogues:

None

Copy number: 10-20 (rich media) [C]

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR001712 [H]

Pfam domain/function: PF00771 FHIPEP [H]

EC number: NA

Molecular weight: Translated: 63329; Mature: 63329

Theoretical pI: Translated: 6.14; Mature: 6.14

Prosite motif: PS00994 FHIPEP

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.2 %Cys     (Translated Protein)
3.3 %Met     (Translated Protein)
3.5 %Cys+Met (Translated Protein)
0.2 %Cys     (Mature Protein)
3.3 %Met     (Mature Protein)
3.5 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MLSRSDLLTLLTINFIVVTKEAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQT
CCCHHHHHHHEEEEEEEEECCHHHHHHHHHHEEEECCCCCCEEEECCCCCCHHHHHHHHH
RRKDVASEADFYGAMDGASKFVRGDAIAGMMILAINLSGGVCIGIFKYNLSADAAFQQYV
HHHHHHHHHHHHHCHHHHHHHHHHHHHHCEEEEEEECCCCEEEEEEEECCCCHHHHHHHH
LMTIGDGLVAQIPSLLLSTAAAIIVTRVSDNGDIAHDVRHQLLASPSVLYTATGIMFVLA
HHHCCCCHHHHHHHHHHHHHHHHEEEEECCCCCHHHHHHHHHHCCCCHHHHHHHHHHHHH
VVPGMPHLPFLLFSALLGFTGWRMSKRPQAAKAEEKSLETLTRTITETSEQQVSWETIPL
HHCCCCCHHHHHHHHHHCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCHHHHCCCCCCCC
IEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYA
CCCCHHHCCCEEEEEHECCCCCHHHHHHHHHHHHHHCCCCEEECCEEECCCCCCCCCCEE
IFINGIEADEADIPADKLMALPSSETYGEIDGVLGNDPAYGIPVTWIQPAQKAKALNMGY
EEEECCCCCCCCCCHHHHEECCCCCCCCCCCCCCCCCCCCCCCEEEECCHHHHHHHHCCH
QVIDSASVIATHVNKIVRSYIPDLFNYDDITQLHNRLSSMAPRLAEDLSAALNYSQLLKV
HHHCCHHHHHHHHHHHHHHHCHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHH
YRALLTEGVSLRDIVTIATVLVASSTVTKDHILLAADVRLALRRSITHPFVRKQELTVYT
HHHHHHCCCCHHHHHHHHHHHHHCCCCCCCCEEEEHHHHHHHHHHHCCCHHCCCCEEEEE
LNNELENLLTNVVNQAQQAGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVP
ECHHHHHHHHHHHHHHHHCCCEEECCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCEEEEC
PQLRPLLPRYARLFAPGLHVLSYNEVPDELELKIMGALM
CCHHHHHHHHHHHHCCCCEEEECCCCCCHHHHHHHHHCC
>Mature Secondary Structure
MLSRSDLLTLLTINFIVVTKEAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQT
CCCHHHHHHHEEEEEEEEECCHHHHHHHHHHEEEECCCCCCEEEECCCCCCHHHHHHHHH
RRKDVASEADFYGAMDGASKFVRGDAIAGMMILAINLSGGVCIGIFKYNLSADAAFQQYV
HHHHHHHHHHHHHCHHHHHHHHHHHHHHCEEEEEEECCCCEEEEEEEECCCCHHHHHHHH
LMTIGDGLVAQIPSLLLSTAAAIIVTRVSDNGDIAHDVRHQLLASPSVLYTATGIMFVLA
HHHCCCCHHHHHHHHHHHHHHHHEEEEECCCCCHHHHHHHHHHCCCCHHHHHHHHHHHHH
VVPGMPHLPFLLFSALLGFTGWRMSKRPQAAKAEEKSLETLTRTITETSEQQVSWETIPL
HHCCCCCHHHHHHHHHHCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHCHHHHCCCCCCCC
IEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYA
CCCCHHHCCCEEEEEHECCCCCHHHHHHHHHHHHHHCCCCEEECCEEECCCCCCCCCCEE
IFINGIEADEADIPADKLMALPSSETYGEIDGVLGNDPAYGIPVTWIQPAQKAKALNMGY
EEEECCCCCCCCCCHHHHEECCCCCCCCCCCCCCCCCCCCCCCEEEECCHHHHHHHHCCH
QVIDSASVIATHVNKIVRSYIPDLFNYDDITQLHNRLSSMAPRLAEDLSAALNYSQLLKV
HHHCCHHHHHHHHHHHHHHHCHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHH
YRALLTEGVSLRDIVTIATVLVASSTVTKDHILLAADVRLALRRSITHPFVRKQELTVYT
HHHHHHCCCCHHHHHHHHHHHHHCCCCCCCCEEEEHHHHHHHHHHHCCCHHCCCCEEEEE
LNNELENLLTNVVNQAQQAGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVP
ECHHHHHHHHHHHHHHHHCCCEEECCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCEEEEC
PQLRPLLPRYARLFAPGLHVLSYNEVPDELELKIMGALM
CCHHHHHHHHHHHHCCCCEEEECCCCCCHHHHHHHHHCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 7596361; 9278503 [H]