BacMap

Definition	Escherichia coli HS, complete genome.
Accession	NC_009800
Length	4,643,538

Click here to switch to the map view.

The map label for this gene is yfcU [H]

Identifier: 157161826

GI number: 157161826

Start: 2493977

End: 2496619

Strand: Reverse

Name: yfcU [H]

Synonym: EcHS_A2489

Alternate gene names: 157161826

Gene position: 2496619-2493977 (Counterclockwise)

Preceding gene: 157161827

Following gene: 157161825

Centisome position: 53.77

GC content: 51.57

Gene sequence:

>2643_bases
ATGCCTGATCATTCTCTTTTTCGATTACGGATTCTTCCGTGGTGCATTGCGCTGGCAATGTCAGGGAGTTATAGCAGTGT
CTGGGCTGAAGACGACATTCAGTTTGATTCCCGTTTTCTGGAATTAAAAGGCGACACAAAAATTGATCTGAAGCGTTTTT
CCAGCCAGGGATATGTTGAGCCCGGAAAATACAATTTACAGGTTCAACTAAATAAACAGCCATTGGCGGAAGAGTACGAT
ATTTACTGGTATGCTGGTGAAGATGACGCGAGCAAAAGCTATGCTTGTCTGACACCGGAACTGGTAGCGCAGTTTGGTTT
AAAAGAAGACGTGGCGAAAAATCTGCAATGGAGCCACGATGCTAAATGCCTGAAATCCGGTCAACTGGAAGGCGTGGAAA
TTAAGGCTGATTTAAGCCAGTCCGCATTAGTCATTTCACTGCCACAGGCTTACCTCGAATATACTTATCCCGACTGGGAT
CCGCCTTCACGTTGGGATGACGGCATCTCCGGGATCGTCGCGGACTACAGCATCAACGCACAAACCCGGCACGAAGAAAA
TGGCGGTGATGATAGTAACGAGATCAGCGGCAACGGGACGGTCGGGGTTAACCTGGGGCCGTGGCGTATGCGTGCTGACT
GGCAGACTAACTATCAACATACTCGCAGTAATGATGACGATGAATTCAGCGGCGATGAAACTCAAAAAAAATGGGAGTGG
AGTCGCTACTATGCCTGGCGGGCGTTACCATCATTAAAAGCCAAACTGGCGCTGGGCGAGGATTACCTCAGATCCGATAT
TTTTGATGGTTTTAACTATGTTGGTGGCAGTGTCAGTACTGACGATCAAATGTTGCCTCCCAATCTGCGCGGCTACGCGC
CAGACATTTCCGGCGTGGCACACACCACAGCAAAAGTGACCGTCAGCCAGATGGGGCGTGTGATTTACGAAACGCAGGTT
CCGGCTGGACCGTTTCGTATTCAGGATCTTGGTGATTCTGTCTCCGGTACGTTGCATATTCGCATTGAAGAACAGAACGG
CCAGGTGCAGGAATATGACATCAGCACCGCCTCGATGCCATACCTCACTCGTCCAGGTCAGGTTCGCTATAAGATCATGA
TGGGCCGTCCGCAAGAGTGGGGACACCATGTCGAGGGTGAATTTTTTTCTGGTGCTGAAGCTTCCTGGGGGATCGCTAAC
GGCTGGTCGTTATATGGCGGCGCACTGGGAGATGAAAACTATCAGTCTGCGGCGCTTGGCGTCGGTCGCGATTTGTCTAC
ATTCGGCGCGGTCGCGTTTGATGTTACTCACTCGCACACCAAACTGGATAAAGACACCGCTTATGGCAAAGGTTCGCTGG
ACGGTAACTCCTTCCGTGTGAGTTATTCCAAAGACTTTGACCAGCTCAACAGCCGCGTTACTTTTGCTGGATATCGCTTC
TCGGAAGAGAACTTTATGACCATGAGCGAGTATCTGGATGCCAGTGACAGCGGAATGGTACGCACGGGCAACGACAAAGA
GATGTACACCGCCACTTATAACCAGAACTTCCGCGATGCGGGTGTTTCGGTTTATCTCAACTATACCCGCCATACCTACT
GGGATCGCGAGGAGCAGACAAACTACAACATCATGCTCTCGCACTATTTCAATATGGGCAGTATTCGTAATGTCAGCATC
TCGATGACTGGCTACCGTTACGAGTATGACAACCAGGCCGACAAAGGCATGTACATTTCGCTCAGTATGCCGTGGGGCGA
CAACAGTACCGTTAGCTATAACGGCAACTATGGCAGTGGGACGGACAGCAGTCAGGTCGGTTATTTCAGCCGTGTCGATG
ACGCGACTCACTATCAGTTGAACGTCGGCACCAGTGACAAACACACCAGCGTTGACGGCTATTACAGCCATGATGGTTCG
CTGGCGCAGGTTGACCTCAGCGCGAACTACCATGAAGGGCAATACACCTCTGCGGGCTTGTCGTTACAGGGCGGCGCAAC
GCTTACTGCCCACGGTGGCGCACTTCACCGTACCCAGAATATGGGCGGGACACGCTTGTTGATTGATGCCGATGGCGTTG
CCGATGTTCCGGTGGAAGGTAACGGGGCAGCTGTTTATACCAATATGTTTGGTAAGGCCGTCGTTTCTGACGTCAATAAC
TATTACCGCAATCAGGCGTATATCGACCTCAACAAACTGCCGGAAAACGCCGAAGCAACCCAGTCGGTGGTACAAGCCAC
GCTAACTGAAGGGGCGATTGGCTACCGCAAATTTACCGTCATCAGTGGTCAAAAAGCGATGGCGGTGCTGCGCCTGAGCG
ACGGCAGCCATCCTCCGTTTGGCGCAGAAGTAAAAAATGATAACGAGCAGACAGTGGGCCTTGTCGATGATGACGGCAAT
GTTTATCTGGCAGGGGTGAAACCTGGCGAACACATGAGTGTGTTCTGGAGTGGTGTTGCGCATTGCGATATCAACCTGCC
GGACCCGCTGCCTGCCGATCTGTTTAACGGCTTGTTACTGCCATGCCAGCATAAAGGCAATGTAGCACCTGTCACTTCGC
CGGCGGTCAAACCGGCGATTCAGGAACAGACACAGCGGGTGACGCCAACGGAACCCCCGACTTCAATTTCAGTAAACCAG
TAA

Upstream 100 bases:

>100_bases
CCAGATTACTTACCTGTAAGGCATACCCCCATAGCGACACTGCTATGGGGGATTTAAATGGATTTTGACCAAACAAGAAT
AAAAACGGATAGAAACGTGT

Downstream 100 bases:

>100_bases
CGTGATTAAGGAATGATCCATGTTTAATCTGACTAACACTGCAAAAATCGTTGTCCCGGCACTGGCGCTGCTGGCGACAG
CGGTCAGTTTCTCCAGCCAC

Product: fimbrial usher family protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 880; Mature: 879

Protein sequence:

>880_residues
MPDHSLFRLRILPWCIALAMSGSYSSVWAEDDIQFDSRFLELKGDTKIDLKRFSSQGYVEPGKYNLQVQLNKQPLAEEYD
IYWYAGEDDASKSYACLTPELVAQFGLKEDVAKNLQWSHDAKCLKSGQLEGVEIKADLSQSALVISLPQAYLEYTYPDWD
PPSRWDDGISGIVADYSINAQTRHEENGGDDSNEISGNGTVGVNLGPWRMRADWQTNYQHTRSNDDDEFSGDETQKKWEW
SRYYAWRALPSLKAKLALGEDYLRSDIFDGFNYVGGSVSTDDQMLPPNLRGYAPDISGVAHTTAKVTVSQMGRVIYETQV
PAGPFRIQDLGDSVSGTLHIRIEEQNGQVQEYDISTASMPYLTRPGQVRYKIMMGRPQEWGHHVEGEFFSGAEASWGIAN
GWSLYGGALGDENYQSAALGVGRDLSTFGAVAFDVTHSHTKLDKDTAYGKGSLDGNSFRVSYSKDFDQLNSRVTFAGYRF
SEENFMTMSEYLDASDSGMVRTGNDKEMYTATYNQNFRDAGVSVYLNYTRHTYWDREEQTNYNIMLSHYFNMGSIRNVSI
SMTGYRYEYDNQADKGMYISLSMPWGDNSTVSYNGNYGSGTDSSQVGYFSRVDDATHYQLNVGTSDKHTSVDGYYSHDGS
LAQVDLSANYHEGQYTSAGLSLQGGATLTAHGGALHRTQNMGGTRLLIDADGVADVPVEGNGAAVYTNMFGKAVVSDVNN
YYRNQAYIDLNKLPENAEATQSVVQATLTEGAIGYRKFTVISGQKAMAVLRLSDGSHPPFGAEVKNDNEQTVGLVDDDGN
VYLAGVKPGEHMSVFWSGVAHCDINLPDPLPADLFNGLLLPCQHKGNVAPVTSPAVKPAIQEQTQRVTPTEPPTSISVNQ

Sequences:

>Translated_880_residues
MPDHSLFRLRILPWCIALAMSGSYSSVWAEDDIQFDSRFLELKGDTKIDLKRFSSQGYVEPGKYNLQVQLNKQPLAEEYD
IYWYAGEDDASKSYACLTPELVAQFGLKEDVAKNLQWSHDAKCLKSGQLEGVEIKADLSQSALVISLPQAYLEYTYPDWD
PPSRWDDGISGIVADYSINAQTRHEENGGDDSNEISGNGTVGVNLGPWRMRADWQTNYQHTRSNDDDEFSGDETQKKWEW
SRYYAWRALPSLKAKLALGEDYLRSDIFDGFNYVGGSVSTDDQMLPPNLRGYAPDISGVAHTTAKVTVSQMGRVIYETQV
PAGPFRIQDLGDSVSGTLHIRIEEQNGQVQEYDISTASMPYLTRPGQVRYKIMMGRPQEWGHHVEGEFFSGAEASWGIAN
GWSLYGGALGDENYQSAALGVGRDLSTFGAVAFDVTHSHTKLDKDTAYGKGSLDGNSFRVSYSKDFDQLNSRVTFAGYRF
SEENFMTMSEYLDASDSGMVRTGNDKEMYTATYNQNFRDAGVSVYLNYTRHTYWDREEQTNYNIMLSHYFNMGSIRNVSI
SMTGYRYEYDNQADKGMYISLSMPWGDNSTVSYNGNYGSGTDSSQVGYFSRVDDATHYQLNVGTSDKHTSVDGYYSHDGS
LAQVDLSANYHEGQYTSAGLSLQGGATLTAHGGALHRTQNMGGTRLLIDADGVADVPVEGNGAAVYTNMFGKAVVSDVNN
YYRNQAYIDLNKLPENAEATQSVVQATLTEGAIGYRKFTVISGQKAMAVLRLSDGSHPPFGAEVKNDNEQTVGLVDDDGN
VYLAGVKPGEHMSVFWSGVAHCDINLPDPLPADLFNGLLLPCQHKGNVAPVTSPAVKPAIQEQTQRVTPTEPPTSISVNQ
>Mature_879_residues
PDHSLFRLRILPWCIALAMSGSYSSVWAEDDIQFDSRFLELKGDTKIDLKRFSSQGYVEPGKYNLQVQLNKQPLAEEYDI
YWYAGEDDASKSYACLTPELVAQFGLKEDVAKNLQWSHDAKCLKSGQLEGVEIKADLSQSALVISLPQAYLEYTYPDWDP
PSRWDDGISGIVADYSINAQTRHEENGGDDSNEISGNGTVGVNLGPWRMRADWQTNYQHTRSNDDDEFSGDETQKKWEWS
RYYAWRALPSLKAKLALGEDYLRSDIFDGFNYVGGSVSTDDQMLPPNLRGYAPDISGVAHTTAKVTVSQMGRVIYETQVP
AGPFRIQDLGDSVSGTLHIRIEEQNGQVQEYDISTASMPYLTRPGQVRYKIMMGRPQEWGHHVEGEFFSGAEASWGIANG
WSLYGGALGDENYQSAALGVGRDLSTFGAVAFDVTHSHTKLDKDTAYGKGSLDGNSFRVSYSKDFDQLNSRVTFAGYRFS
EENFMTMSEYLDASDSGMVRTGNDKEMYTATYNQNFRDAGVSVYLNYTRHTYWDREEQTNYNIMLSHYFNMGSIRNVSIS
MTGYRYEYDNQADKGMYISLSMPWGDNSTVSYNGNYGSGTDSSQVGYFSRVDDATHYQLNVGTSDKHTSVDGYYSHDGSL
AQVDLSANYHEGQYTSAGLSLQGGATLTAHGGALHRTQNMGGTRLLIDADGVADVPVEGNGAAVYTNMFGKAVVSDVNNY
YRNQAYIDLNKLPENAEATQSVVQATLTEGAIGYRKFTVISGQKAMAVLRLSDGSHPPFGAEVKNDNEQTVGLVDDDGNV
YLAGVKPGEHMSVFWSGVAHCDINLPDPLPADLFNGLLLPCQHKGNVAPVTSPAVKPAIQEQTQRVTPTEPPTSISVNQ

Specific function: Involved in the export and assembly of a fimbrial subunit across the outer membrane [H]

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cell outer membrane; Multi-pass membrane protein [H]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the fimbrial export usher family [H]

Homologues:

Organism=Escherichia coli, GI87081778, Length=849, Percent_Identity=34.8645465253239, Blast_Score=494, Evalue=1e-141,
Organism=Escherichia coli, GI1790772, Length=889, Percent_Identity=26.6591676040495, Blast_Score=286, Evalue=5e-78,
Organism=Escherichia coli, GI1787172, Length=867, Percent_Identity=27.4509803921569, Blast_Score=276, Evalue=4e-75,
Organism=Escherichia coli, GI1789533, Length=862, Percent_Identity=27.3781902552204, Blast_Score=274, Evalue=2e-74,
Organism=Escherichia coli, GI1786332, Length=860, Percent_Identity=28.4883720930233, Blast_Score=267, Evalue=2e-72,
Organism=Escherichia coli, GI1786744, Length=857, Percent_Identity=26.3710618436406, Blast_Score=247, Evalue=3e-66,
Organism=Escherichia coli, GI1788427, Length=773, Percent_Identity=24.8382923673997, Blast_Score=214, Evalue=2e-56,
Organism=Escherichia coli, GI1789610, Length=852, Percent_Identity=22.5352112676056, Blast_Score=124, Evalue=3e-29,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR000015
- InterPro:   IPR018030 [H]

Pfam domain/function: PF00577 Usher [H]

EC number: NA

Molecular weight: Translated: 97332; Mature: 97201

Theoretical pI: Translated: 4.57; Mature: 4.57

Prosite motif: PS00133 CARBOXYPEPT_ZN_2 ; PS01151 FIMBRIAL_USHER

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.6 %Cys     (Translated Protein)
2.4 %Met     (Translated Protein)
3.0 %Cys+Met (Translated Protein)
0.6 %Cys     (Mature Protein)
2.3 %Met     (Mature Protein)
2.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MPDHSLFRLRILPWCIALAMSGSYSSVWAEDDIQFDSRFLELKGDTKIDLKRFSSQGYVE
CCCCCEEEHHHHHHHHHHHHCCCCCEEECCCCCCCCCEEEEECCCCEEEHEECCCCCCCC
PGKYNLQVQLNKQPLAEEYDIYWYAGEDDASKSYACLTPELVAQFGLKEDVAKNLQWSHD
CCEEEEEEEECCCCCCCCCEEEEEECCCCCCCCEEEECHHHHHHCCCHHHHHHCCCCCCC
AKCLKSGQLEGVEIKADLSQSALVISLPQAYLEYTYPDWDPPSRWDDGISGIVADYSINA
HHHHHCCCCCCEEEEECCCCCEEEEEECHHHHEECCCCCCCCCCCCCCCCCEEEEEEECC
QTRHEENGGDDSNEISGNGTVGVNLGPWRMRADWQTNYQHTRSNDDDEFSGDETQKKWEW
CCCCCCCCCCCCCCCCCCCEEEEECCCEEEECCCCCCCCCCCCCCCCCCCCCCHHHHHHH
SRYYAWRALPSLKAKLALGEDYLRSDIFDGFNYVGGSVSTDDQMLPPNLRGYAPDISGVA
HHEEEECCCCCHHEEEECCHHHHHHHHHCCHHHCCCCCCCCCCCCCCCCCCCCCCCCCCC
HTTAKVTVSQMGRVIYETQVPAGPFRIQDLGDSVSGTLHIRIEEQNGQVQEYDISTASMP
HHHHEEEHHHCCCEEEEECCCCCCEEEEECCCCCCCEEEEEEECCCCCEEEEECCCCCCC
YLTRPGQVRYKIMMGRPQEWGHHVEGEFFSGAEASWGIANGWSLYGGALGDENYQSAALG
CEECCCCEEEEEEECCCHHHCCCCCCCEECCCCCCCCCCCCCEEECCCCCCCCCCHHHHC
VGRDLSTFGAVAFDVTHSHTKLDKDTAYGKGSLDGNSFRVSYSKDFDQLNSRVTFAGYRF
CCCCHHHHCEEEEEEECCCCCCCCCCCCCCCCCCCCEEEEEECCCHHHHCCEEEEEEEEE
SEENFMTMSEYLDASDSGMVRTGNDKEMYTATYNQNFRDAGVSVYLNYTRHTYWDREEQT
CCCCCEEHHHHCCCCCCCEEEECCCCEEEEEECCCCCCCCCEEEEEEECCCEECCCCCCC
NYNIMLSHYFNMGSIRNVSISMTGYRYEYDNQADKGMYISLSMPWGDNSTVSYNGNYGSG
CCEEEEEEEECCCCEEEEEEEEEEEEEECCCCCCCCEEEEEECCCCCCCEEEECCCCCCC
TDSSQVGYFSRVDDATHYQLNVGTSDKHTSVDGYYSHDGSLAQVDLSANYHEGQYTSAGL
CCCCCCCEEEECCCCEEEEEECCCCCCCCCCCCEECCCCCEEEEEECCCCCCCCEEECCE
SLQGGATLTAHGGALHRTQNMGGTRLLIDADGVADVPVEGNGAAVYTNMFGKAVVSDVNN
EECCCEEEEECCCEEEEECCCCCEEEEEECCCCEECCCCCCCCEEEECHHHHHHHHHHHH
YYRNQAYIDLNKLPENAEATQSVVQATLTEGAIGYRKFTVISGQKAMAVLRLSDGSHPPF
HHCCEEEEECCCCCCCHHHHHHHHHHHHHCCCCCEEEEEEEECCCEEEEEEECCCCCCCC
GAEVKNDNEQTVGLVDDDGNVYLAGVKPGEHMSVFWSGVAHCDINLPDPLPADLFNGLLL
CCEECCCCCEEEEEEECCCCEEEEECCCCCCEEEEECCEEEEECCCCCCCCHHHHCCCEE
PCQHKGNVAPVTSPAVKPAIQEQTQRVTPTEPPTSISVNQ
EECCCCCCCCCCCCCCCHHHHHHHCCCCCCCCCCEEECCC
>Mature Secondary Structure 
PDHSLFRLRILPWCIALAMSGSYSSVWAEDDIQFDSRFLELKGDTKIDLKRFSSQGYVE
CCCCEEEHHHHHHHHHHHHCCCCCEEECCCCCCCCCEEEEECCCCEEEHEECCCCCCCC
PGKYNLQVQLNKQPLAEEYDIYWYAGEDDASKSYACLTPELVAQFGLKEDVAKNLQWSHD
CCEEEEEEEECCCCCCCCCEEEEEECCCCCCCCEEEECHHHHHHCCCHHHHHHCCCCCCC
AKCLKSGQLEGVEIKADLSQSALVISLPQAYLEYTYPDWDPPSRWDDGISGIVADYSINA
HHHHHCCCCCCEEEEECCCCCEEEEEECHHHHEECCCCCCCCCCCCCCCCCEEEEEEECC
QTRHEENGGDDSNEISGNGTVGVNLGPWRMRADWQTNYQHTRSNDDDEFSGDETQKKWEW
CCCCCCCCCCCCCCCCCCCEEEEECCCEEEECCCCCCCCCCCCCCCCCCCCCCHHHHHHH
SRYYAWRALPSLKAKLALGEDYLRSDIFDGFNYVGGSVSTDDQMLPPNLRGYAPDISGVA
HHEEEECCCCCHHEEEECCHHHHHHHHHCCHHHCCCCCCCCCCCCCCCCCCCCCCCCCCC
HTTAKVTVSQMGRVIYETQVPAGPFRIQDLGDSVSGTLHIRIEEQNGQVQEYDISTASMP
HHHHEEEHHHCCCEEEEECCCCCCEEEEECCCCCCCEEEEEEECCCCCEEEEECCCCCCC
YLTRPGQVRYKIMMGRPQEWGHHVEGEFFSGAEASWGIANGWSLYGGALGDENYQSAALG
CEECCCCEEEEEEECCCHHHCCCCCCCEECCCCCCCCCCCCCEEECCCCCCCCCCHHHHC
VGRDLSTFGAVAFDVTHSHTKLDKDTAYGKGSLDGNSFRVSYSKDFDQLNSRVTFAGYRF
CCCCHHHHCEEEEEEECCCCCCCCCCCCCCCCCCCCEEEEEECCCHHHHCCEEEEEEEEE
SEENFMTMSEYLDASDSGMVRTGNDKEMYTATYNQNFRDAGVSVYLNYTRHTYWDREEQT
CCCCCEEHHHHCCCCCCCEEEECCCCEEEEEECCCCCCCCCEEEEEEECCCEECCCCCCC
NYNIMLSHYFNMGSIRNVSISMTGYRYEYDNQADKGMYISLSMPWGDNSTVSYNGNYGSG
CCEEEEEEEECCCCEEEEEEEEEEEEEECCCCCCCCEEEEEECCCCCCCEEEECCCCCCC
TDSSQVGYFSRVDDATHYQLNVGTSDKHTSVDGYYSHDGSLAQVDLSANYHEGQYTSAGL
CCCCCCCEEEECCCCEEEEEECCCCCCCCCCCCEECCCCCEEEEEECCCCCCCCEEECCE
SLQGGATLTAHGGALHRTQNMGGTRLLIDADGVADVPVEGNGAAVYTNMFGKAVVSDVNN
EECCCEEEEECCCEEEEECCCCCEEEEEECCCCEECCCCCCCCEEEECHHHHHHHHHHHH
YYRNQAYIDLNKLPENAEATQSVVQATLTEGAIGYRKFTVISGQKAMAVLRLSDGSHPPF
HHCCEEEEECCCCCCCHHHHHHHHHHHHHCCCCCEEEEEEEECCCEEEEEEECCCCCCCC
GAEVKNDNEQTVGLVDDDGNVYLAGVKPGEHMSVFWSGVAHCDINLPDPLPADLFNGLLL
CCEECCCCCEEEEEEECCCCEEEEECCCCCCEEEEECCEEEEECCCCCCCCHHHHCCCEE
PCQHKGNVAPVTSPAVKPAIQEQTQRVTPTEPPTSISVNQ
EECCCCCCCCCCCCCCCHHHHHHHCCCCCCCCCCEEECCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 9205837; 9278503 [H]