BacMap

Definition	Escherichia coli O157:H7 str. EC4115, complete genome.
Accession	NC_011353
Length	5,572,075

Click here to switch to the map view.

The map label for this gene is ymfN [C]

Identifier: 209400939

GI number: 209400939

Start: 1503596

End: 1505257

Strand: Direct

Name: ymfN [C]

Synonym: ECH74115_1538

Alternate gene names: 209400939

Gene position: 1503596-1505257 (Clockwise)

Preceding gene: 209400637

Following gene: 209400333

Centisome position: 26.98

GC content: 57.82

Gene sequence:

>1662_bases
ATGATACCTGTGTGGAGCACGGCCTGCCCGGACTGGGCAGAGCGCCTGAAAAAGGGGCTGTCGATTATTCCGGCTCCGAT
TTATCCGGAGCAGGCCGCACATGCCCTGGCGATTTTTAAACAACTGCGGATTGTGGATGCACCGGGCAGCCCGACGTTCG
GGGAGTCCTGCGCACAGTGGGTGTTTGACCTGGTGGCGGCCCTGTTTGGCTCCTACGATGCGCAGACCGGTGTACGCCAT
ATCAAGGAAGTTTTTATCCTTATCCCCAAGAAAAACAGCAAGTCCACGCTGGCTGCCGGGATCATGATGACGGCGCTGTT
ACTGAACTGGCGGCAGGCGGCGGGCTACACCATTCTGGCCCCGACCGTGGAGGTGGCGGCTAACGCCTTCAACCCTGCCA
GGGATATGGTACGACGGGACGATGATCTGGATGACCTCTGTCAGGTGCAGACACATATCCGGACCATCACCCACAGGGTG
ACGGACACCACCCTGAAGGTGGTGGCTGCCGATCCGAATACGGTATCCGGTATCAAGTCCGTGGGGACGCTGATTGATGA
ACTGTGGTTATTTGGCAAGCAGTACAAAGCGGAGGACATGTTACGTGAAGCCATAGGCGGCCTTGCCTCCCGCCCGGAAG
GGTTTGTGGTGTATACGACCACCCAGTCGAATGAGCCGCCAGCCGGGGTGTTCAGACAGAAACTGCAGTACGCCCGGGAT
GTCCGTGACGGCAAAATTCATGATCCGCACTTTCTGCCGGTGATTTTTGAGCATCCTCCTGAAATGGTGGAAAGCGGGGC
TCACCTGCTGATGGAAAACCTCGCCATGGTTAACCCGAATCTCGGTTATTCGGTGGATGAGGCTTTTCTGTACCGGGAGT
ACCGTAAAGCCCGGGAGGCTGGTGAGGAAGCATTTCGTGGCTTCATGTCAAAACATGCCAATGTGGAAATTGGTCTTGCC
CTGCGTTCTGACCGCTGGGCGGGTGCGGATTTCTGGGAGCAGCAGGGCAGGCGCGTCAGCCTGGACGATATCCTGCAGCG
CGCTGATGTGGTGACGGTGGGGATTGACGGCGGGGGCCTGGATGATCTGCTGGGAATGTACGTGATTGGCCGTGACAGGG
AAACCCGCGAATGGCTGGGCTGGGGCCATGCCTGGGCGCATGAAACCGCGGTGGTCCGACGGAAGAGCGAGGCGTCCCGG
TTTCAGGATCTTGTTGCCTGTGGAGATATGACCATTGTCCGGCGTGTCGGGGATGACACGGCGGAAGTGGCGGAATATGT
GCGTCGCATTCATGAGGCTGAGTTACTGGACCATATCGGTATTGACCCGTCAGGGGTGGGGCAGATTCTGGATTCACTGG
CGGAAGCCGGGATCCCCGACGGAATTGTGGTGGGGATAAGCCAGGGCTGGAAACTGGGCGGGGCCATTAAAACCACCGAG
CGCAAACTGGCTGAAGGGGTGCTGGTGCATGGTGACCAGCCCCTGATGGCCTGGTGTGTCGGCAATGCCCGGGTGGAGCC
TAAAGGTAACGCCATTCTTATCACCAAACAGGCCAGTGGACGGGGAAAAATTGACCCGCTGATGGCGCTGTTCAATGCGG
TCTCCCTGATGTCCCTTAACCCGGAACCGAAAAAGAAAGAATATGCGGTTTTTTTCATATAA

Upstream 100 bases:

>100_bases
AAAAATCGGCAAAAGGTGACGCGGCGAAAAAAGCGGCTAACCGTTTTGCGGTGCCACCACCACCCCGCCTGGTGGTGAAT
AATGATAATGAGGGCAACGG

Downstream 100 bases:

>100_bases
CCCTGTTCACACTGTAACCATCATGAACCGCTGCGGCGGTTTTTTTATTTTCAGGAGGCTGATGTGACTCTTAAACGGGC
CTGTTCCCTGCTGACGGTGA

Product: putative phage terminase, large subunit

Products: NA

Alternate protein names: Phage Terminase; Phage Terminase Large Subunit; Phage Terminase-Like Protein Large Subunit; Phage Terminase Family Protein; Terminase Large Subunit; Phage-Terminase Large Subunit

Number of amino acids: Translated: 553; Mature: 553

Protein sequence:

>553_residues
MIPVWSTACPDWAERLKKGLSIIPAPIYPEQAAHALAIFKQLRIVDAPGSPTFGESCAQWVFDLVAALFGSYDAQTGVRH
IKEVFILIPKKNSKSTLAAGIMMTALLLNWRQAAGYTILAPTVEVAANAFNPARDMVRRDDDLDDLCQVQTHIRTITHRV
TDTTLKVVAADPNTVSGIKSVGTLIDELWLFGKQYKAEDMLREAIGGLASRPEGFVVYTTTQSNEPPAGVFRQKLQYARD
VRDGKIHDPHFLPVIFEHPPEMVESGAHLLMENLAMVNPNLGYSVDEAFLYREYRKAREAGEEAFRGFMSKHANVEIGLA
LRSDRWAGADFWEQQGRRVSLDDILQRADVVTVGIDGGGLDDLLGMYVIGRDRETREWLGWGHAWAHETAVVRRKSEASR
FQDLVACGDMTIVRRVGDDTAEVAEYVRRIHEAELLDHIGIDPSGVGQILDSLAEAGIPDGIVVGISQGWKLGGAIKTTE
RKLAEGVLVHGDQPLMAWCVGNARVEPKGNAILITKQASGRGKIDPLMALFNAVSLMSLNPEPKKKEYAVFFI

Sequences:

>Translated_553_residues
MIPVWSTACPDWAERLKKGLSIIPAPIYPEQAAHALAIFKQLRIVDAPGSPTFGESCAQWVFDLVAALFGSYDAQTGVRH
IKEVFILIPKKNSKSTLAAGIMMTALLLNWRQAAGYTILAPTVEVAANAFNPARDMVRRDDDLDDLCQVQTHIRTITHRV
TDTTLKVVAADPNTVSGIKSVGTLIDELWLFGKQYKAEDMLREAIGGLASRPEGFVVYTTTQSNEPPAGVFRQKLQYARD
VRDGKIHDPHFLPVIFEHPPEMVESGAHLLMENLAMVNPNLGYSVDEAFLYREYRKAREAGEEAFRGFMSKHANVEIGLA
LRSDRWAGADFWEQQGRRVSLDDILQRADVVTVGIDGGGLDDLLGMYVIGRDRETREWLGWGHAWAHETAVVRRKSEASR
FQDLVACGDMTIVRRVGDDTAEVAEYVRRIHEAELLDHIGIDPSGVGQILDSLAEAGIPDGIVVGISQGWKLGGAIKTTE
RKLAEGVLVHGDQPLMAWCVGNARVEPKGNAILITKQASGRGKIDPLMALFNAVSLMSLNPEPKKKEYAVFFI
>Mature_553_residues
MIPVWSTACPDWAERLKKGLSIIPAPIYPEQAAHALAIFKQLRIVDAPGSPTFGESCAQWVFDLVAALFGSYDAQTGVRH
IKEVFILIPKKNSKSTLAAGIMMTALLLNWRQAAGYTILAPTVEVAANAFNPARDMVRRDDDLDDLCQVQTHIRTITHRV
TDTTLKVVAADPNTVSGIKSVGTLIDELWLFGKQYKAEDMLREAIGGLASRPEGFVVYTTTQSNEPPAGVFRQKLQYARD
VRDGKIHDPHFLPVIFEHPPEMVESGAHLLMENLAMVNPNLGYSVDEAFLYREYRKAREAGEEAFRGFMSKHANVEIGLA
LRSDRWAGADFWEQQGRRVSLDDILQRADVVTVGIDGGGLDDLLGMYVIGRDRETREWLGWGHAWAHETAVVRRKSEASR
FQDLVACGDMTIVRRVGDDTAEVAEYVRRIHEAELLDHIGIDPSGVGQILDSLAEAGIPDGIVVGISQGWKLGGAIKTTE
RKLAEGVLVHGDQPLMAWCVGNARVEPKGNAILITKQASGRGKIDPLMALFNAVSLMSLNPEPKKKEYAVFFI

Specific function: Unknown

COG id: COG4626

COG function: function code R; Phage terminase-like protein, large subunit

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: 10-20 Molecules/Cell [C]

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 61002; Mature: 61002

Theoretical pI: Translated: 6.05; Mature: 6.05

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.9 %Cys     (Translated Protein)
2.5 %Met     (Translated Protein)
3.4 %Cys+Met (Translated Protein)
0.9 %Cys     (Mature Protein)
2.5 %Met     (Mature Protein)
3.4 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MIPVWSTACPDWAERLKKGLSIIPAPIYPEQAAHALAIFKQLRIVDAPGSPTFGESCAQW
CCCCCCCCCHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHEEECCCCCCHHHHHHHH
VFDLVAALFGSYDAQTGVRHIKEVFILIPKKNSKSTLAAGIMMTALLLNWRQAAGYTILA
HHHHHHHHHCCCCHHHHHHHHHHHEEEEECCCCCHHHHHHHHHHHHHHHHHHHCCCEEEE
PTVEVAANAFNPARDMVRRDDDLDDLCQVQTHIRTITHRVTDTTLKVVAADPNTVSGIKS
CHHHHHHHCCCHHHHHHHCCCCHHHHHHHHHHHHHHHHHHCCCEEEEEECCCCHHHHHHH
VGTLIDELWLFGKQYKAEDMLREAIGGLASRPEGFVVYTTTQSNEPPAGVFRQKLQYARD
HHHHHHHHHHHCCCCCHHHHHHHHHHHHHCCCCCEEEEEECCCCCCCHHHHHHHHHHHHH
VRDGKIHDPHFLPVIFEHPPEMVESGAHLLMENLAMVNPNLGYSVDEAFLYREYRKAREA
CCCCCCCCCCEEEEEECCCHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHH
GEEAFRGFMSKHANVEIGLALRSDRWAGADFWEQQGRRVSLDDILQRADVVTVGIDGGGL
HHHHHHHHHHCCCCEEEEEEEECCCCCCCCHHHHCCCEECHHHHHHHCCEEEEEECCCCH
DDLLGMYVIGRDRETREWLGWGHAWAHETAVVRRKSEASRFQDLVACGDMTIVRRVGDDT
HHHHHHHHCCCCCCHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHCCCCH
AEVAEYVRRIHEAELLDHIGIDPSGVGQILDSLAEAGIPDGIVVGISQGWKLGGAIKTTE
HHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHCCCCCCEEEECCCCCCCCCCCHHHH
RKLAEGVLVHGDQPLMAWCVGNARVEPKGNAILITKQASGRGKIDPLMALFNAVSLMSLN
HHHHCCEEEECCCCEEEEEECCCEECCCCCEEEEEECCCCCCCCHHHHHHHHHHHHHCCC
PEPKKKEYAVFFI
CCCCCCCEEEEEC
>Mature Secondary Structure
MIPVWSTACPDWAERLKKGLSIIPAPIYPEQAAHALAIFKQLRIVDAPGSPTFGESCAQW
CCCCCCCCCHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHEEECCCCCCHHHHHHHH
VFDLVAALFGSYDAQTGVRHIKEVFILIPKKNSKSTLAAGIMMTALLLNWRQAAGYTILA
HHHHHHHHHCCCCHHHHHHHHHHHEEEEECCCCCHHHHHHHHHHHHHHHHHHHCCCEEEE
PTVEVAANAFNPARDMVRRDDDLDDLCQVQTHIRTITHRVTDTTLKVVAADPNTVSGIKS
CHHHHHHHCCCHHHHHHHCCCCHHHHHHHHHHHHHHHHHHCCCEEEEEECCCCHHHHHHH
VGTLIDELWLFGKQYKAEDMLREAIGGLASRPEGFVVYTTTQSNEPPAGVFRQKLQYARD
HHHHHHHHHHHCCCCCHHHHHHHHHHHHHCCCCCEEEEEECCCCCCCHHHHHHHHHHHHH
VRDGKIHDPHFLPVIFEHPPEMVESGAHLLMENLAMVNPNLGYSVDEAFLYREYRKAREA
CCCCCCCCCCEEEEEECCCHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHH
GEEAFRGFMSKHANVEIGLALRSDRWAGADFWEQQGRRVSLDDILQRADVVTVGIDGGGL
HHHHHHHHHHCCCCEEEEEEEECCCCCCCCHHHHCCCEECHHHHHHHCCEEEEEECCCCH
DDLLGMYVIGRDRETREWLGWGHAWAHETAVVRRKSEASRFQDLVACGDMTIVRRVGDDT
HHHHHHHHCCCCCCHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHCCCCH
AEVAEYVRRIHEAELLDHIGIDPSGVGQILDSLAEAGIPDGIVVGISQGWKLGGAIKTTE
HHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHCCCCCCEEEECCCCCCCCCCCHHHH
RKLAEGVLVHGDQPLMAWCVGNARVEPKGNAILITKQASGRGKIDPLMALFNAVSLMSLN
HHHHCCEEEECCCCEEEEEECCCEECCCCCEEEEEECCCCCCCCHHHHHHHHHHHHHCCC
PEPKKKEYAVFFI
CCCCCCCEEEEEC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA