BacMap

Definition	Escherichia coli ED1a chromosome, complete genome.
Accession	NC_011745
Length	5,209,548

Click here to switch to the map view.

The map label for this gene is bcsE [H]

Identifier: 218691820

GI number: 218691820

Start: 4132784

End: 4134355

Strand: Direct

Name: bcsE [H]

Synonym: ECED1_4214

Alternate gene names: 218691820

Gene position: 4132784-4134355 (Clockwise)

Preceding gene: 218691810

Following gene: 218691821

Centisome position: 79.33

GC content: 48.98

Gene sequence:

>1572_bases
ATGAGGGACATTGTGGACCCTGTATTCTCTATCGGTATCTCATCATTATGGGATGAGCTGCGACATATGCCAGCAGGCGG
CGTCTGGTGGTTTAACGTCGATCGCCATGAAGATGCTATCAGTCTGGCGAATCAAACAATTGCATCCCAGGCTGAAACCG
CACACGTCGCGGTCATTAGCATGGACAGCGATCCAGCGAAAATCTTTCAATTAGATGATTCTCAAAGGCCGGGAAAAATA
ACATTATTTTCAATGCTAAATCATGAAAAAGGTCTATACTATTTGGCCCGTGATTTGCAGTGTTCTATTGATCCCCATAA
TTACCTTTTTATTCTTGTTTGCGCAAATAACGCATGGCAAAACATTCCTGCCGAGCGGCTTCGCTCATGGTTGGATAAAA
TGAATAAATGGAGCCGGCTAAACCATTGTTCGCTTTTGGTAATTAATTCCGGAAATAATAACGATAAACAATTTTCATTG
TTACTTGAGGAATACCGTTCACTTTTTGGTCTTGCCAGTTTGCGTTTTCAGGGCGACCAACATTTGCTGGATATTGCTTT
CTGGTGCAACGAAAAAGGGGTCAGCGCCCGTCAGCAGCTTAGCGTTCAGCAACAAAATGGTTGCTGGACATTAGTTCAAC
ACCAGGAGGCGGAAATCCAACCACGCAGCGACGAAAAACGCATTCTGAGTAATGTTGCTGTACTGGAGGGTGCTCCGCCG
CTATCGGAACACTGGCAACTGTTCAACAATAACGAAGTCCTGTTCAATGAAGCCCGTACCGCTCAGGCGGCGACGGTGGT
CTTTTCTTTACAGCAAAATGCACAAATCGAGCCACTGGCCCGCAGCATTCATACTCTGCGTCGCCAGCGCGGTAGTGCGA
TGAAAATCCTCGTACGGGAAAATACCGCCAGCCTGCGCGCCACCGATGAACGTTTATTATTGGCCTGCGGTGCAAATATG
GTTATCCCGTGGAATGCGCCACTCTCCCGCTGTCTGACGATGATCGAAAGCGTGCAAGGGCAGAAGTTTAGTCGCTATGT
GCCGGAAGATATCACTACCTTGCTGTCAATGACCCAGCCGCTCAAACTGCGTGGTTTCCAGAAGTGGGATGTGTTCTGTA
ATGCCGTCAACAACATGATGAATAACCCTCTATTACCTGCCCACGGTAAAGGCGTTCTGGTTGCCCTACGTCCGGTACCG
GGTATCCGCGTTGAGCAAGCCCTGACGCTATGTCGCCCTAACCGTACCGGCGATATCATGACCATTGGCGGTAATCGGCT
GGTGCTGTTTCTCTCATTCTGTCGGATTAACGATCTGGATACCGCGTTGAATCATATTTTCCCATTGCCTACTGGCGACA
TTTTCTCAAACCGAATGGTCTGGTTTGAAGATGATCAAATCAGTGCCGAGCTGGTGCAGATGCGCCTGCTTGCCCCAGAA
CAATGGGGCATGCCGCTGCCTTTAGCGCAAAGTTCTAAACCGGTCATCAATGCCGAGCACGATGGTCGCCACTGGCGACG
AATACCAGAACCAATGCGACTGTTAGATGATGCTGTGGAGCGCTCATCATGA

Upstream 100 bases:

>100_bases
CTAAATTGATTCACATGCTAAATCTGATAAGTTTTAATTTCAATGGTAGGTTTATTTCTTAGCTTTCGCTAGTAAACTGA
TAATCAGACAAAATGTTGAC

Downstream 100 bases:

>100_bases
TGACCATCAGCGATATCATTGAAATTATTGTCGTTTGCGCACTGATATTTTTCCCGCTGGGCTATCTGGCGCGGCACTCT
TTGCGACGCATTCGCGACAC

Product: putative cellulose biosynthesis protease

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 523; Mature: 523

Protein sequence:

>523_residues
MRDIVDPVFSIGISSLWDELRHMPAGGVWWFNVDRHEDAISLANQTIASQAETAHVAVISMDSDPAKIFQLDDSQRPGKI
TLFSMLNHEKGLYYLARDLQCSIDPHNYLFILVCANNAWQNIPAERLRSWLDKMNKWSRLNHCSLLVINSGNNNDKQFSL
LLEEYRSLFGLASLRFQGDQHLLDIAFWCNEKGVSARQQLSVQQQNGCWTLVQHQEAEIQPRSDEKRILSNVAVLEGAPP
LSEHWQLFNNNEVLFNEARTAQAATVVFSLQQNAQIEPLARSIHTLRRQRGSAMKILVRENTASLRATDERLLLACGANM
VIPWNAPLSRCLTMIESVQGQKFSRYVPEDITTLLSMTQPLKLRGFQKWDVFCNAVNNMMNNPLLPAHGKGVLVALRPVP
GIRVEQALTLCRPNRTGDIMTIGGNRLVLFLSFCRINDLDTALNHIFPLPTGDIFSNRMVWFEDDQISAELVQMRLLAPE
QWGMPLPLAQSSKPVINAEHDGRHWRRIPEPMRLLDDAVERSS

Sequences:

>Translated_523_residues
MRDIVDPVFSIGISSLWDELRHMPAGGVWWFNVDRHEDAISLANQTIASQAETAHVAVISMDSDPAKIFQLDDSQRPGKI
TLFSMLNHEKGLYYLARDLQCSIDPHNYLFILVCANNAWQNIPAERLRSWLDKMNKWSRLNHCSLLVINSGNNNDKQFSL
LLEEYRSLFGLASLRFQGDQHLLDIAFWCNEKGVSARQQLSVQQQNGCWTLVQHQEAEIQPRSDEKRILSNVAVLEGAPP
LSEHWQLFNNNEVLFNEARTAQAATVVFSLQQNAQIEPLARSIHTLRRQRGSAMKILVRENTASLRATDERLLLACGANM
VIPWNAPLSRCLTMIESVQGQKFSRYVPEDITTLLSMTQPLKLRGFQKWDVFCNAVNNMMNNPLLPAHGKGVLVALRPVP
GIRVEQALTLCRPNRTGDIMTIGGNRLVLFLSFCRINDLDTALNHIFPLPTGDIFSNRMVWFEDDQISAELVQMRLLAPE
QWGMPLPLAQSSKPVINAEHDGRHWRRIPEPMRLLDDAVERSS
>Mature_523_residues
MRDIVDPVFSIGISSLWDELRHMPAGGVWWFNVDRHEDAISLANQTIASQAETAHVAVISMDSDPAKIFQLDDSQRPGKI
TLFSMLNHEKGLYYLARDLQCSIDPHNYLFILVCANNAWQNIPAERLRSWLDKMNKWSRLNHCSLLVINSGNNNDKQFSL
LLEEYRSLFGLASLRFQGDQHLLDIAFWCNEKGVSARQQLSVQQQNGCWTLVQHQEAEIQPRSDEKRILSNVAVLEGAPP
LSEHWQLFNNNEVLFNEARTAQAATVVFSLQQNAQIEPLARSIHTLRRQRGSAMKILVRENTASLRATDERLLLACGANM
VIPWNAPLSRCLTMIESVQGQKFSRYVPEDITTLLSMTQPLKLRGFQKWDVFCNAVNNMMNNPLLPAHGKGVLVALRPVP
GIRVEQALTLCRPNRTGDIMTIGGNRLVLFLSFCRINDLDTALNHIFPLPTGDIFSNRMVWFEDDQISAELVQMRLLAPE
QWGMPLPLAQSSKPVINAEHDGRHWRRIPEPMRLLDDAVERSS

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

Organism=Escherichia coli, GI1789958, Length=523, Percent_Identity=98.2791586998088, Blast_Score=1058, Evalue=0.0,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR017745 [H]

Pfam domain/function: PF10995 DUF2819 [H]

EC number: NA

Molecular weight: Translated: 59398; Mature: 59398

Theoretical pI: Translated: 6.87; Mature: 6.87

Prosite motif: PS00228 TUBULIN_B_AUTOREG

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.9 %Cys     (Translated Protein)
3.1 %Met     (Translated Protein)
5.0 %Cys+Met (Translated Protein)
1.9 %Cys     (Mature Protein)
3.1 %Met     (Mature Protein)
5.0 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MRDIVDPVFSIGISSLWDELRHMPAGGVWWFNVDRHEDAISLANQTIASQAETAHVAVIS
CCCHHHHHHHHHHHHHHHHHHHCCCCCEEEEECCCCHHHHHHHHHHHHHCCCCEEEEEEE
MDSDPAKIFQLDDSQRPGKITLFSMLNHEKGLYYLARDLQCSIDPHNYLFILVCANNAWQ
ECCCCCEEEEECCCCCCCCEEEEEECCCCCCEEEEEECCEEEECCCCEEEEEEECCCCCC
NIPAERLRSWLDKMNKWSRLNHCSLLVINSGNNNDKQFSLLLEEYRSLFGLASLRFQGDQ
CCCHHHHHHHHHHHHHHHCCCCEEEEEEECCCCCCHHHHHHHHHHHHHHHHHHEEECCCC
HLLDIAFWCNEKGVSARQQLSVQQQNGCWTLVQHQEAEIQPRSDEKRILSNVAVLEGAPP
EEEEEEEEECCCCCCHHHHHCHHHCCCCEEEEECCCCCCCCCCHHHHHHHHHHHCCCCCC
LSEHWQLFNNNEVLFNEARTAQAATVVFSLQQNAQIEPLARSIHTLRRQRGSAMKILVRE
HHHHHHEECCCEEEEECCCCHHEEEEEEEECCCCCCCHHHHHHHHHHHCCCCEEEEEEEC
NTASLRATDERLLLACGANMVIPWNAPLSRCLTMIESVQGQKFSRYVPEDITTLLSMTQP
CCCCEEECCCEEEEEECCCEEEECCCHHHHHHHHHHHHCCCHHHHCCCHHHHHHHHCCCC
LKLRGFQKWDVFCNAVNNMMNNPLLPAHGKGVLVALRPVPGIRVEQALTLCRPNRTGDIM
HHHCCCHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCCCCHHHHHHHHCCCCCCCEE
TIGGNRLVLFLSFCRINDLDTALNHIFPLPTGDIFSNRMVWFEDDQISAELVQMRLLAPE
EECCCEEEEEEEHHHCCCHHHHHHHCCCCCCCCHHCCCEEEEECCCHHHHHHHHHHCCCH
QWGMPLPLAQSSKPVINAEHDGRHWRRIPEPMRLLDDAVERSS
HCCCCCCCCCCCCCEEECCCCCCHHHHCCHHHHHHHHHHHCCC
>Mature Secondary Structure
MRDIVDPVFSIGISSLWDELRHMPAGGVWWFNVDRHEDAISLANQTIASQAETAHVAVIS
CCCHHHHHHHHHHHHHHHHHHHCCCCCEEEEECCCCHHHHHHHHHHHHHCCCCEEEEEEE
MDSDPAKIFQLDDSQRPGKITLFSMLNHEKGLYYLARDLQCSIDPHNYLFILVCANNAWQ
ECCCCCEEEEECCCCCCCCEEEEEECCCCCCEEEEEECCEEEECCCCEEEEEEECCCCCC
NIPAERLRSWLDKMNKWSRLNHCSLLVINSGNNNDKQFSLLLEEYRSLFGLASLRFQGDQ
CCCHHHHHHHHHHHHHHHCCCCEEEEEEECCCCCCHHHHHHHHHHHHHHHHHHEEECCCC
HLLDIAFWCNEKGVSARQQLSVQQQNGCWTLVQHQEAEIQPRSDEKRILSNVAVLEGAPP
EEEEEEEEECCCCCCHHHHHCHHHCCCCEEEEECCCCCCCCCCHHHHHHHHHHHCCCCCC
LSEHWQLFNNNEVLFNEARTAQAATVVFSLQQNAQIEPLARSIHTLRRQRGSAMKILVRE
HHHHHHEECCCEEEEECCCCHHEEEEEEEECCCCCCCHHHHHHHHHHHCCCCEEEEEEEC
NTASLRATDERLLLACGANMVIPWNAPLSRCLTMIESVQGQKFSRYVPEDITTLLSMTQP
CCCCEEECCCEEEEEECCCEEEECCCHHHHHHHHHHHHCCCHHHHCCCHHHHHHHHCCCC
LKLRGFQKWDVFCNAVNNMMNNPLLPAHGKGVLVALRPVPGIRVEQALTLCRPNRTGDIM
HHHCCCHHHHHHHHHHHHHHCCCCCCCCCCEEEEEECCCCCCCHHHHHHHHCCCCCCCEE
TIGGNRLVLFLSFCRINDLDTALNHIFPLPTGDIFSNRMVWFEDDQISAELVQMRLLAPE
EECCCEEEEEEEHHHCCCHHHHHHHCCCCCCCCHHCCCEEEEECCCHHHHHHHHHHCCCH
QWGMPLPLAQSSKPVINAEHDGRHWRRIPEPMRLLDDAVERSS
HCCCCCCCCCCCCCEEECCCCCCHHHHCCHHHHHHHHHHHCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 8041620; 9278503 [H]