BacMap

Definition	Escherichia coli ED1a chromosome, complete genome.
Accession	NC_011745
Length	5,209,548

Click here to switch to the map view.

The map label for this gene is bcsA [H]

Identifier: 218691817

GI number: 218691817

Start: 4128944

End: 4131562

Strand: Reverse

Name: bcsA [H]

Synonym: ECED1_4211

Alternate gene names: 218691817

Gene position: 4131562-4128944 (Counterclockwise)

Preceding gene: 218691818

Following gene: 218691816

Centisome position: 79.31

GC content: 55.02

Gene sequence:

>2619_bases
ATGAGTATCCTGACCCGGTGGTTGCTTATCCCGCCGGTCAACGCACGGCTTATTGGGCGTTATCGCGATTATCGTCGTCA
CGGTGCGTCGGCTTTCAGCGCGACGCTCGGCTGTTTCTGGATGATCCTGGCCTGGATTTTTATTCCGCTGGAGCACCCGC
GCTGGCAGCGTATTCGCGCAGAACATAAAAACCTGTATCCGCATATCAACGCCTCGCGTCCGCGTCCGCTGGACCCGGTC
CGTTATCTTATTCAAACATGCTGGTTACTGATCGGTGCATCGCGCAAAGAAACGCCGAAACCGCGCAGGCGGGCATTTTC
AGGTCTACAAAATATTCGTGGACGTTACCATCAATGGATGAACGAGCTGCCTGAGCGCGTTAGCCATAAAACACAGCATC
TTGATGAGAAAAAAGAGCTCGGTCATTTGAGTGCCGGGGCGCGGCGGTTGATCCTTGGTATCATCGTCACCTTCTCGCTG
ATTCTGGCGTTAATCTGCGTTACTCAGCCGTTTAACCCGCTAGCGCAGTTTATCTTCCTGATGCTGCTGTGGGGGGTAGC
GCTGATCGTACGGCGGATGCCGGGGCGCTTCTCGGCGCTGATGCTGATTGTGCTGTCGCTGACCGTTTCTTGCCGTTATA
TCTGGTGGCGTTACACCTCGACGTTAAACTGGGACGATCCGGTCAGCCTGGTGTGCGGGCTTATTCTGCTGTTCGCCGAA
ACGTACGCGTGGATTGTGCTGGTGCTCGGCTATTTCCAGGTCGTATGGCCTCTGAATCGTCAGCCGGTGCCATTGCCGAA
AGATATGTCGCTGTGGCCGTCGGTGGATATCTTTGTCCCGACTTACAACGAAGATCTCAATGTGGTGAAAAATACCATTT
ACGCTTCGCTGGGTATCGACTGGCCGAAAGACAAGCTGAACATCTGGATCCTCGATGACGGCGGCAGGGAAGAGTTTCGC
CAGTTTGCGCAAAACGTGGGGGTGAAATATATCGCCCGTACCACTCATGAACATGCGAAAGCGGGCAACATCAACAATGC
GCTGAAATATGCCAAAGGCGAGTTCGTGTCGATATTCGACTGCGACCACGTACCAACGCGATCGTTCCTGCAAATGACCA
TGGGCTGGTTCCTGAAAGAGAAACAGCTGGCGATGATGCAGACGCCGCACCACTTCTTCTCGCCGGACCCGTTTGAACGC
AACCTGGGGCGTTTTCGTAAAACGCCGAACGAAGGCACGCTGTTCTATGGTCTGGTGCAGGACGGCAATGATATGTGGGA
TGCCACTTTCTTCTGCGGCTCATGTGCGGTGATTCGCCGTAAGCCGCTGGATGAGATTGGCGGTATTGCTGTCGAAACGG
TAACCGAAGATGCGCACACTTCTCTGCGTCTGCACCGTCGTGGCTACACCTCAGCGTATATGCGTATTCCGCAGGCAGCG
GGGCTGGCGACCGAAAGTCTCTCGGCGCATATCGGTCAGCGTATTCGCTGGGCGCGCGGGATGGTGCAAATCTTCCGTCT
CGATAACCCGCTCACCGGTAAAGGGCTGAAGTTTGCTCAGCGGCTGTGCTATGTCAACGCCATGTTCCACTTCTTGTCGG
GCATTCCACGACTGATCTTCCTGACTGCGCCGCTGGCGTTCCTGCTGTTTCATGCCTACATCATCTACGCGCCAGCGTTG
ATGATCGCCCTGTTCGTGCTACCGCATATGATCCATGCCAGCCTGACTAACTCGAAGATCCAGGGCAAATATCGCCACTC
TTTCTGGAGTGAAATCTACGAAACGGTGCTGGCGTGGTATATCGCACCACCGACGCTGGTGGCGCTGATTAACCCGCACA
AAGGCAAATTTAACGTCACCGCCAAAGGTGGACTGGTGGAAGAAGAGTACGTCGACTGGGTGATCTCGCGGCCCTACATC
TTCCTTGTTCTGCTCAACCTGGTGGGCGTAGCGGTTGGGATCTGGCGCTACTTCTATGGTCCGCCAACTGAGATGCTCAC
CGTGGTCGTCAGTATGGTGTGGGTATTCTACAACCTGATTATTCTCGGCGGCGCAGTCGCGGTATCGGTAGAAAGCAAAC
AGGTACGCCGATCGCACCGCGTGGAGATGACGATGCCCGCAGCAATTGCCCGCGAAGATGGTCATCTCTTCTCGTGTACC
GTTCAGGATTTCTCCGACGGTGGTTTGGGGATCAAGATCAACGGTCAGGCGCAGATTCTGGAAGGGCAGAAAGTGAATCT
GTTGCTTAAACGCGGTCAGCAGGAATACGTCTTCCCGGCTCAGGTGGCGCGCGTGATGGGTAATGAAGTTGGGCTGAAAT
TAATGCCGCTCACTACCCAGCAACATATCGATTTTGTGCAGTGTACGTTTGCCCGTGCGGATACATGGGCGCTCTGGCAG
GACAGCTACCCGGAAGATAAGCCGCTGGAAAGTCTGCTGGATATTCTGAAGCTCGGCTTCCGTGGCTACCGCCATCTGGC
GGAATTTGCGCCTTCTTCGGTGAAGGGCATATTCCGTGTGCTGACTTCTCTGGTTTCCTGGGTTGTATCGTTTATTCCGC
GCCGCCCGGAGCGGAGCGAAACGGCACAACCATCGGATCAGGCTTTGGCTCAACAATGA

Upstream 100 bases:

>100_bases
AATATCGCAGTGATGCGCTGGCGGCTGAAGAGATATTGACGCTGGCGAACTGGTGCCTGTTGAATTATTCCGGGCTGAAA
ACGCCAGTCGGGAGTGCATC

Downstream 100 bases:

>100_bases
TGATAACGCGATGAAAAGAAAAATATTCTGGATTTGTGCAGTGGCTCTGGGGATGAGTGCGTTCCCCTCTTTCATGACGC
AGGCGACGCCAGCAACGCAA

Product: cellulose synthase catalytic subunit

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 872; Mature: 871

Protein sequence:

>872_residues
MSILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWMILAWIFIPLEHPRWQRIRAEHKNLYPHINASRPRPLDPV
RYLIQTCWLLIGASRKETPKPRRRAFSGLQNIRGRYHQWMNELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSL
ILALICVTQPFNPLAQFIFLMLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGIDWPKDKLNIWILDDGGREEFR
QFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFDCDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFER
NLGRFRKTPNEGTLFYGLVQDGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIFLTAPLAFLLFHAYIIYAPAL
MIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWYIAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYI
FLVLLNLVGVAVGIWRYFYGPPTEMLTVVVSMVWVFYNLIILGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPAQVARVMGNEVGLKLMPLTTQQHIDFVQCTFARADTWALWQ
DSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRVLTSLVSWVVSFIPRRPERSETAQPSDQALAQQ

Sequences:

>Translated_872_residues
MSILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWMILAWIFIPLEHPRWQRIRAEHKNLYPHINASRPRPLDPV
RYLIQTCWLLIGASRKETPKPRRRAFSGLQNIRGRYHQWMNELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSL
ILALICVTQPFNPLAQFIFLMLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGIDWPKDKLNIWILDDGGREEFR
QFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFDCDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFER
NLGRFRKTPNEGTLFYGLVQDGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIFLTAPLAFLLFHAYIIYAPAL
MIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWYIAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYI
FLVLLNLVGVAVGIWRYFYGPPTEMLTVVVSMVWVFYNLIILGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPAQVARVMGNEVGLKLMPLTTQQHIDFVQCTFARADTWALWQ
DSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRVLTSLVSWVVSFIPRRPERSETAQPSDQALAQQ
>Mature_871_residues
SILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWMILAWIFIPLEHPRWQRIRAEHKNLYPHINASRPRPLDPVR
YLIQTCWLLIGASRKETPKPRRRAFSGLQNIRGRYHQWMNELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSLI
LALICVTQPFNPLAQFIFLMLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAET
YAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGIDWPKDKLNIWILDDGGREEFRQ
FAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFDCDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFERN
LGRFRKTPNEGTLFYGLVQDGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAAG
LATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIFLTAPLAFLLFHAYIIYAPALM
IALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWYIAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYIF
LVLLNLVGVAVGIWRYFYGPPTEMLTVVVSMVWVFYNLIILGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCTV
QDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPAQVARVMGNEVGLKLMPLTTQQHIDFVQCTFARADTWALWQD
SYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRVLTSLVSWVVSFIPRRPERSETAQPSDQALAQQ

Specific function: Catalytic subunit of cellulose synthase. It polymerizes uridine 5'-diphosphate glucose to cellulose, which is produced as an extracellular component for mechanical and chemical protection at the onset of the stationary phase, when the cells exhibit multic

COG id: COG1215

COG function: function code M; Glycosyltransferases, probably involved in cell wall biogenesis

Gene ontology:

Cell location: Cell inner membrane; Multi-pass membrane protein (Potential) [H]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 PilZ domain [H]

Homologues:

Organism=Escherichia coli, GI87082284, Length=872, Percent_Identity=99.6559633027523, Blast_Score=1799, Evalue=0.0,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003919
- InterPro:   IPR001173
- InterPro:   IPR009875 [H]

Pfam domain/function: PF00535 Glycos_transf_2; PF07238 PilZ [H]

EC number: =2.4.1.12 [H]

Molecular weight: Translated: 99804; Mature: 99673

Theoretical pI: Translated: 9.90; Mature: 9.90

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.3 %Cys     (Translated Protein)
2.6 %Met     (Translated Protein)
3.9 %Cys+Met (Translated Protein)
1.3 %Cys     (Mature Protein)
2.5 %Met     (Mature Protein)
3.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWMILAWIFIPLEHPRWQRIRA
CCHHHHHHHCCCCCHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHH
EHKNLYPHINASRPRPLDPVRYLIQTCWLLIGASRKETPKPRRRAFSGLQNIRGRYHQWM
HHHCCCCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHH
NELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSLILALICVTQPFNPLAQFIFL
HHHHHHHHHHHHHCHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHH
MLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
HHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHEEEEEEEECCCCCCCHHHHHHHHHHHHHH
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGID
HHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCEEEECCCCCHHHHHHHHHHHHCCCC
WPKDKLNIWILDDGGREEFRQFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFD
CCCCCEEEEEEECCCHHHHHHHHHHCCCHHHHHHHHHHHHCCCCHHHHHHCCCCEEEEEE
CDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFERNLGRFRKTPNEGTLFYGLVQ
CCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHCCCCCCCEEEEEEE
DGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
CCCCHHHHHHHHCCHHHHHCCCHHHHCCEEEEEECHHHHHHHHHHHCCCHHHHHHCCHHH
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIF
CCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHH
LTAPLAFLLFHAYIIYAPALMIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWY
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHCCHHHHHHHHHHHHHHHHHH
IAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYIFLVLLNLVGVAVGIWRYFYG
CCCCEEEEEECCCCCEEEEEECCCCCHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCC
PPTEMLTVVVSMVWVFYNLIILGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
CHHHHHHHHHHHHHHHHHHHHHCCHHEEEECHHHHHHHHCCEEECCHHHCCCCCCEEEEE
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPAQVARVMGNEVGLKLMPLTTQ
ECCCCCCCEEEEECCCEEEECCCHHHHHHHCCCCCCCCHHHHHHHHCCCCCEEEEECCHH
QHIDFVQCTFARADTWALWQDSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRV
HHCCHHHHHHHCCCCEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHH
LTSLVSWVVSFIPRRPERSETAQPSDQALAQQ
HHHHHHHHHHHCCCCCCCCCCCCCCHHHHCCC
>Mature Secondary Structure 
SILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWMILAWIFIPLEHPRWQRIRA
CHHHHHHHCCCCCHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHH
EHKNLYPHINASRPRPLDPVRYLIQTCWLLIGASRKETPKPRRRAFSGLQNIRGRYHQWM
HHHCCCCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHH
NELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSLILALICVTQPFNPLAQFIFL
HHHHHHHHHHHHHCHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHH
MLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
HHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHEEEEEEEECCCCCCCHHHHHHHHHHHHHH
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGID
HHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCEEEECCCCCHHHHHHHHHHHHCCCC
WPKDKLNIWILDDGGREEFRQFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFD
CCCCCEEEEEEECCCHHHHHHHHHHCCCHHHHHHHHHHHHCCCCHHHHHHCCCCEEEEEE
CDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFERNLGRFRKTPNEGTLFYGLVQ
CCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHCCCCCCCEEEEEEE
DGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
CCCCHHHHHHHHCCHHHHHCCCHHHHCCEEEEEECHHHHHHHHHHHCCCHHHHHHCCHHH
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIF
CCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHH
LTAPLAFLLFHAYIIYAPALMIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWY
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHCCHHHHHHHHHHHHHHHHHH
IAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYIFLVLLNLVGVAVGIWRYFYG
CCCCEEEEEECCCCCEEEEEECCCCCHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCC
PPTEMLTVVVSMVWVFYNLIILGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
CHHHHHHHHHHHHHHHHHHHHHCCHHEEEECHHHHHHHHCCEEECCHHHCCCCCCEEEEE
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPAQVARVMGNEVGLKLMPLTTQ
ECCCCCCCEEEEECCCEEEECCCHHHHHHHCCCCCCCCHHHHHHHHCCCCCEEEEECCHH
QHIDFVQCTFARADTWALWQDSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRV
HHCCHHHHHHHCCCCEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHH
LTSLVSWVVSFIPRRPERSETAQPSDQALAQQ
HHHHHHHHHHHCCCCCCCCCCCCCCHHHHCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 11206551; 11258796 [H]