BacMap

Definition	Escherichia coli SMS-3-5 chromosome, complete genome.
Accession	NC_010498
Length	5,068,389

Click here to switch to the map view.

The map label for this gene is bcsA [H]

Identifier: 170679974

GI number: 170679974

Start: 3917156

End: 3919774

Strand: Reverse

Name: bcsA [H]

Synonym: EcSMS35_3842

Alternate gene names: 170679974

Gene position: 3919774-3917156 (Counterclockwise)

Preceding gene: 170683872

Following gene: 170681414

Centisome position: 77.34

GC content: 55.29

Gene sequence:

>2619_bases
ATGAGTATCCTGACCCGGTGGTTGCTTATCCCGCCGGTCAACGCGCGGCTTATCGGGCGTTATCGCGATTATCGTCGTCA
CGGTGCGTCGGCTTTCAGCGCGACGCTCGGCTGTTTTTGGTTGATCCTGGCCTGGATTTTTATTCCGCTGGAGCACCCGC
GCTGGCAGCGTATTCGCGCAGAACATAAAAACCTGTATCCGCATATCAACGCCTCGCGTCCGCGTCCGCTGGACCCGGTC
CGTTATCTCATTCAAACATGCTGGTTACTGATCGGTACATCGCGCAAAGAAACGCCGAAACCGCGCAGGCGGACATTTTC
AGGTCTGCAGAATATTCGTGGACGTTACCATCAATGGATGAACGAGCTGCCTGAGCGCGTTAGCCATAAAACACAGCATC
TCGATGAGAAAAAAGAACTCGGCCATTTGAGCGCCGGGGCGCGGCGGTTGATCCTCGGTATCATCGTCACCTTCTCGCTG
ATTCTGGCGTTAATCTGCGTTACCCAGCCGTTTAACCCGCTGGCGCAGTTTATCTTCCTGATGCTGCTGTGGGGTGTAGC
GCTGATCGTACGGCGGATGCCGGGGCGCTTCTCGGCGCTAATGTTGATTGTGCTGTCGCTGACCGTTTCTTGCCGTTATA
TCTGGTGGCGCTACACCTCTACGCTGAACTGGGACGATCCGGTCAGCCTGGTGTGCGGGCTTATTCTGCTGTTCGCCGAA
ACGTACGCGTGGATTGTGCTGGTGCTCGGTTACTTCCAGGTGGTATGGCCGCTGAATCGTCAGCCGGTGCCATTGCCGAA
AGATATGTCGCTGTGGCCGTCGGTGGATATCTTTGTCCCGACTTACAACGAAGATCTCAACGTGGTGAAAAATACGATTT
ACGCCTCGCTGGGTATCGACTGGCCGAAAGACAAGCTGAACATCTGGATCCTCGATGACGGCGGCAGGGAAGAGTTTCGC
CAGTTTGCGCAAAACGTGGGGGTGAAATATATCGCCCGTACCACTCATGAACATGCGAAAGCGGGCAACATCAACAATGC
GCTGAAATATGCCAAAGGCGAGTTCGTGTCGATTTTCGACTGCGACCACGTACCAACGCGATCGTTCCTGCAAATGACCA
TGGGCTGGTTCCTGAAAGAAAAACAACTGGCGATGATGCAGACGCCGCACCACTTCTTCTCACCGGACCCGTTTGAACGC
AACCTGGGACGTTTCCGTAAAACACCGAACGAAGGCACGCTGTTCTATGGTCTGGTGCAGGACGGCAACGATATGTGGGA
CGCCACCTTCTTCTGCGGTTCATGTGCGGTGATTCGCCGTAAACCGCTGGATGAAATTGGCGGCATTGCTGTCGAAACGG
TAACTGAAGATGCGCATACTTCTCTGCGTTTGCACCGTCGTGGCTATACCTCCGCGTATATGCGTATTCCGCAGGCGGCG
GGGCTGGCGACCGAAAGTCTGTCGGCGCATATCGGTCAGCGTATTCGCTGGGCGCGCGGGATGGTACAAATCTTCCGTCT
CGATAACCCGCTCACCGGTAAAGGGCTGAAGTTTGCTCAGCGGCTATGTTACGTCAACGCCATGTTCCACTTCTTGTCGG
GCATTCCACGGCTGATCTTCCTGACTGCGCCGCTGGCGTTCCTGCTGCTTCATGCCTACATCATCTATGCGCCAGCGTTG
ATGATTGCCCTGTTCGTGCTGCCGCATATGATCCATGCCAGCCTGACCAACTCCAAGATCCAGGGCAAATATCGCCACTC
TTTCTGGAGTGAAATCTACGAAACGGTGCTGGCGTGGTATATCGCACCACCGACGCTGGTGGCGCTGATTAACCCGCACA
AAGGCAAATTTAACGTCACCGCCAAAGGTGGACTGGTGGAAGAAGAGTACGTCGACTGGGTGATCTCGCGGCCCTACATC
TTCCTTGTTCTGCTCAACCTGGTGGGCGTTGCGGTAGGCATCTGGCGCTACTTCTATGGCCCGCCAACCGAGATGCTCAC
CGTGGTCGTCAGTATGGTGTGGGTGTTCTACAACCTGATTGTTCTTGGCGGCGCAGTTGCGGTATCGGTAGAAAGCAAAC
AGGTACGCCGATCGCACCGCGTGGAGATGACGATGCCCGCGGCAATTGCCCGCGAAGATGGTCACCTCTTTTCGTGTACC
GTTCAGGATTTCTCCGACGGTGGTTTGGGGATCAAGATCAACGGTCAGGCGCAGATTCTGGAAGGGCAGAAAGTGAATCT
GTTGCTTAAACGTGGTCAGCAGGAATACGTCTTCCCGACCCAGGTGGCGCGCGTGATGGGTAATGAAGTTGGGCTGAAAT
TAATGCCGCTCACCACCCAGCAACATATCGATTTTGTGCAGTGTACGTTTGCCCGTGCGGATACATGGGCGCTCTGGCAG
GACAGCTATCCGGAAGATAAGCCGCTGGAAAGTCTGCTGGATATTCTGAAGCTCGGCTTCCGTGGCTACCGCCATCTGGC
GGAGTTTGCGCCTTCTTCGGTGAAGGGCATATTCCGTGTGCTGACTTCTCTGGTTTCCTGGGTTGTATCGTTTATTCCGC
GCCGCCCGGAGCGGAGCGAAACGGCACAACCATCGGATCAGGCTTTGGCTCAACAATGA

Upstream 100 bases:

>100_bases
AATACCGCAGTGATGCGCTGGCGGCTGAAGAGATACTGACGCTGGCTAACTGGTGCCTGTTGAACTATTCCGGGCTGAAA
ACGCCAGTCGGGAGTGCATC

Downstream 100 bases:

>100_bases
TGATAACGCGATGAAAAGAAAACTATTCTGGATTTGTGCAGTGGCTATGGGGATGAGTGCGTTCCCCTCTTTCATGACGC
AGGCGACGCCAGCAACGCAA

Product: cellulose synthase catalytic subunit

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 872; Mature: 871

Protein sequence:

>872_residues
MSILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWLILAWIFIPLEHPRWQRIRAEHKNLYPHINASRPRPLDPV
RYLIQTCWLLIGTSRKETPKPRRRTFSGLQNIRGRYHQWMNELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSL
ILALICVTQPFNPLAQFIFLMLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGIDWPKDKLNIWILDDGGREEFR
QFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFDCDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFER
NLGRFRKTPNEGTLFYGLVQDGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIFLTAPLAFLLLHAYIIYAPAL
MIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWYIAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYI
FLVLLNLVGVAVGIWRYFYGPPTEMLTVVVSMVWVFYNLIVLGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPTQVARVMGNEVGLKLMPLTTQQHIDFVQCTFARADTWALWQ
DSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRVLTSLVSWVVSFIPRRPERSETAQPSDQALAQQ

Sequences:

>Translated_872_residues
MSILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWLILAWIFIPLEHPRWQRIRAEHKNLYPHINASRPRPLDPV
RYLIQTCWLLIGTSRKETPKPRRRTFSGLQNIRGRYHQWMNELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSL
ILALICVTQPFNPLAQFIFLMLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGIDWPKDKLNIWILDDGGREEFR
QFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFDCDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFER
NLGRFRKTPNEGTLFYGLVQDGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIFLTAPLAFLLLHAYIIYAPAL
MIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWYIAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYI
FLVLLNLVGVAVGIWRYFYGPPTEMLTVVVSMVWVFYNLIVLGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPTQVARVMGNEVGLKLMPLTTQQHIDFVQCTFARADTWALWQ
DSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRVLTSLVSWVVSFIPRRPERSETAQPSDQALAQQ
>Mature_871_residues
SILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWLILAWIFIPLEHPRWQRIRAEHKNLYPHINASRPRPLDPVR
YLIQTCWLLIGTSRKETPKPRRRTFSGLQNIRGRYHQWMNELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSLI
LALICVTQPFNPLAQFIFLMLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAET
YAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGIDWPKDKLNIWILDDGGREEFRQ
FAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFDCDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFERN
LGRFRKTPNEGTLFYGLVQDGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAAG
LATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIFLTAPLAFLLLHAYIIYAPALM
IALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWYIAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYIF
LVLLNLVGVAVGIWRYFYGPPTEMLTVVVSMVWVFYNLIVLGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCTV
QDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPTQVARVMGNEVGLKLMPLTTQQHIDFVQCTFARADTWALWQD
SYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRVLTSLVSWVVSFIPRRPERSETAQPSDQALAQQ

Specific function: Catalytic subunit of cellulose synthase. It polymerizes uridine 5'-diphosphate glucose to cellulose, which is produced as an extracellular component for mechanical and chemical protection at the onset of the stationary phase, when the cells exhibit multic

COG id: COG1215

COG function: function code M; Glycosyltransferases, probably involved in cell wall biogenesis

Gene ontology:

Cell location: Cell inner membrane; Multi-pass membrane protein (Potential) [H]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 PilZ domain [H]

Homologues:

Organism=Escherichia coli, GI87082284, Length=872, Percent_Identity=99.6559633027523, Blast_Score=1799, Evalue=0.0,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003919
- InterPro:   IPR001173
- InterPro:   IPR009875 [H]

Pfam domain/function: PF00535 Glycos_transf_2; PF07238 PilZ [H]

EC number: =2.4.1.12 [H]

Molecular weight: Translated: 99828; Mature: 99697

Theoretical pI: Translated: 9.90; Mature: 9.90

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.3 %Cys     (Translated Protein)
2.5 %Met     (Translated Protein)
3.8 %Cys+Met (Translated Protein)
1.3 %Cys     (Mature Protein)
2.4 %Met     (Mature Protein)
3.7 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWLILAWIFIPLEHPRWQRIRA
CCHHHHHHHCCCCCHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHH
EHKNLYPHINASRPRPLDPVRYLIQTCWLLIGTSRKETPKPRRRTFSGLQNIRGRYHQWM
HHHCCCCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHH
NELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSLILALICVTQPFNPLAQFIFL
HHHHHHHHHHHHHCHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHH
MLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
HHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHEEEEEEEECCCCCCCHHHHHHHHHHHHHH
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGID
HHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCEEEECCCCCHHHHHHHHHHHHCCCC
WPKDKLNIWILDDGGREEFRQFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFD
CCCCCEEEEEEECCCHHHHHHHHHHCCCHHHHHHHHHHHHCCCCHHHHHHCCCCEEEEEE
CDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFERNLGRFRKTPNEGTLFYGLVQ
CCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHCCCCCCCEEEEEEE
DGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
CCCCHHHHHHHHCCHHHHHCCCHHHHCCEEEEEECHHHHHHHHHHHCCCHHHHHHCCHHH
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIF
CCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHH
LTAPLAFLLLHAYIIYAPALMIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWY
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHCCHHHHHHHHHHHHHHHHHH
IAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYIFLVLLNLVGVAVGIWRYFYG
CCCCEEEEEECCCCCEEEEEECCCCCHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCC
PPTEMLTVVVSMVWVFYNLIVLGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
CHHHHHHHHHHHHHHHHHHHHHCCHHEEEECHHHHHHHHCCEEECCHHHCCCCCCEEEEE
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPTQVARVMGNEVGLKLMPLTTQ
ECCCCCCCEEEEECCCEEEECCCHHHHHHHCCCCCCCCHHHHHHHHCCCCCEEEEECCHH
QHIDFVQCTFARADTWALWQDSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRV
HHCCHHHHHHHCCCCEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHH
LTSLVSWVVSFIPRRPERSETAQPSDQALAQQ
HHHHHHHHHHHCCCCCCCCCCCCCCHHHHCCC
>Mature Secondary Structure 
SILTRWLLIPPVNARLIGRYRDYRRHGASAFSATLGCFWLILAWIFIPLEHPRWQRIRA
CHHHHHHHCCCCCHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHH
EHKNLYPHINASRPRPLDPVRYLIQTCWLLIGTSRKETPKPRRRTFSGLQNIRGRYHQWM
HHHCCCCCCCCCCCCCCCHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHHHHH
NELPERVSHKTQHLDEKKELGHLSAGARRLILGIIVTFSLILALICVTQPFNPLAQFIFL
HHHHHHHHHHHHHCHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHH
MLLWGVALIVRRMPGRFSALMLIVLSLTVSCRYIWWRYTSTLNWDDPVSLVCGLILLFAE
HHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHEEEEEEEECCCCCCCHHHHHHHHHHHHHH
TYAWIVLVLGYFQVVWPLNRQPVPLPKDMSLWPSVDIFVPTYNEDLNVVKNTIYASLGID
HHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCEEEECCCCCHHHHHHHHHHHHCCCC
WPKDKLNIWILDDGGREEFRQFAQNVGVKYIARTTHEHAKAGNINNALKYAKGEFVSIFD
CCCCCEEEEEEECCCHHHHHHHHHHCCCHHHHHHHHHHHHCCCCHHHHHHCCCCEEEEEE
CDHVPTRSFLQMTMGWFLKEKQLAMMQTPHHFFSPDPFERNLGRFRKTPNEGTLFYGLVQ
CCCCCHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHCCCCCCCEEEEEEE
DGNDMWDATFFCGSCAVIRRKPLDEIGGIAVETVTEDAHTSLRLHRRGYTSAYMRIPQAA
CCCCHHHHHHHHCCHHHHHCCCHHHHCCEEEEEECHHHHHHHHHHHCCCHHHHHHCCHHH
GLATESLSAHIGQRIRWARGMVQIFRLDNPLTGKGLKFAQRLCYVNAMFHFLSGIPRLIF
CCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHCCCHHHHH
LTAPLAFLLLHAYIIYAPALMIALFVLPHMIHASLTNSKIQGKYRHSFWSEIYETVLAWY
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHCCHHHHHHHHHHHHHHHHHH
IAPPTLVALINPHKGKFNVTAKGGLVEEEYVDWVISRPYIFLVLLNLVGVAVGIWRYFYG
CCCCEEEEEECCCCCEEEEEECCCCCHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHCC
PPTEMLTVVVSMVWVFYNLIVLGGAVAVSVESKQVRRSHRVEMTMPAAIAREDGHLFSCT
CHHHHHHHHHHHHHHHHHHHHHCCHHEEEECHHHHHHHHCCEEECCHHHCCCCCCEEEEE
VQDFSDGGLGIKINGQAQILEGQKVNLLLKRGQQEYVFPTQVARVMGNEVGLKLMPLTTQ
ECCCCCCCEEEEECCCEEEECCCHHHHHHHCCCCCCCCHHHHHHHHCCCCCEEEEECCHH
QHIDFVQCTFARADTWALWQDSYPEDKPLESLLDILKLGFRGYRHLAEFAPSSVKGIFRV
HHCCHHHHHHHCCCCEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHH
LTSLVSWVVSFIPRRPERSETAQPSDQALAQQ
HHHHHHHHHHHCCCCCCCCCCCCCCHHHHCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 11206551; 11258796 [H]