BacMap

Definition	Escherichia coli UTI89 plasmid pUTI89, complete sequence.
Accession	NC_007941
Length	114,230

Click here to switch to the map view.

The map label for this gene is senB [H]

Identifier: 91206275

GI number: 91206275

Start: 25164

End: 26438

Strand: Direct

Name: senB [H]

Synonym: UTI89_P030

Alternate gene names: 91206275

Gene position: 25164-26438 (Clockwise)

Preceding gene: 91206274

Following gene: 91206277

Centisome position: 22.03

GC content: 45.25

Gene sequence:

>1275_bases
ATGGATATTTGGCGGGGACATTCGTTTCTGATGACAATTTCCGCTAGGTTCAGACAATACGTTTTCTCTCTTATGTCAAT
TTTATTGCAGGAACGAAAAATGAATATTTTCACTTTATCCAAAGCACCGCTATACCTGTTAATTTCACTATTTTTACCCA
CGATGGCCATGGCTATCGATCCACCTGAACGCGAACTTTCGCGATTTGCCCTGAAAACGAATTACCTTCAGTCCCCTGAT
GAAGGCGTCTATGAACTGGCGTTTGATAATGCCAGTAAAAAGGTGTTTGCAGCAGTCACCGATCGTGTAAATCGTGAAGC
CAATAAAGGCTATCTGTATTCGTTTAATTCAGATTCGCTGAAAGTCGAAAATAAATACACGATGCCATACCGGGCATTTT
CGCTGGCGATAAATCAGGATAAACATCAGCTCTATATCGGACACACCCAGTCAGCGTCCCTGCGTATCAGTATGTTTGAC
ACCCCAACCGGCAAACTGGTAAGAACCAGCGACAGGTTAAGTTTTAAAGCGGCAAACGCTGCAGATTCGCGTTTTGAGCA
TTTTCGCCATATGGTTTACAGCCAGGATTCCGATACCCTGTTTGTGAGTTATAGCAATATGCTGAAAACGGCCGAGGGCA
TGAAGCCTCTGCATAAGCTGTTAATGCTCGACGGGACGACGCTTGCCTTAAAAGGCGAGGTTAAGGATGCTTACAAAGGT
ACAGCGTATGGTCTGACGATGGATGAAAAAACACAGAAAATCTACGTTGGCGGAAGAGATTACATCAACGAAATTGATGC
GAAAAATCAGACGCTGCTGCGTACCATCCCGTTGAAAGATCCGAGACCACAAATCACAAGTGTGCAGAATCTGGCGGTGG
ACTCCGCTTCTGACCGTGCCTTTGTGGTGGTATTCGACCATGACGATCGTTCCGGTACAAAAGATGGACTCTATATTTTT
GACTTACGCGACGGTAAACAGCTTGGCTATGTGCACACAGGAGCCGGAGCTAACGCGGTGAAATACAATCCGAAATATAA
CGAACTGTATGTCACCAACTTCACTAGCGGCACCATCAGCGTAGTGGATGCCACCAAATACAGCATCACCCGTGAATTTA
ACATGCCGGTCTACCCAAACCAGATGGTGTTGTCGGACGATATGGATACCCTTTACATTGGCATCAAAGAAGGCTTTAAC
CGCGATTGGGATCCTGATGTGTTTGTGGAAGGAGCTAAAGAACGTATTCTGAGCATTGATTTGAAAAAGTCGTGA

Upstream 100 bases:

>100_bases
ACCTGATGAACAGAGATTATTCGGAGGCGCTGAATAAGCTCAACATGATGCCAGGTCTTGGTGACGAGACCCACCCAGCC
AATTCCGCGCGTGGCAGAAC

Downstream 100 bases:

>100_bases
TCGGGGGGAAAAAACATGGGATAAAAACTCCGTTATTCCACTAAACTGGCCGGACTAGGAAAAGCAAACATCTCTGTCCT
GCCGGTACGCCTGTTACGCC

Product: enterotoxin TieB protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 424; Mature: 424

Protein sequence:

>424_residues
MDIWRGHSFLMTISARFRQYVFSLMSILLQERKMNIFTLSKAPLYLLISLFLPTMAMAIDPPERELSRFALKTNYLQSPD
EGVYELAFDNASKKVFAAVTDRVNREANKGYLYSFNSDSLKVENKYTMPYRAFSLAINQDKHQLYIGHTQSASLRISMFD
TPTGKLVRTSDRLSFKAANAADSRFEHFRHMVYSQDSDTLFVSYSNMLKTAEGMKPLHKLLMLDGTTLALKGEVKDAYKG
TAYGLTMDEKTQKIYVGGRDYINEIDAKNQTLLRTIPLKDPRPQITSVQNLAVDSASDRAFVVVFDHDDRSGTKDGLYIF
DLRDGKQLGYVHTGAGANAVKYNPKYNELYVTNFTSGTISVVDATKYSITREFNMPVYPNQMVLSDDMDTLYIGIKEGFN
RDWDPDVFVEGAKERILSIDLKKS

Sequences:

>Translated_424_residues
MDIWRGHSFLMTISARFRQYVFSLMSILLQERKMNIFTLSKAPLYLLISLFLPTMAMAIDPPERELSRFALKTNYLQSPD
EGVYELAFDNASKKVFAAVTDRVNREANKGYLYSFNSDSLKVENKYTMPYRAFSLAINQDKHQLYIGHTQSASLRISMFD
TPTGKLVRTSDRLSFKAANAADSRFEHFRHMVYSQDSDTLFVSYSNMLKTAEGMKPLHKLLMLDGTTLALKGEVKDAYKG
TAYGLTMDEKTQKIYVGGRDYINEIDAKNQTLLRTIPLKDPRPQITSVQNLAVDSASDRAFVVVFDHDDRSGTKDGLYIF
DLRDGKQLGYVHTGAGANAVKYNPKYNELYVTNFTSGTISVVDATKYSITREFNMPVYPNQMVLSDDMDTLYIGIKEGFN
RDWDPDVFVEGAKERILSIDLKKS
>Mature_424_residues
MDIWRGHSFLMTISARFRQYVFSLMSILLQERKMNIFTLSKAPLYLLISLFLPTMAMAIDPPERELSRFALKTNYLQSPD
EGVYELAFDNASKKVFAAVTDRVNREANKGYLYSFNSDSLKVENKYTMPYRAFSLAINQDKHQLYIGHTQSASLRISMFD
TPTGKLVRTSDRLSFKAANAADSRFEHFRHMVYSQDSDTLFVSYSNMLKTAEGMKPLHKLLMLDGTTLALKGEVKDAYKG
TAYGLTMDEKTQKIYVGGRDYINEIDAKNQTLLRTIPLKDPRPQITSVQNLAVDSASDRAFVVVFDHDDRSGTKDGLYIF
DLRDGKQLGYVHTGAGANAVKYNPKYNELYVTNFTSGTISVVDATKYSITREFNMPVYPNQMVLSDDMDTLYIGIKEGFN
RDWDPDVFVEGAKERILSIDLKKS

Specific function: Unknown

COG id: COG3391

COG function: function code S; Uncharacterized conserved protein

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: Non Essential [C]

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

Organism=Escherichia coli, GI1787724, Length=321, Percent_Identity=26.1682242990654, Blast_Score=99, Evalue=4e-22,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR011048
- InterPro:   IPR015943 [H]

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 48228; Mature: 48228

Theoretical pI: Translated: 8.81; Mature: 8.81

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.0 %Cys     (Translated Protein)
3.8 %Met     (Translated Protein)
3.8 %Cys+Met (Translated Protein)
0.0 %Cys     (Mature Protein)
3.8 %Met     (Mature Protein)
3.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MDIWRGHSFLMTISARFRQYVFSLMSILLQERKMNIFTLSKAPLYLLISLFLPTMAMAID
CCCCCCCEEEEEHHHHHHHHHHHHHHHHHHHCCCCEEEECCCHHHHHHHHHHHHHHHHCC
PPERELSRFALKTNYLQSPDEGVYELAFDNASKKVFAAVTDRVNREANKGYLYSFNSDSL
CCHHHHHHHHHHHCCCCCCCCCEEEEEECCCCCEEHHHHHHHHCCCCCCCEEEEECCCCE
KVENKYTMPYRAFSLAINQDKHQLYIGHTQSASLRISMFDTPTGKLVRTSDRLSFKAANA
EEECEECCCEEEEEEEEECCCEEEEEEECCCCEEEEEEEECCCCCEEEECCCCEEEECCC
ADSRFEHFRHMVYSQDSDTLFVSYSNMLKTAEGMKPLHKLLMLDGTTLALKGEVKDAYKG
HHHHHHHHHHHHCCCCCCEEEEEEHHHHHHHHHHHHHHHHHHCCCCEEEEECCCCCCCCC
TAYGLTMDEKTQKIYVGGRDYINEIDAKNQTLLRTIPLKDPRPQITSVQNLAVDSASDRA
CEEEEEECCCCCEEEECCHHHHHHCCCCCCEEEEEECCCCCCCCCCCHHHEEEECCCCCE
FVVVFDHDDRSGTKDGLYIFDLRDGKQLGYVHTGAGANAVKYNPKYNELYVTNFTSGTIS
EEEEEECCCCCCCCCCEEEEEECCCCEECEEEECCCCCEEEECCCCCEEEEEEECCCEEE
VVDATKYSITREFNMPVYPNQMVLSDDMDTLYIGIKEGFNRDWDPDVFVEGAKERILSID
EEECCEEEEEEECCCCCCCCCEEEECCCCEEEEEEHHCCCCCCCCCCEECCCCCEEEEEE
LKKS
ECCC
>Mature Secondary Structure
MDIWRGHSFLMTISARFRQYVFSLMSILLQERKMNIFTLSKAPLYLLISLFLPTMAMAID
CCCCCCCEEEEEHHHHHHHHHHHHHHHHHHHCCCCEEEECCCHHHHHHHHHHHHHHHHCC
PPERELSRFALKTNYLQSPDEGVYELAFDNASKKVFAAVTDRVNREANKGYLYSFNSDSL
CCHHHHHHHHHHHCCCCCCCCCEEEEEECCCCCEEHHHHHHHHCCCCCCCEEEEECCCCE
KVENKYTMPYRAFSLAINQDKHQLYIGHTQSASLRISMFDTPTGKLVRTSDRLSFKAANA
EEECEECCCEEEEEEEEECCCEEEEEEECCCCEEEEEEEECCCCCEEEECCCCEEEECCC
ADSRFEHFRHMVYSQDSDTLFVSYSNMLKTAEGMKPLHKLLMLDGTTLALKGEVKDAYKG
HHHHHHHHHHHHCCCCCCEEEEEEHHHHHHHHHHHHHHHHHHCCCCEEEEECCCCCCCCC
TAYGLTMDEKTQKIYVGGRDYINEIDAKNQTLLRTIPLKDPRPQITSVQNLAVDSASDRA
CEEEEEECCCCCEEEECCHHHHHHCCCCCCEEEEEECCCCCCCCCCCHHHEEEECCCCCE
FVVVFDHDDRSGTKDGLYIFDLRDGKQLGYVHTGAGANAVKYNPKYNELYVTNFTSGTIS
EEEEEECCCCCCCCCCEEEEEECCCCEECEEEECCCCCEEEECCCCCEEEEEEECCCEEE
VVDATKYSITREFNMPVYPNQMVLSDDMDTLYIGIKEGFNRDWDPDVFVEGAKERILSID
EEECCEEEEEEECCCCCCCCCEEEECCCCEEEEEEHHCCCCCCCCCCEECCCCCEEEEEE
LKKS
ECCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 11677608; 12644504 [H]