BacMap

Definition	Escherichia coli 55989, complete genome.
Accession	NC_011748
Length	5,154,862

Click here to switch to the map view.

The map label for this gene is 218696578

Identifier: 218696578

GI number: 218696578

Start: 3357615

End: 3359183

Strand: Reverse

Name: 218696578

Synonym: EC55989_3274

Alternate gene names: NA

Gene position: 3359183-3357615 (Counterclockwise)

Preceding gene: 218696579

Following gene: 218696576

Centisome position: 65.17

GC content: 53.66

Gene sequence:

>1569_bases
ATGAGTCAGAAATACCTCATTCGCATCGCTGAGCTGGAAAGGCTGCTCTCTGAGCAGGCTGAAGCCCTCCGTCAGAAAGA
CCAGCAACTGAGTCTGGTTGAAGAGACGGAGGCCTTCCTGCGCTCTGCACTGGCACGTGCCGAAGAAAAGATCGAAGAAG
ATGAACGGGAAATAGAGCATCTGCGGGCTCAGATAGAAAAACTGCGCCGGATGCTGTTCGGAACCCGTTCTGAAAAACTG
CGTCGTGAGGTTGAACAGGCTGAAGCCCTGCTGAAACAACGCGAGCAGGAAAGCGATCGTTACAGTGGGCGTGAGGATGA
CCCGCTGGTTCCCCGCCAGTTGCGACAGTCGCGCCATCGTCGTCCGTTACCGGCACATCTCCCCCGTGAAATATACCGCC
TGGAGCCTGAAGAAAGCTGTTGCCCGGAGTGTGGCGGTGAGCTGGATTATCTGGGGGAAGTCAGCGCAGAACAACTGGAA
CTGGTGAGCAGCGCCCTGAAAGTGATCCGCACAGAACGGGTAAAAAAAGCCTGTACAAAATGTGACTGCATCGTTGAAGC
ACCGGCACCATCCCGTCCGATAGAGCGTGGTATCGCGGGCCCGGGGTTACTTGCCCGCGTGTTAACGGGAAAATACTGCG
AACACCTGCCACTGTATCGTCAGAGTGAAATCTTTGCCCGCCAGGGTGTCGAACTGAGCCGTGCCTTACTCTCCAACTGG
GTTGATGCGTGCTGCCAGTTAATGACGCCGCTGAATGATGCCCTGTACAGTTATGTGATGAACACCCGCAAGGTTCACAC
TGATGACACACCAGTAAAAGTACTGGCACCGGGCAGGAAGAAGGCGAAAACAGGATATATCTGGACGTATGTCCGGGATG
ACCGAAATGCCGGTTCGCCAGAACCTCCGGCGGTCTGGTTCGCCTACTCACCGGACCATCAGGGTAAACATCCGGAGCAA
CACCTTCGTCCCTTCCGGGGTATCCTGCAGGCAGATGCGTTCGCAGGTTACGATCGGCTGTTCAGTGCCGAACGTGAAGG
CGGCGCGTTGACGGAAGCAGGATGCTGGGCTCATGCGCGGCGCAAAATCCACGATGTATATATCAGTACCAAAAGCGCGA
CGGCGGAAGAAGCACTGAAACTAATCGGCGAACTGTACGCCATTGAGCACGAAATACGCGGGTTGCCGGTGTCTGAACGC
CTGGCGGTCAGGCAAATGCAGAGTAAACCGCTACTGACTTCCCTGTATAAGCTGATGCAGGAGAAAGAACACACGTTATC
GAAAAAATGCCGTCTGAGAGATGCGTTCCGGTATATCAGGAAGCACTGGGTTGCGTTGTGCAACTTCTGTGATGACGGTC
TGGCGGAGGCGGACAATAACACAGCGGAAAGAGCGCTTCGTGCAGTCTGTCTCGGAAAGAAAAATTCTTATGACCTTTGT
CAAATATTAAGCCCAAAAAGACCTTACGCAGCTCCGGGAGCTTCGTTATATCGCGGATTAAAGAACCTGAAACAGTCAGA
CTGTATCTTGGATTTTACAAACTCTTATTCGGGGATTTTAGCCCCATGA

Upstream 100 bases:

>100_bases
AATGCTCCTCGATAAGCTGGACTGGCGTCAGCCAAAAACATCCCGCCTTAACGCACTGACAATGTTGTAAAAAACTCCTG
ACCGCATTATAAAAACGGCC

Downstream 100 bases:

>100_bases
CGATTTACGCAGTGAGCTGGCCTCTTTCTACGTGCAGGTATTAGCGCATTCTGGCTTCCCTGAATTCTTTTACGAGGATC
ACTCATTCCGTGTCTGACTG

Product: conserved hypothetical protein, putative transposase ORF1, IS66 family

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 522; Mature: 521

Protein sequence:

>522_residues
MSQKYLIRIAELERLLSEQAEALRQKDQQLSLVEETEAFLRSALARAEEKIEEDEREIEHLRAQIEKLRRMLFGTRSEKL
RREVEQAEALLKQREQESDRYSGREDDPLVPRQLRQSRHRRPLPAHLPREIYRLEPEESCCPECGGELDYLGEVSAEQLE
LVSSALKVIRTERVKKACTKCDCIVEAPAPSRPIERGIAGPGLLARVLTGKYCEHLPLYRQSEIFARQGVELSRALLSNW
VDACCQLMTPLNDALYSYVMNTRKVHTDDTPVKVLAPGRKKAKTGYIWTYVRDDRNAGSPEPPAVWFAYSPDHQGKHPEQ
HLRPFRGILQADAFAGYDRLFSAEREGGALTEAGCWAHARRKIHDVYISTKSATAEEALKLIGELYAIEHEIRGLPVSER
LAVRQMQSKPLLTSLYKLMQEKEHTLSKKCRLRDAFRYIRKHWVALCNFCDDGLAEADNNTAERALRAVCLGKKNSYDLC
QILSPKRPYAAPGASLYRGLKNLKQSDCILDFTNSYSGILAP

Sequences:

>Translated_522_residues
MSQKYLIRIAELERLLSEQAEALRQKDQQLSLVEETEAFLRSALARAEEKIEEDEREIEHLRAQIEKLRRMLFGTRSEKL
RREVEQAEALLKQREQESDRYSGREDDPLVPRQLRQSRHRRPLPAHLPREIYRLEPEESCCPECGGELDYLGEVSAEQLE
LVSSALKVIRTERVKKACTKCDCIVEAPAPSRPIERGIAGPGLLARVLTGKYCEHLPLYRQSEIFARQGVELSRALLSNW
VDACCQLMTPLNDALYSYVMNTRKVHTDDTPVKVLAPGRKKAKTGYIWTYVRDDRNAGSPEPPAVWFAYSPDHQGKHPEQ
HLRPFRGILQADAFAGYDRLFSAEREGGALTEAGCWAHARRKIHDVYISTKSATAEEALKLIGELYAIEHEIRGLPVSER
LAVRQMQSKPLLTSLYKLMQEKEHTLSKKCRLRDAFRYIRKHWVALCNFCDDGLAEADNNTAERALRAVCLGKKNSYDLC
QILSPKRPYAAPGASLYRGLKNLKQSDCILDFTNSYSGILAP
>Mature_521_residues
SQKYLIRIAELERLLSEQAEALRQKDQQLSLVEETEAFLRSALARAEEKIEEDEREIEHLRAQIEKLRRMLFGTRSEKLR
REVEQAEALLKQREQESDRYSGREDDPLVPRQLRQSRHRRPLPAHLPREIYRLEPEESCCPECGGELDYLGEVSAEQLEL
VSSALKVIRTERVKKACTKCDCIVEAPAPSRPIERGIAGPGLLARVLTGKYCEHLPLYRQSEIFARQGVELSRALLSNWV
DACCQLMTPLNDALYSYVMNTRKVHTDDTPVKVLAPGRKKAKTGYIWTYVRDDRNAGSPEPPAVWFAYSPDHQGKHPEQH
LRPFRGILQADAFAGYDRLFSAEREGGALTEAGCWAHARRKIHDVYISTKSATAEEALKLIGELYAIEHEIRGLPVSERL
AVRQMQSKPLLTSLYKLMQEKEHTLSKKCRLRDAFRYIRKHWVALCNFCDDGLAEADNNTAERALRAVCLGKKNSYDLCQ
ILSPKRPYAAPGASLYRGLKNLKQSDCILDFTNSYSGILAP

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Belongs to the transposase 25 family [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR004291 [H]

Pfam domain/function: PF03050 Transposase_25 [H]

EC number: NA

Molecular weight: Translated: 59545; Mature: 59414

Theoretical pI: Translated: 8.23; Mature: 8.23

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

3.1 %Cys     (Translated Protein)
1.1 %Met     (Translated Protein)
4.2 %Cys+Met (Translated Protein)
3.1 %Cys     (Mature Protein)
1.0 %Met     (Mature Protein)
4.0 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSQKYLIRIAELERLLSEQAEALRQKDQQLSLVEETEAFLRSALARAEEKIEEDEREIEH
CCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
LRAQIEKLRRMLFGTRSEKLRREVEQAEALLKQREQESDRYSGREDDPLVPRQLRQSRHR
HHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHCC
RPLPAHLPREIYRLEPEESCCPECGGELDYLGEVSAEQLELVSSALKVIRTERVKKACTK
CCCCCCCCHHHHHCCCCHHCCHHCCCCCCHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHH
CDCIVEAPAPSRPIERGIAGPGLLARVLTGKYCEHLPLYRQSEIFARQGVELSRALLSNW
CCEEEECCCCCCHHHHCCCCHHHHHHHHHHHHHHHCCCHHHHHHHHHHCHHHHHHHHHHH
VDACCQLMTPLNDALYSYVMNTRKVHTDDTPVKVLAPGRKKAKTGYIWTYVRDDRNAGSP
HHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEECCCCCCCCCCEEEEEEECCCCCCCC
EPPAVWFAYSPDHQGKHPEQHLRPFRGILQADAFAGYDRLFSAEREGGALTEAGCWAHAR
CCCEEEEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHH
RKIHDVYISTKSATAEEALKLIGELYAIEHEIRGLPVSERLAVRQMQSKPLLTSLYKLMQ
HHHHHHHEECCCCCHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHCCCHHHHHHHHHH
EKEHTLSKKCRLRDAFRYIRKHWVALCNFCDDGLAEADNNTAERALRAVCLGKKNSYDLC
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHCCCCHHHHHHHHHHHHCCCCCCCHH
QILSPKRPYAAPGASLYRGLKNLKQSDCILDFTNSYSGILAP
HHCCCCCCCCCCCHHHHHHHHHHCHHCCEEEECCCCCCCCCC
>Mature Secondary Structure 
SQKYLIRIAELERLLSEQAEALRQKDQQLSLVEETEAFLRSALARAEEKIEEDEREIEH
CCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
LRAQIEKLRRMLFGTRSEKLRREVEQAEALLKQREQESDRYSGREDDPLVPRQLRQSRHR
HHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHCC
RPLPAHLPREIYRLEPEESCCPECGGELDYLGEVSAEQLELVSSALKVIRTERVKKACTK
CCCCCCCCHHHHHCCCCHHCCHHCCCCCCHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHH
CDCIVEAPAPSRPIERGIAGPGLLARVLTGKYCEHLPLYRQSEIFARQGVELSRALLSNW
CCEEEECCCCCCHHHHCCCCHHHHHHHHHHHHHHHCCCHHHHHHHHHHCHHHHHHHHHHH
VDACCQLMTPLNDALYSYVMNTRKVHTDDTPVKVLAPGRKKAKTGYIWTYVRDDRNAGSP
HHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCEEEECCCCCCCCCCEEEEEEECCCCCCCC
EPPAVWFAYSPDHQGKHPEQHLRPFRGILQADAFAGYDRLFSAEREGGALTEAGCWAHAR
CCCEEEEEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHH
RKIHDVYISTKSATAEEALKLIGELYAIEHEIRGLPVSERLAVRQMQSKPLLTSLYKLMQ
HHHHHHHEECCCCCHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHCCCHHHHHHHHHH
EKEHTLSKKCRLRDAFRYIRKHWVALCNFCDDGLAEADNNTAERALRAVCLGKKNSYDLC
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHCCCCHHHHHHHHHHHHCCCCCCCHH
QILSPKRPYAAPGASLYRGLKNLKQSDCILDFTNSYSGILAP
HHCCCCCCCCCCCHHHHHHHHHHCHHCCEEEECCCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 9163424 [H]