BacMap

Definition	Burkholderia cenocepacia HI2424 chromosome 1, complete sequence.
Accession	NC_008542
Length	3,483,902

Click here to switch to the map view.

The map label for this gene is 116689537

Identifier: 116689537

GI number: 116689537

Start: 1675851

End: 1677275

Strand: Reverse

Name: 116689537

Synonym: Bcen2424_1515

Alternate gene names: NA

Gene position: 1677275-1675851 (Counterclockwise)

Preceding gene: 116689538

Following gene: 116689536

Centisome position: 48.14

GC content: 72.7

Gene sequence:

>1425_bases
ATGTCCCAGCAACGTTCCATCCCGACGGTCGCCCTGCGCCAGTGGCGCGCGCCCCTCACCGCCTTCGCCGCGGCGTGCCT
GCTGGCCGCCTGCGGCGGCGGCGGCGTCAGCTCGCCGCCGACCAGCAGCAACGACAACAACAACCCGAGCACGAGCGGCA
CGTCCGGCACGAGCGGTACCAGCGGCTCGTCGACCGGCACCAAGGGTGTCATCAGCACGGTCGGCCAGACGGCCACCGAC
CTCGGCAGCACGGTCGGCAACATCAGCCTGCCGGGCCTCGGCGACGGCGTGACGAAGGGCGTCGGCAGCACGCTGTCCAG
CACCGGCACGATCGTCGGTGCGGCAGCCGATGCGGTGAGCAACGGGCTGGGACAGATCGGCTCGACGAAGGACCCGGTCG
GCACCACGGTTGCCGGTCTCGGCAACGTCGTCGGCGCAACCAGCAACACAGTCTCCGGCCTGAGCTCGACGGTCAAGGCG
CTGGGTACGGGCCCGCTGGCACCGCTCGCGCCGGTCACGACGCCGGTCGGCACCGTGCTCGACACGGTCGCCAACGGCCT
GACGGCCGCCGGCACGACGATCGGCTCGACGTTGTCGTCGGGCGCCGTGCAGCAGGTCACGCAACCGATCAGCTCGGCGA
TCACGCCGCTCGTGATCACCGCCGGCCAGGTCACGCAGCAGGTCGGCACGACGACCGGCCTCGGCCAACCCGTCTCGGGC
CTGCTCGGCCAGATCGGCGGCGCCATCAGCTCGGCCGGCAAGCAGGTCGGCGGCACGTCGAGCCAGCCGCTCGTCGGTGA
CGTCGGCCAGCTCGTGACCGCGGTCGGCAACACCGTGACCAACGCGGGCGGCCTCGTCAACCCGAACGGCCCGAATGGCG
CGGCGCCGATCCCCGGCCTGATCACGAGCCTCGTCGGCGGCTCGACGGCAACCGTCCAGAACGGCTCGTCGTCGGGTTCC
GGTTCGACGAACCCGCTCGGCGGCCTGCTGTCGGGTCTCGGCTCGACGCCGCTCGGCTCGCTCACGGGCGCCCTCGGCGG
CGCAACGGGCGGCTCGGGCAGCGGCCCGCTCGCGCCGGTGACCGGCCTCGTCTCCACGGTGACCGGCGCACTGGGTGGCG
CGGCAGGCGGCAGCAGCGGTCCGCTGGCACCCGTCACGAATCTCGTGTCGACGGTGACGGGCACGCTCGGCGGCGCAACA
GGTGGCGCAGGCAGTGCAAACCCTCTCGCGCCCGTCACCGGTTTGCTGAATACTGTCACCGGAGCAGTGGGCGGTGCAGC
GGGGTCCGGGGGCTCGAGCCCGCTCGCGCCGGTCACGTCGCTGGTCGGCAGCGTGTCGGGTACGGCATCGTCGGGCAGCG
GTTCGACGGGCCTGCTGGCACCGGTCACGGGGTTGCTGGGTACGCTGGGTAGCGTTGGCAAGTAA

Upstream 100 bases:

>100_bases
CCGCTTGCGCCCGTCACGTCGCTGATCGGCGGCCTGCTCGGCGGCACGCACGGCAAGTAATCCGACATCCATTCATCGAA
AAGACAGCGAGGAGTCCATC

Downstream 100 bases:

>100_bases
GGAGGACGGTCGCGTCATCGCAGCCGGAGCGAATGGCGCGGCCGTACAAGCACAACCGGCATGGCGGCACGCGGCGCGCG
ACATCCAGGTGTCGCGCGCC

Product: hypothetical protein

Products: NA

Alternate protein names: Lipoprotein; Triple Helix Repeat-Containing Collagen; Hemagglutinin Transmembrane Protein; Collagen Triple Helix Repeat

Number of amino acids: Translated: 474; Mature: 473

Protein sequence:

>474_residues
MSQQRSIPTVALRQWRAPLTAFAAACLLAACGGGGVSSPPTSSNDNNNPSTSGTSGTSGTSGSSTGTKGVISTVGQTATD
LGSTVGNISLPGLGDGVTKGVGSTLSSTGTIVGAAADAVSNGLGQIGSTKDPVGTTVAGLGNVVGATSNTVSGLSSTVKA
LGTGPLAPLAPVTTPVGTVLDTVANGLTAAGTTIGSTLSSGAVQQVTQPISSAITPLVITAGQVTQQVGTTTGLGQPVSG
LLGQIGGAISSAGKQVGGTSSQPLVGDVGQLVTAVGNTVTNAGGLVNPNGPNGAAPIPGLITSLVGGSTATVQNGSSSGS
GSTNPLGGLLSGLGSTPLGSLTGALGGATGGSGSGPLAPVTGLVSTVTGALGGAAGGSSGPLAPVTNLVSTVTGTLGGAT
GGAGSANPLAPVTGLLNTVTGAVGGAAGSGGSSPLAPVTSLVGSVSGTASSGSGSTGLLAPVTGLLGTLGSVGK

Sequences:

>Translated_474_residues
MSQQRSIPTVALRQWRAPLTAFAAACLLAACGGGGVSSPPTSSNDNNNPSTSGTSGTSGTSGSSTGTKGVISTVGQTATD
LGSTVGNISLPGLGDGVTKGVGSTLSSTGTIVGAAADAVSNGLGQIGSTKDPVGTTVAGLGNVVGATSNTVSGLSSTVKA
LGTGPLAPLAPVTTPVGTVLDTVANGLTAAGTTIGSTLSSGAVQQVTQPISSAITPLVITAGQVTQQVGTTTGLGQPVSG
LLGQIGGAISSAGKQVGGTSSQPLVGDVGQLVTAVGNTVTNAGGLVNPNGPNGAAPIPGLITSLVGGSTATVQNGSSSGS
GSTNPLGGLLSGLGSTPLGSLTGALGGATGGSGSGPLAPVTGLVSTVTGALGGAAGGSSGPLAPVTNLVSTVTGTLGGAT
GGAGSANPLAPVTGLLNTVTGAVGGAAGSGGSSPLAPVTSLVGSVSGTASSGSGSTGLLAPVTGLLGTLGSVGK
>Mature_473_residues
SQQRSIPTVALRQWRAPLTAFAAACLLAACGGGGVSSPPTSSNDNNNPSTSGTSGTSGTSGSSTGTKGVISTVGQTATDL
GSTVGNISLPGLGDGVTKGVGSTLSSTGTIVGAAADAVSNGLGQIGSTKDPVGTTVAGLGNVVGATSNTVSGLSSTVKAL
GTGPLAPLAPVTTPVGTVLDTVANGLTAAGTTIGSTLSSGAVQQVTQPISSAITPLVITAGQVTQQVGTTTGLGQPVSGL
LGQIGGAISSAGKQVGGTSSQPLVGDVGQLVTAVGNTVTNAGGLVNPNGPNGAAPIPGLITSLVGGSTATVQNGSSSGSG
STNPLGGLLSGLGSTPLGSLTGALGGATGGSGSGPLAPVTGLVSTVTGALGGAAGGSSGPLAPVTNLVSTVTGTLGGATG
GAGSANPLAPVTGLLNTVTGAVGGAAGSGGSSPLAPVTSLVGSVSGTASSGSGSTGLLAPVTGLLGTLGSVGK

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 43042; Mature: 42911

Theoretical pI: Translated: 8.79; Mature: 8.79

Prosite motif: PS00013 PROKAR_LIPOPROTEIN

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.4 %Cys     (Translated Protein)
0.2 %Met     (Translated Protein)
0.6 %Cys+Met (Translated Protein)
0.4 %Cys     (Mature Protein)
0.0 %Met     (Mature Protein)
0.4 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSQQRSIPTVALRQWRAPLTAFAAACLLAACGGGGVSSPPTSSNDNNNPSTSGTSGTSGT
CCCCCCCCHHHHHHHCCHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
SGSSTGTKGVISTVGQTATDLGSTVGNISLPGLGDGVTKGVGSTLSSTGTIVGAAADAVS
CCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCCEEHHHHHHHH
NGLGQIGSTKDPVGTTVAGLGNVVGATSNTVSGLSSTVKALGTGPLAPLAPVTTPVGTVL
HHHHCCCCCCCCCHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHHH
DTVANGLTAAGTTIGSTLSSGAVQQVTQPISSAITPLVITAGQVTQQVGTTTGLGQPVSG
HHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHHHCHHHEEEHHHHHHHHCCCCCCCCCHHH
LLGQIGGAISSAGKQVGGTSSQPLVGDVGQLVTAVGNTVTNAGGLVNPNGPNGAAPIPGL
HHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCHHHH
ITSLVGGSTATVQNGSSSGSGSTNPLGGLLSGLGSTPLGSLTGALGGATGGSGSGPLAPV
HHHHHCCCCEEECCCCCCCCCCCCHHHHHHHHCCCCCHHHHHHHHCCCCCCCCCCCHHHH
TGLVSTVTGALGGAAGGSSGPLAPVTNLVSTVTGTLGGATGGAGSANPLAPVTGLLNTVT
HHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHHH
GAVGGAAGSGGSSPLAPVTSLVGSVSGTASSGSGSTGLLAPVTGLLGTLGSVGK
HHHCCCCCCCCCCCHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHHHHCCCC
>Mature Secondary Structure 
SQQRSIPTVALRQWRAPLTAFAAACLLAACGGGGVSSPPTSSNDNNNPSTSGTSGTSGT
CCCCCCCHHHHHHHCCHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCCC
SGSSTGTKGVISTVGQTATDLGSTVGNISLPGLGDGVTKGVGSTLSSTGTIVGAAADAVS
CCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHCCCEEHHHHHHHH
NGLGQIGSTKDPVGTTVAGLGNVVGATSNTVSGLSSTVKALGTGPLAPLAPVTTPVGTVL
HHHHCCCCCCCCCHHHHHHHHHHHCCCCHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHHH
DTVANGLTAAGTTIGSTLSSGAVQQVTQPISSAITPLVITAGQVTQQVGTTTGLGQPVSG
HHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHHHCHHHEEEHHHHHHHHCCCCCCCCCHHH
LLGQIGGAISSAGKQVGGTSSQPLVGDVGQLVTAVGNTVTNAGGLVNPNGPNGAAPIPGL
HHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCCHHHH
ITSLVGGSTATVQNGSSSGSGSTNPLGGLLSGLGSTPLGSLTGALGGATGGSGSGPLAPV
HHHHHCCCCEEECCCCCCCCCCCCHHHHHHHHCCCCCHHHHHHHHCCCCCCCCCCCHHHH
TGLVSTVTGALGGAAGGSSGPLAPVTNLVSTVTGTLGGATGGAGSANPLAPVTGLLNTVT
HHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHHH
GAVGGAAGSGGSSPLAPVTSLVGSVSGTASSGSGSTGLLAPVTGLLGTLGSVGK
HHHCCCCCCCCCCCHHHHHHHHHHCCCCCCCCCCCCCHHHHHHHHHHHHHCCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA