Definition Candidatus Protochlamydia amoebophila UWE25, complete genome.
Accession NC_005861
Length 2,414,465

Click here to switch to the map view.

The map label for this gene is 46446098

Identifier: 46446098

GI number: 46446098

Start: 596223

End: 598451

Strand: Direct

Name: 46446098

Synonym: pc0464

Alternate gene names: NA

Gene position: 596223-598451 (Clockwise)

Preceding gene: 46446097

Following gene: 46446099

Centisome position: 24.69

GC content: 29.88

Gene sequence:

>2229_bases
ATGCTAGGTTTGAGTTTTATATTTTCAAAAACAGAGTCTGCTTATTTGGAAGGTTGCAAAGAGCTAGAATGGAAAGTTGT
TCGTTATGAAGAGTTAATTAAACAACAGATAGAGATTCTTGGAAAACTTTTACTAAAAACAGACGGATTAATTGAATATG
TAGTTAAACACATCTCCAATGAAAACGTAAAAAATACCTTGTTTCCTATCATTCAACACTTATTTTCTCAAACGTTTTCT
CAAGAAACTTCCAGATTTAATGAAATTTATTTAGATCAAAAAAGGCAGTCATATAAAAAAATTATTTCTCTTCTTAGAAA
AGCCCTCGATTATTTTGAAAAAAATCGACATGAACTCATTGCTAGGAATGTTTTAACTTTAGGCTATAAATTTTATTCCC
AAATTCGCTTCAATAATTGCGGCACTGAAATTTTTAATAATTTAATGGAATTTGGGAAAAAAGCAACTCTTGAACAACCT
AATATTTTTACAATAGTTCCTAATGATAGCCGTTATAAGCTAATCTTTGGATTAGAAATTATTCGTCAGCGAATGCTAGA
ATTGGAAAAAAATTCTGTATTGACGGCAACCTCGTTTGGTCGTTATCAAGGTCAATATCAATCTTCTGGGAAACTATTTT
ATGGTTTATTTGATCCCCACATACAAGGAAATTTTGTTTCTTTAAAAAGAAAGATTTGTGTTTATCAACCGGCAAACAAG
TTTTGTGTTAAAAATCTGATGATGCCTTCCCCGACTATCGAAACAGGTGGCCCTGTCTCAATAAATTCAGAAATGCGTGC
TTTTCTAACTCTGTGTCGAGAAAAGCAAAAAACGATACTTTATATTAACTGTCAAGACAAATGTCCAAGCGTAGGATTGA
TAGCAGGAGATGACTCTTATCGTTGTCAAGCTATTGAAACATTAGCAGAAGAATTTGCAAATACTTTATTTTTAATTACT
CTAACCCATGATCACCCTTTTTATGAGCAAATAGGACATCAGATAGACACATTAAATAGTCAGCTGGTCAAAAAGGCTAT
ATTTGATCAAATTTTTAATCCTAATTTTCGTCAATTTGAGAATTATATACTGCCTACAGAGGAGATAAAAAAATGGATGG
TAATTACTTTTGATGTGATTCATGCAAAAAAATTTAGCAATTGTGACCATTTTTCGGATGCACAAGAACGTGATTTTTTT
ATTGAAGAATGTCATCTAGCATTAATACAAAATGAAGAAATGCTTCGATTAGGGTATTCAATTTATCATGATACAGAGCA
TTTTAAAAAAGAATTATTGAGGCAAATCTTTATAGAGGATAAGCAAAAAAGTGGGAACTCCGTACCAGAAAAAATGGTTC
TTATAAAAGAAGGTCAAAAATATAGATTTAATCTAAAACATTGGTGCTTGATATTAACGGATCAAATTCATGACATTTTA
TTCAATAAACAAAAAGTTCTTTCTCCAAAAGAAAAACGGATTTTTATTCGCCTTTTTTATAACTATCTAACCATGCAATT
ATTAATTTTTATTGAACCTAAATTTCTAAATATGAGTTCTACAAATTCAACCGATAGATCCATTAGCTTTGAAGAAATGT
TTGCGCATGAGTTGATAGTGAAGGGATTGGAAGATAATCCTGAAATGATAGCTCATTTTGAAATGTCTATCCATTTGCGT
GCTATGATGATTTGTAAAAGAGCCGTTGGCGAAAAGCAACTGAATCGACTTTTAGAAACAATTTTGTTTATGCTTGATCA
CAAAGACCAAATAAAAACATTATTTGCAAAAGTATTTCCGAATGTAAATTTTGAAAATGATATATTAGAGAAAACGAAAA
AATCTTCACTTCCAAGTTTATTTCAAAAGGAACAATTTAAAAATTTTCAAATGGAGCACGTTTTACCAGAATTGATGAAA
TCTAAAGAATTTCAAAAATATTTAAAAGAAACTGTTTTTTCGGTTTTTTTAGGAAGTGAAAAGTTCCAAGAAATTTTTCA
GTCCGAAACATTTAAATATTATTTGGGAAAAACTGTGAATTTGCCTGATTTGAATGATGAGCATGCAATTAATGAATTTT
TACAAACTCAAACTCAAGCTATTGATTCAGCATTAGCAAGCCCTGATTGTCAAACACTTTTAATCCAAGCATTTTTGAAG
GAAACCGCTACTTTAAAAGAATATTTAGAAACATTTATTTTGCAACAAATCAAAAATATTAAATATTAG

Upstream 100 bases:

>100_bases
GAGTTAATCAAACGAGACATACTTGAATCAGCTATAGAGTAAAAGTTAGTTGAGTAAGAGGAAGGATAATTTTTGTAATA
ATTAACATTCAGGATAACAT

Downstream 100 bases:

>100_bases
TTGTTTAAAAGCAATTTTTTTTGATTAGAATGAAATTTGAATGCCTTAACAAGTATTTAAATTGATTGTTAGATGAAAAT
TTTCCAATTTTTAGTCCTTT

Product: hypothetical protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 742; Mature: 742

Protein sequence:

>742_residues
MLGLSFIFSKTESAYLEGCKELEWKVVRYEELIKQQIEILGKLLLKTDGLIEYVVKHISNENVKNTLFPIIQHLFSQTFS
QETSRFNEIYLDQKRQSYKKIISLLRKALDYFEKNRHELIARNVLTLGYKFYSQIRFNNCGTEIFNNLMEFGKKATLEQP
NIFTIVPNDSRYKLIFGLEIIRQRMLELEKNSVLTATSFGRYQGQYQSSGKLFYGLFDPHIQGNFVSLKRKICVYQPANK
FCVKNLMMPSPTIETGGPVSINSEMRAFLTLCREKQKTILYINCQDKCPSVGLIAGDDSYRCQAIETLAEEFANTLFLIT
LTHDHPFYEQIGHQIDTLNSQLVKKAIFDQIFNPNFRQFENYILPTEEIKKWMVITFDVIHAKKFSNCDHFSDAQERDFF
IEECHLALIQNEEMLRLGYSIYHDTEHFKKELLRQIFIEDKQKSGNSVPEKMVLIKEGQKYRFNLKHWCLILTDQIHDIL
FNKQKVLSPKEKRIFIRLFYNYLTMQLLIFIEPKFLNMSSTNSTDRSISFEEMFAHELIVKGLEDNPEMIAHFEMSIHLR
AMMICKRAVGEKQLNRLLETILFMLDHKDQIKTLFAKVFPNVNFENDILEKTKKSSLPSLFQKEQFKNFQMEHVLPELMK
SKEFQKYLKETVFSVFLGSEKFQEIFQSETFKYYLGKTVNLPDLNDEHAINEFLQTQTQAIDSALASPDCQTLLIQAFLK
ETATLKEYLETFILQQIKNIKY

Sequences:

>Translated_742_residues
MLGLSFIFSKTESAYLEGCKELEWKVVRYEELIKQQIEILGKLLLKTDGLIEYVVKHISNENVKNTLFPIIQHLFSQTFS
QETSRFNEIYLDQKRQSYKKIISLLRKALDYFEKNRHELIARNVLTLGYKFYSQIRFNNCGTEIFNNLMEFGKKATLEQP
NIFTIVPNDSRYKLIFGLEIIRQRMLELEKNSVLTATSFGRYQGQYQSSGKLFYGLFDPHIQGNFVSLKRKICVYQPANK
FCVKNLMMPSPTIETGGPVSINSEMRAFLTLCREKQKTILYINCQDKCPSVGLIAGDDSYRCQAIETLAEEFANTLFLIT
LTHDHPFYEQIGHQIDTLNSQLVKKAIFDQIFNPNFRQFENYILPTEEIKKWMVITFDVIHAKKFSNCDHFSDAQERDFF
IEECHLALIQNEEMLRLGYSIYHDTEHFKKELLRQIFIEDKQKSGNSVPEKMVLIKEGQKYRFNLKHWCLILTDQIHDIL
FNKQKVLSPKEKRIFIRLFYNYLTMQLLIFIEPKFLNMSSTNSTDRSISFEEMFAHELIVKGLEDNPEMIAHFEMSIHLR
AMMICKRAVGEKQLNRLLETILFMLDHKDQIKTLFAKVFPNVNFENDILEKTKKSSLPSLFQKEQFKNFQMEHVLPELMK
SKEFQKYLKETVFSVFLGSEKFQEIFQSETFKYYLGKTVNLPDLNDEHAINEFLQTQTQAIDSALASPDCQTLLIQAFLK
ETATLKEYLETFILQQIKNIKY
>Mature_742_residues
MLGLSFIFSKTESAYLEGCKELEWKVVRYEELIKQQIEILGKLLLKTDGLIEYVVKHISNENVKNTLFPIIQHLFSQTFS
QETSRFNEIYLDQKRQSYKKIISLLRKALDYFEKNRHELIARNVLTLGYKFYSQIRFNNCGTEIFNNLMEFGKKATLEQP
NIFTIVPNDSRYKLIFGLEIIRQRMLELEKNSVLTATSFGRYQGQYQSSGKLFYGLFDPHIQGNFVSLKRKICVYQPANK
FCVKNLMMPSPTIETGGPVSINSEMRAFLTLCREKQKTILYINCQDKCPSVGLIAGDDSYRCQAIETLAEEFANTLFLIT
LTHDHPFYEQIGHQIDTLNSQLVKKAIFDQIFNPNFRQFENYILPTEEIKKWMVITFDVIHAKKFSNCDHFSDAQERDFF
IEECHLALIQNEEMLRLGYSIYHDTEHFKKELLRQIFIEDKQKSGNSVPEKMVLIKEGQKYRFNLKHWCLILTDQIHDIL
FNKQKVLSPKEKRIFIRLFYNYLTMQLLIFIEPKFLNMSSTNSTDRSISFEEMFAHELIVKGLEDNPEMIAHFEMSIHLR
AMMICKRAVGEKQLNRLLETILFMLDHKDQIKTLFAKVFPNVNFENDILEKTKKSSLPSLFQKEQFKNFQMEHVLPELMK
SKEFQKYLKETVFSVFLGSEKFQEIFQSETFKYYLGKTVNLPDLNDEHAINEFLQTQTQAIDSALASPDCQTLLIQAFLK
ETATLKEYLETFILQQIKNIKY

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 87341; Mature: 87341

Theoretical pI: Translated: 7.72; Mature: 7.72

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.8 %Cys     (Translated Protein)
2.6 %Met     (Translated Protein)
4.3 %Cys+Met (Translated Protein)
1.8 %Cys     (Mature Protein)
2.6 %Met     (Mature Protein)
4.3 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MLGLSFIFSKTESAYLEGCKELEWKVVRYEELIKQQIEILGKLLLKTDGLIEYVVKHISN
CCCHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHCC
ENVKNTLFPIIQHLFSQTFSQETSRFNEIYLDQKRQSYKKIISLLRKALDYFEKNRHELI
CCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
ARNVLTLGYKFYSQIRFNNCGTEIFNNLMEFGKKATLEQPNIFTIVPNDSRYKLIFGLEI
HHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHCCCCCCCCCCEEEEECCCCCEEEEECHHH
IRQRMLELEKNSVLTATSFGRYQGQYQSSGKLFYGLFDPHIQGNFVSLKRKICVYQPANK
HHHHHHHHHCCCEEEEECCHHHCCCCCCCCCEEEEEECCCCCCCHHHHHHHEEEECCCHH
FCVKNLMMPSPTIETGGPVSINSEMRAFLTLCREKQKTILYINCQDKCPSVGLIAGDDSY
HHHHHCCCCCCCCCCCCCEEECHHHHHHHHHHHCCCCEEEEEEECCCCCCCEEEECCCCH
RCQAIETLAEEFANTLFLITLTHDHPFYEQIGHQIDTLNSQLVKKAIFDQIFNPNFRQFE
HHHHHHHHHHHHCCEEEEEEEECCCCHHHHHCHHHHHHHHHHHHHHHHHHHCCCCHHHHH
NYILPTEEIKKWMVITFDVIHAKKFSNCDHFSDAQERDFFIEECHLALIQNEEMLRLGYS
HCCCCHHHHHHHHEEEHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHCCCHHHHHHHH
IYHDTEHFKKELLRQIFIEDKQKSGNSVPEKMVLIKEGQKYRFNLKHWCLILTDQIHDIL
HHCCHHHHHHHHHHHHHHHHHHCCCCCCCHHEEEEECCCCEEECHHHEEEEHHHHHHHHH
FNKQKVLSPKEKRIFIRLFYNYLTMQLLIFIEPKFLNMSSTNSTDRSISFEEMFAHELIV
HCCHHHCCCHHHHHHHHHHHHHHHHHHHHHCCCCEECCCCCCCCCCCCCHHHHHHHHHHH
KGLEDNPEMIAHFEMSIHLRAMMICKRAVGEKQLNRLLETILFMLDHKDQIKTLFAKVFP
HCCCCCCHHEEEEHHHHHHHHHHHHHHHHCHHHHHHHHHHHHHHHCCHHHHHHHHHHHCC
NVNFENDILEKTKKSSLPSLFQKEQFKNFQMEHVLPELMKSKEFQKYLKETVFSVFLGSE
CCCCCHHHHHHHHHCCCHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHCCH
KFQEIFQSETFKYYLGKTVNLPDLNDEHAINEFLQTQTQAIDSALASPDCQTLLIQAFLK
HHHHHHHCCCHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHH
ETATLKEYLETFILQQIKNIKY
HHHHHHHHHHHHHHHHHHHCCC
>Mature Secondary Structure
MLGLSFIFSKTESAYLEGCKELEWKVVRYEELIKQQIEILGKLLLKTDGLIEYVVKHISN
CCCHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHCC
ENVKNTLFPIIQHLFSQTFSQETSRFNEIYLDQKRQSYKKIISLLRKALDYFEKNRHELI
CCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
ARNVLTLGYKFYSQIRFNNCGTEIFNNLMEFGKKATLEQPNIFTIVPNDSRYKLIFGLEI
HHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHCCCCCCCCCCEEEEECCCCCEEEEECHHH
IRQRMLELEKNSVLTATSFGRYQGQYQSSGKLFYGLFDPHIQGNFVSLKRKICVYQPANK
HHHHHHHHHCCCEEEEECCHHHCCCCCCCCCEEEEEECCCCCCCHHHHHHHEEEECCCHH
FCVKNLMMPSPTIETGGPVSINSEMRAFLTLCREKQKTILYINCQDKCPSVGLIAGDDSY
HHHHHCCCCCCCCCCCCCEEECHHHHHHHHHHHCCCCEEEEEEECCCCCCCEEEECCCCH
RCQAIETLAEEFANTLFLITLTHDHPFYEQIGHQIDTLNSQLVKKAIFDQIFNPNFRQFE
HHHHHHHHHHHHCCEEEEEEEECCCCHHHHHCHHHHHHHHHHHHHHHHHHHCCCCHHHHH
NYILPTEEIKKWMVITFDVIHAKKFSNCDHFSDAQERDFFIEECHLALIQNEEMLRLGYS
HCCCCHHHHHHHHEEEHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHCCCHHHHHHHH
IYHDTEHFKKELLRQIFIEDKQKSGNSVPEKMVLIKEGQKYRFNLKHWCLILTDQIHDIL
HHCCHHHHHHHHHHHHHHHHHHCCCCCCCHHEEEEECCCCEEECHHHEEEEHHHHHHHHH
FNKQKVLSPKEKRIFIRLFYNYLTMQLLIFIEPKFLNMSSTNSTDRSISFEEMFAHELIV
HCCHHHCCCHHHHHHHHHHHHHHHHHHHHHCCCCEECCCCCCCCCCCCCHHHHHHHHHHH
KGLEDNPEMIAHFEMSIHLRAMMICKRAVGEKQLNRLLETILFMLDHKDQIKTLFAKVFP
HCCCCCCHHEEEEHHHHHHHHHHHHHHHHCHHHHHHHHHHHHHHHCCHHHHHHHHHHHCC
NVNFENDILEKTKKSSLPSLFQKEQFKNFQMEHVLPELMKSKEFQKYLKETVFSVFLGSE
CCCCCHHHHHHHHHCCCHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHCCH
KFQEIFQSETFKYYLGKTVNLPDLNDEHAINEFLQTQTQAIDSALASPDCQTLLIQAFLK
HHHHHHHCCCHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHH
ETATLKEYLETFILQQIKNIKY
HHHHHHHHHHHHHHHHHHHCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA