BacMap

Definition	Geobacter sulfurreducens PCA chromosome, complete genome.
Accession	NC_002939
Length	3,814,139

Click here to switch to the map view.

The map label for this gene is intR [C]

Identifier: 39997216

GI number: 39997216

Start: 2335994

End: 2337334

Strand: Direct

Name: intR [C]

Synonym: GSU2118

Alternate gene names: 39997216

Gene position: 2335994-2337334 (Clockwise)

Preceding gene: 39997215

Following gene: 39997217

Centisome position: 61.25

GC content: 57.42

Gene sequence:

>1341_bases
ATGGAAAAAGTGGGTGAAAAGATCAAGCGTCGGACGTTCTGCTTCGCCAAGACCTTCTACTGGCTGGACGAGAAGACGAA
GGCCCACTTCACGGCGCTGGAGGGAAGCGACTACAAGCCGGAACCGGAGCACGTCTACTTCGGTGAGTATTGCGAACAGT
GGATGGAGCGGAAGATTCCGACCTTTTCGTCGGTGACGAAGCAAAGGGATTACCGGGAAGCGCTCACCTCCCGCATCCTG
CCCTACTTCGGGGAGATGACCTTCTCCCAGGTTACCGCCACGGCGGTAGAGACGTTCATTGACAATCTAAAGAGAGTAAA
CCGTGCCAAAAATCCCAAGAAGACCAAGGGGGCAAAGCCCCTGTCGGTGAAACGGGTCAAAAACATCATCGGTCCAATGT
CAAAGGTCTGGGAATCGTCCTGCAACGACTACAACTGGAATCTCCGCGATCCGTTTTCCGCAGTAACCCAGAAGTACACG
GAGTTGACTGACAGGGCGCTTCAGGAAAAAGAGCGGCAGGCCGCTCTGAGGAGTGATGAGGAGGAAGATGTCTCGACGAG
GGAGATCTTCCTGCTTGAAGAGTGGCAGATACTCTGTTCCTACATCGATCCCCACTATTACCCCGTGCTGGAACTGCTGA
TGCTGGGGATGATCGGCTCGGAGTTGGAGGCACTGCAAAAGCGGCACATAAAGGGTGGCGTGCTGACAGTCCGCTGTGCG
GTAGCGAGGGACCGGAAGGGGATGCGGCACCTGAAGTTCAAGCCGAAGAACTGGTATCGCAAGCGGGACGTCCCCCTGAC
CGGCAGAGTACAAAGCCTTCTGGAACAGGCGATGGCTACGGCGACGAGGGACGGGGTTGTTACCTTCGCCAACGACATCG
CCATCCCGGCCAACCAGTTCGTCCTCACCATGAAGGACGGCAGCCCCTTCAACTACAACTCATTCCGCAAGACGGTGTGG
AACAAGGCCTTGAAGGCGGCAGGCATGGAGCCTCGGGTTCCTTATGCGGCCCGGCACACTCTGGTGCAGTGGTCGCTTCT
GATCGGAATGACCAAGACCCGGCTCGTGGACCTGATGGGTCATTCGACCAAGAAGATGATCGACGAGGTGTACGGGAGCT
ATCGGCAGGGACTGGTGGAGGAGAGGGAGCGGATTCTGGATTACCTGGGGGAAGACTTCCTCGCCCTGGAAGAGATGAAG
CTTGCGTTCCCCGAGCGCTACCGGCGGCGGATGGCAACGACGGAGCCGGCCCATGAAACGGCGAAAGCCCCGGGCCTTCC
CGCCACTTTTGGTCAAAGTTTTGGTCAAAGCCAGGGGCTCTATCCGGATAACTACCCGTAA

Upstream 100 bases:

>100_bases
GAAGTACATCTACATCTCCATGAACTACTACAAGCAGCGGCTGCGCTTTCCCACAGACCGGGTGGATACCCCGGAGAACT
GGGAGGAGCTGCGGGAGTTC

Downstream 100 bases:

>100_bases
ACACGGGGGAAAGACTGGAGCGGGAAACGGGATTCGAACCCGCGACCTTCAGCTTGGGAAGCTGACAATTTGATGTTTCA
GCGTCTTTCAAAAAGTTCCT

Product: integrative genetic element Gsu21, integrase

Products: NA

Alternate protein names: Phage Integrase; Integrase; Pore-Forming Cytotoxin Integrase; Integrase Family Protein; Integrative Genetic Element

Number of amino acids: Translated: 446; Mature: 446

Protein sequence:

>446_residues
MEKVGEKIKRRTFCFAKTFYWLDEKTKAHFTALEGSDYKPEPEHVYFGEYCEQWMERKIPTFSSVTKQRDYREALTSRIL
PYFGEMTFSQVTATAVETFIDNLKRVNRAKNPKKTKGAKPLSVKRVKNIIGPMSKVWESSCNDYNWNLRDPFSAVTQKYT
ELTDRALQEKERQAALRSDEEEDVSTREIFLLEEWQILCSYIDPHYYPVLELLMLGMIGSELEALQKRHIKGGVLTVRCA
VARDRKGMRHLKFKPKNWYRKRDVPLTGRVQSLLEQAMATATRDGVVTFANDIAIPANQFVLTMKDGSPFNYNSFRKTVW
NKALKAAGMEPRVPYAARHTLVQWSLLIGMTKTRLVDLMGHSTKKMIDEVYGSYRQGLVEERERILDYLGEDFLALEEMK
LAFPERYRRRMATTEPAHETAKAPGLPATFGQSFGQSQGLYPDNYP

Sequences:

>Translated_446_residues
MEKVGEKIKRRTFCFAKTFYWLDEKTKAHFTALEGSDYKPEPEHVYFGEYCEQWMERKIPTFSSVTKQRDYREALTSRIL
PYFGEMTFSQVTATAVETFIDNLKRVNRAKNPKKTKGAKPLSVKRVKNIIGPMSKVWESSCNDYNWNLRDPFSAVTQKYT
ELTDRALQEKERQAALRSDEEEDVSTREIFLLEEWQILCSYIDPHYYPVLELLMLGMIGSELEALQKRHIKGGVLTVRCA
VARDRKGMRHLKFKPKNWYRKRDVPLTGRVQSLLEQAMATATRDGVVTFANDIAIPANQFVLTMKDGSPFNYNSFRKTVW
NKALKAAGMEPRVPYAARHTLVQWSLLIGMTKTRLVDLMGHSTKKMIDEVYGSYRQGLVEERERILDYLGEDFLALEEMK
LAFPERYRRRMATTEPAHETAKAPGLPATFGQSFGQSQGLYPDNYP
>Mature_446_residues
MEKVGEKIKRRTFCFAKTFYWLDEKTKAHFTALEGSDYKPEPEHVYFGEYCEQWMERKIPTFSSVTKQRDYREALTSRIL
PYFGEMTFSQVTATAVETFIDNLKRVNRAKNPKKTKGAKPLSVKRVKNIIGPMSKVWESSCNDYNWNLRDPFSAVTQKYT
ELTDRALQEKERQAALRSDEEEDVSTREIFLLEEWQILCSYIDPHYYPVLELLMLGMIGSELEALQKRHIKGGVLTVRCA
VARDRKGMRHLKFKPKNWYRKRDVPLTGRVQSLLEQAMATATRDGVVTFANDIAIPANQFVLTMKDGSPFNYNSFRKTVW
NKALKAAGMEPRVPYAARHTLVQWSLLIGMTKTRLVDLMGHSTKKMIDEVYGSYRQGLVEERERILDYLGEDFLALEEMK
LAFPERYRRRMATTEPAHETAKAPGLPATFGQSFGQSQGLYPDNYP

Specific function: Integrase Is Necessary For Integration Of The Phage Into The Host Genome By Site-Specific Recombination. In Conjunction With Excisionase, Integrase Is Also Necessary For Excision Of The Prophage From The Host Genome (By Similarity). [C]

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: NA

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

NA

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 51650; Mature: 51650

Theoretical pI: Translated: 9.63; Mature: 9.63

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.1 %Cys     (Translated Protein)
3.4 %Met     (Translated Protein)
4.5 %Cys+Met (Translated Protein)
1.1 %Cys     (Mature Protein)
3.4 %Met     (Mature Protein)
4.5 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MEKVGEKIKRRTFCFAKTFYWLDEKTKAHFTALEGSDYKPEPEHVYFGEYCEQWMERKIP
CCHHHHHHHHHHHHHHHHHHHHCCCCCHHEEEECCCCCCCCCCEEEHHHHHHHHHHHCCC
TFSSVTKQRDYREALTSRILPYFGEMTFSQVTATAVETFIDNLKRVNRAKNPKKTKGAKP
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCC
LSVKRVKNIIGPMSKVWESSCNDYNWNLRDPFSAVTQKYTELTDRALQEKERQAALRSDE
CHHHHHHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHCCCC
EEDVSTREIFLLEEWQILCSYIDPHYYPVLELLMLGMIGSELEALQKRHIKGGVLTVRCA
CCCCCHHHEEHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEEEEH
VARDRKGMRHLKFKPKNWYRKRDVPLTGRVQSLLEQAMATATRDGVVTFANDIAIPANQF
HHHCCCCCHHCCCCCCHHHHCCCCCCHHHHHHHHHHHHHHHHCCCCEEEECCCCCCCCCE
VLTMKDGSPFNYNSFRKTVWNKALKAAGMEPRVPYAARHTLVQWSLLIGMTKTRLVDLMG
EEEECCCCCCCHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHC
HSTKKMIDEVYGSYRQGLVEERERILDYLGEDFLALEEMKLAFPERYRRRMATTEPAHET
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHCCCCCHHHH
AKAPGLPATFGQSFGQSQGLYPDNYP
HCCCCCCHHHHHHHCCCCCCCCCCCC
>Mature Secondary Structure
MEKVGEKIKRRTFCFAKTFYWLDEKTKAHFTALEGSDYKPEPEHVYFGEYCEQWMERKIP
CCHHHHHHHHHHHHHHHHHHHHCCCCCHHEEEECCCCCCCCCCEEEHHHHHHHHHHHCCC
TFSSVTKQRDYREALTSRILPYFGEMTFSQVTATAVETFIDNLKRVNRAKNPKKTKGAKP
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCCC
LSVKRVKNIIGPMSKVWESSCNDYNWNLRDPFSAVTQKYTELTDRALQEKERQAALRSDE
CHHHHHHHHHHHHHHHHHHCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHCCCC
EEDVSTREIFLLEEWQILCSYIDPHYYPVLELLMLGMIGSELEALQKRHIKGGVLTVRCA
CCCCCHHHEEHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEEEEH
VARDRKGMRHLKFKPKNWYRKRDVPLTGRVQSLLEQAMATATRDGVVTFANDIAIPANQF
HHHCCCCCHHCCCCCCHHHHCCCCCCHHHHHHHHHHHHHHHHCCCCEEEECCCCCCCCCE
VLTMKDGSPFNYNSFRKTVWNKALKAAGMEPRVPYAARHTLVQWSLLIGMTKTRLVDLMG
EEEECCCCCCCHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHC
HSTKKMIDEVYGSYRQGLVEERERILDYLGEDFLALEEMKLAFPERYRRRMATTEPAHET
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHCCCCCHHHH
AKAPGLPATFGQSFGQSQGLYPDNYP
HCCCCCCHHHHHHHCCCCCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA