BacMap

Definition	Leptospira interrogans serovar Copenhageni str. Fiocruz L1-130 chromosome chromosome I, complete sequence.
Accession	NC_005823
Length	4,277,185

Click here to switch to the map view.

The map label for this gene is gspF

Identifier: 45657445

GI number: 45657445

Start: 1933198

End: 1934424

Strand: Direct

Name: gspF

Synonym: LIC11572

Alternate gene names: 45657445

Gene position: 1933198-1934424 (Clockwise)

Preceding gene: 45657444

Following gene: 45657446

Centisome position: 45.2

GC content: 38.39

Gene sequence:

>1227_bases
ATGGCGATTTATTCTTACGTTGCATTTAATAAGAAGGGTAAAGAAGAAAAAGGAATTATAGACGCGGCTTCTCTTCAAGC
TGCAAGATCTAAATTAAAAAACAAAGGTCTTTATGTTCGTAGTATTTCCGAAGATTCCGAAAGAAAGGATCGGGAACTAT
TTCCTTTTTTAGCAAAATATCTTTATCGAATCCCACGTAAAGAAGTAGGTCTTTTTTCAAGACAACTGGCCACGTTACTT
GGGGCAGGGATTCCACTTGATAAATCTTTATCGAGTATCGTAGAACAAACTGAAAATCAGAACTTCAGAAAAGTAATTAC
CGGAATGCAAGCAAACATTACGGAAGGTTCTTCCTTGTCCGAAGCGATGAAAAAACATCCAGATGTGTTTCCGAGTCAGT
TTCCGTCTCTCGTCGCGGTTGGTGAAAAAACAGGAGATTATGAAGCTACTCTCACGCGACTTGCGGAACTAGAAGAAAAA
TCCAGCGAACTAAAAGCGAAAGTACAAGTGGCAATGGTGTATCCATTTATTATGGGTTCCTTATCTATTTTTGTGACGAT
TTTTTTATTAACCGTAGTTATCCCTCAGATTCAGGAACTGTTTTTACAATTCGATGCAAAACTTCCTCTGATTACCAGAA
TTGTAATCGGAGTTTCTGACTTTCTCATTGGGTTTTGGTGGTTAATTCTTACTTTGGGTTTTGGGGGAATTGTAGGTTTT
ATCTATTATAAAAACACTCCTAAAGGAAAACGAAACTGGGACGAGTTCGTTTTGAAAATTCCAATATTAGGATCTCTTGC
GCGTAAGGTTCTTGTAAGTAGTTTTGCAAGAAACATCGGAATTCTTTTGAGCAACCGGGTTCCTCTGATTACTACTCTTG
TCATCGTAGAAAAGATAGTAGATCATTCTATCTTTGGTGAGGAAATTAAAAACGCAGTGGAAAAAATCAAAGAAGGAGAA
AAACTTTCTTCTTCATTTGGTGGGTCAGTGATTTTACCTCAGATGGTTTTAGGTATGATCGCCGCCGGAGAGGTTTCGGA
TCGAGTTCCGGAAATGATGAATAAACTCGCGGATATTTACGATTCGGAAGTGGATACCGCAATCAAAACGATGACCCAAT
CGATGGAACCTCTAATGATTGTGGTTATGGGTCTTTTGATTGGAACGATTATGGCTTCGATCATGGTCCCAATGTACAAC
TTGACGCAACAACTTCAAAATATATAG

Upstream 100 bases:

>100_bases
CTCTCGAGCATGGGTTTCGAACTCTTAAAGATTACGGAATTAGAAAGGTAGTTGATGGTGTAACTACAATCGACGAAGTT
CTCAGGGTAACTTAAGCGTC

Downstream 100 bases:

>100_bases
TTTAGATTAAGGAGAATTCAATTGAATCTGTCCAAATTAAAAAGAAAATATAGAAAAGGTCTAACGCTGATCGAACTCGC
AGTCGTAGTGATTATCCTAG

Product: general secretory pathway protein F

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 408; Mature: 407

Protein sequence:

>408_residues
MAIYSYVAFNKKGKEEKGIIDAASLQAARSKLKNKGLYVRSISEDSERKDRELFPFLAKYLYRIPRKEVGLFSRQLATLL
GAGIPLDKSLSSIVEQTENQNFRKVITGMQANITEGSSLSEAMKKHPDVFPSQFPSLVAVGEKTGDYEATLTRLAELEEK
SSELKAKVQVAMVYPFIMGSLSIFVTIFLLTVVIPQIQELFLQFDAKLPLITRIVIGVSDFLIGFWWLILTLGFGGIVGF
IYYKNTPKGKRNWDEFVLKIPILGSLARKVLVSSFARNIGILLSNRVPLITTLVIVEKIVDHSIFGEEIKNAVEKIKEGE
KLSSSFGGSVILPQMVLGMIAAGEVSDRVPEMMNKLADIYDSEVDTAIKTMTQSMEPLMIVVMGLLIGTIMASIMVPMYN
LTQQLQNI

Sequences:

>Translated_408_residues
MAIYSYVAFNKKGKEEKGIIDAASLQAARSKLKNKGLYVRSISEDSERKDRELFPFLAKYLYRIPRKEVGLFSRQLATLL
GAGIPLDKSLSSIVEQTENQNFRKVITGMQANITEGSSLSEAMKKHPDVFPSQFPSLVAVGEKTGDYEATLTRLAELEEK
SSELKAKVQVAMVYPFIMGSLSIFVTIFLLTVVIPQIQELFLQFDAKLPLITRIVIGVSDFLIGFWWLILTLGFGGIVGF
IYYKNTPKGKRNWDEFVLKIPILGSLARKVLVSSFARNIGILLSNRVPLITTLVIVEKIVDHSIFGEEIKNAVEKIKEGE
KLSSSFGGSVILPQMVLGMIAAGEVSDRVPEMMNKLADIYDSEVDTAIKTMTQSMEPLMIVVMGLLIGTIMASIMVPMYN
LTQQLQNI
>Mature_407_residues
AIYSYVAFNKKGKEEKGIIDAASLQAARSKLKNKGLYVRSISEDSERKDRELFPFLAKYLYRIPRKEVGLFSRQLATLLG
AGIPLDKSLSSIVEQTENQNFRKVITGMQANITEGSSLSEAMKKHPDVFPSQFPSLVAVGEKTGDYEATLTRLAELEEKS
SELKAKVQVAMVYPFIMGSLSIFVTIFLLTVVIPQIQELFLQFDAKLPLITRIVIGVSDFLIGFWWLILTLGFGGIVGFI
YYKNTPKGKRNWDEFVLKIPILGSLARKVLVSSFARNIGILLSNRVPLITTLVIVEKIVDHSIFGEEIKNAVEKIKEGEK
LSSSFGGSVILPQMVLGMIAAGEVSDRVPEMMNKLADIYDSEVDTAIKTMTQSMEPLMIVVMGLLIGTIMASIMVPMYNL
TQQLQNI

Specific function: Involved in a general secretion pathway (GSP) for the export of proteins. Required for the translocation of a variety of enzymes across the outer membrane [H]

COG id: COG1459

COG function: function code NU; Type II secretory pathway, component PulF

Gene ontology:

Cell location: Cell inner membrane; Multi-pass membrane protein (Probable) [H]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the GSP F family [H]

Homologues:

Organism=Escherichia coli, GI1789724, Length=399, Percent_Identity=30.3258145363409, Blast_Score=206, Evalue=2e-54,
Organism=Escherichia coli, GI1786295, Length=328, Percent_Identity=22.5609756097561, Blast_Score=111, Evalue=7e-26,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003004
- InterPro:   IPR011850
- InterPro:   IPR018076
- InterPro:   IPR001992 [H]

Pfam domain/function: PF00482 GSPII_F [H]

EC number: NA

Molecular weight: Translated: 45363; Mature: 45232

Theoretical pI: Translated: 9.42; Mature: 9.42

Prosite motif: PS00874 T2SP_F

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.0 %Cys     (Translated Protein)
3.9 %Met     (Translated Protein)
3.9 %Cys+Met (Translated Protein)
0.0 %Cys     (Mature Protein)
3.7 %Met     (Mature Protein)
3.7 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MAIYSYVAFNKKGKEEKGIIDAASLQAARSKLKNKGLYVRSISEDSERKDRELFPFLAKY
CCEEHEEHCCCCCCHHCCCHHHHHHHHHHHHHHHCCCEEEECCCCHHHHHHHHHHHHHHH
LYRIPRKEVGLFSRQLATLLGAGIPLDKSLSSIVEQTENQNFRKVITGMQANITEGSSLS
HHHCCHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHCCCHHHHHHHCCCCCCCCCCHHH
EAMKKHPDVFPSQFPSLVAVGEKTGDYEATLTRLAELEEKSSELKAKVQVAMVYPFIMGS
HHHHHCCCCCHHHCCHHEEECCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
LSIFVTIFLLTVVIPQIQELFLQFDAKLPLITRIVIGVSDFLIGFWWLILTLGFGGIVGF
HHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEE
IYYKNTPKGKRNWDEFVLKIPILGSLARKVLVSSFARNIGILLSNRVPLITTLVIVEKIV
HEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHH
DHSIFGEEIKNAVEKIKEGEKLSSSFGGSVILPQMVLGMIAAGEVSDRVPEMMNKLADIY
HHHHHHHHHHHHHHHHHCCHHHHHHCCCCCHHHHHHHHHHHCCHHHHHHHHHHHHHHHHH
DSEVDTAIKTMTQSMEPLMIVVMGLLIGTIMASIMVPMYNLTQQLQNI
HHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC
>Mature Secondary Structure 
AIYSYVAFNKKGKEEKGIIDAASLQAARSKLKNKGLYVRSISEDSERKDRELFPFLAKY
CEEHEEHCCCCCCHHCCCHHHHHHHHHHHHHHHCCCEEEECCCCHHHHHHHHHHHHHHH
LYRIPRKEVGLFSRQLATLLGAGIPLDKSLSSIVEQTENQNFRKVITGMQANITEGSSLS
HHHCCHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHCCCHHHHHHHCCCCCCCCCCHHH
EAMKKHPDVFPSQFPSLVAVGEKTGDYEATLTRLAELEEKSSELKAKVQVAMVYPFIMGS
HHHHHCCCCCHHHCCHHEEECCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
LSIFVTIFLLTVVIPQIQELFLQFDAKLPLITRIVIGVSDFLIGFWWLILTLGFGGIVGF
HHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEE
IYYKNTPKGKRNWDEFVLKIPILGSLARKVLVSSFARNIGILLSNRVPLITTLVIVEKIV
HEECCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHHH
DHSIFGEEIKNAVEKIKEGEKLSSSFGGSVILPQMVLGMIAAGEVSDRVPEMMNKLADIY
HHHHHHHHHHHHHHHHHCCHHHHHHCCCCCHHHHHHHHHHHCCHHHHHHHHHHHHHHHHH
DSEVDTAIKTMTQSMEPLMIVVMGLLIGTIMASIMVPMYNLTQQLQNI
HHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC

PDB accession: NA

Resolution: NA

Structure class: Alpha

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 1588814; 10984043 [H]