BacMap

Definition	Natranaerobius thermophilus JW/NM-WN-LF, complete genome.
Accession	NC_010718
Length	3,165,557

Click here to switch to the map view.

The map label for this gene is mutS2 [H]

Identifier: 188586428

GI number: 188586428

Start: 1883987

End: 1886377

Strand: Reverse

Name: mutS2 [H]

Synonym: Nther_1813

Alternate gene names: 188586428

Gene position: 1886377-1883987 (Counterclockwise)

Preceding gene: 188586429

Following gene: 188586426

Centisome position: 59.59

GC content: 36.55

Gene sequence:

>2391_bases
TTGACGTTTAAAAAATCTATGGATACTTTGGAATTACCTAAAATAATAGACCAGTTGAAGAAAGAAACTGTTTCAACTAT
GACTAAGGAAATTTGTGACGACCTGGACCCTAGTGTAAATTATAATGAGATAAAGACCTGGTTAAAGGAGACAAGTGAAG
CTAAAGAACTATTAGCAGAACGAGACATCTCTCTTAGAGGGTTGCGGGATATCAGAAAGCAACTTCAGTTAGCTGCTAAA
GATGGCACCTTACAGGGGCCCGAACTCTTTCAAATATCTGAAATTATTGGTGTGTCTAATAGAGTAAGAAAAATAACTGA
TGATAATTTTCAAGCTAATTATCCGATTTTATCTTCATTAATATCTAAATTGCCTGAATTAAACCATCTTAAAAAAGAAC
TTGATGATAAAATTGATGAAAATGGTGAAGTAAAAGATTCAGCTAGTGTCAACTTGAGAAATATCAGGCAAAAAATTAAA
AAGCTTCAGTCCCAGGTTAAAACCAGCGTTAACCGGATACTGCAAAGTGGGGAAAAATACCTTCAAGATAAAATTGTTAC
TATGAGATACGATAGGTACGTGGTACCTGTTAAAGCGGAATATCAAAATATGGTACCAGGAATTATTCATGATCAATCAT
CTAGTGGGATGACTGTATATATAGAACCCAAAGAAGTAGTTGAAAAAAATAATGAACTAAGGCAGGCAAAGCGCGAAGAA
CATAGTGAACTCGAAAAAATATTACAGGGGTTAAGTCAGAAAATAAAAGGATATCATTATCAGCTTCATGATTCATTACA
AATTCTTGTTGAGTTAGATTTTATTTTGGCTAAAGGTTCGTTATCTCGGCGTATGAACGCCCGAGAAGCTGAACTTAATC
AAGAAAAACGATTGGAGATTATTAAAGGAAAACACCCTTTATTGGGAGAAGATGCCATACCTGTAGATGTAAAATTAGGC
GATGAATTTAATACTATGGTGATCACCGGTCCAAATACAGGTGGTAAGACGGTTAGTTTAAAGATGGTAGGTCTGTTTAC
TTTAATGACCCAATCTGGACTTCATATTCCAGCAGAACGCGGTACGGAAATGGGTGTTTTTGAACAAGTCTTTGCTGATA
TTGGAGACGAACAGGATATTGAGCAATCTCTTAGTACATTTAGTTCTCATATGTCCAATATTGTAAAAATAGTTGACCAC
GCAAATAGTGAGTCTTTGATACTTTTAGATGAGTTAGGTGCAGGCACTGACCCAACAGAAGGGTCGGCCTTGGCTATGTC
ATTGTTAGAGCATTTTCATAATTTGGGTTGTCGAAGCATAGCTACTACACATTATACTCAATTAAAAAGTTTTGCTCATG
CCCGAGAAGGTGTGGAAAATGCTTCGGTAGAGTTTGACGAAGAAACTTTGGAACCGACTTATAATTTGTTAATAGGAGTG
CCAGGCAAAAGTAATGCTTTCGTAATTTCAAGAAGACTGGGATTAAGTGACAAAATTATAAGCAATGCTAAAAGCTTTTT
AGCAGACGAAGAGATTGAAGTGGAAGAACTTATCACTTCTCTAACAGAAAAAGAAAAGTCAAGCCAGAAAATGAAAGAGG
AATTAGAACGGGAGCGGGCTAAAGTCGAGCAAGTAAAAGCCCAGCTAGAACAAGAACGAAAAGAAATTTCCAGAAAAAAA
GATGAAGTTTTGCAAAAAGCCAGAAGACAAGCTGAGGAAATTATTTCTGATGCTAAAAGAGATGCTGAAGAGTCTCTCAA
AGAAGCTAGAAAAATAGCTGAGAAAAAGTCCCATAAAGAAATGGCGGAAGTTAGCTCTAAAGTTAGAGATAAACTATCGG
GACATCAACAAAAGTTACGAGAAGAGTTGATGGATTCGGCAGACTCGGTACCTTTATCACCTGAAAAGTTAAAGCCTGGA
TTGACGGTATATATTTCTAATCTTGATAAAGAGGGTCAAATCTTACAAGTTAATCATGATAAAGGTGAAGCAGAGGTTCA
GGTAGGGATAATGAAAGTAAACGTAAATTTTTCAGATATATTTCCTTCTGAAGAAGAAAAATCTGGCTCAACCTTTTCCG
GGAATGTTAACTCTTCCTCCTCTTCAACTGGTAGAGGCAATGTTTTTGCCGGTAAAAAGGAAAGAATTTCAACTGAATTA
GATATTAGAGGAGAGCGGGTTGAAGAAGCCATAAATCAGGTTGATAAATATCTTGATGATGCTTTAGTTGCTGGATTGGC
CGAGATTAGAATAATCCATGGTAAAGGAACTGGTAACTTAAGAAAAGGAATCCAATTTCATCTAGAAGGCCACCCAATGG
TTTCTCAGTACAGATTGGGAAACAGACAAGAAGGGGGAGAAGGAGTGACTGTGGTCAAGTTAAACAATTGA

Upstream 100 bases:

>100_bases
TAGCTGAAGAGCTCAACTATCAACAACGGAGTATAACAGCACCTAGCTTAATTATAATAGTAAATGTTAAACTATCCATT
AATCTCGGGAGGAATTTAAC

Downstream 100 bases:

>100_bases
TCACATTAACCCCTAAAAATCACTTTAAATATAGTCCTTTGAATAAAAAACTCTTCCCGCGCAGTTTAGGGAAGAGTTTT
TTATTGGTACTGTTTTAATT

Product: MutS2 family protein

Products: ADP; phosphate; H+

Alternate protein names: NA

Number of amino acids: Translated: 796; Mature: 795

Protein sequence:

>796_residues
MTFKKSMDTLELPKIIDQLKKETVSTMTKEICDDLDPSVNYNEIKTWLKETSEAKELLAERDISLRGLRDIRKQLQLAAK
DGTLQGPELFQISEIIGVSNRVRKITDDNFQANYPILSSLISKLPELNHLKKELDDKIDENGEVKDSASVNLRNIRQKIK
KLQSQVKTSVNRILQSGEKYLQDKIVTMRYDRYVVPVKAEYQNMVPGIIHDQSSSGMTVYIEPKEVVEKNNELRQAKREE
HSELEKILQGLSQKIKGYHYQLHDSLQILVELDFILAKGSLSRRMNAREAELNQEKRLEIIKGKHPLLGEDAIPVDVKLG
DEFNTMVITGPNTGGKTVSLKMVGLFTLMTQSGLHIPAERGTEMGVFEQVFADIGDEQDIEQSLSTFSSHMSNIVKIVDH
ANSESLILLDELGAGTDPTEGSALAMSLLEHFHNLGCRSIATTHYTQLKSFAHAREGVENASVEFDEETLEPTYNLLIGV
PGKSNAFVISRRLGLSDKIISNAKSFLADEEIEVEELITSLTEKEKSSQKMKEELERERAKVEQVKAQLEQERKEISRKK
DEVLQKARRQAEEIISDAKRDAEESLKEARKIAEKKSHKEMAEVSSKVRDKLSGHQQKLREELMDSADSVPLSPEKLKPG
LTVYISNLDKEGQILQVNHDKGEAEVQVGIMKVNVNFSDIFPSEEEKSGSTFSGNVNSSSSSTGRGNVFAGKKERISTEL
DIRGERVEEAINQVDKYLDDALVAGLAEIRIIHGKGTGNLRKGIQFHLEGHPMVSQYRLGNRQEGGEGVTVVKLNN

Sequences:

>Translated_796_residues
MTFKKSMDTLELPKIIDQLKKETVSTMTKEICDDLDPSVNYNEIKTWLKETSEAKELLAERDISLRGLRDIRKQLQLAAK
DGTLQGPELFQISEIIGVSNRVRKITDDNFQANYPILSSLISKLPELNHLKKELDDKIDENGEVKDSASVNLRNIRQKIK
KLQSQVKTSVNRILQSGEKYLQDKIVTMRYDRYVVPVKAEYQNMVPGIIHDQSSSGMTVYIEPKEVVEKNNELRQAKREE
HSELEKILQGLSQKIKGYHYQLHDSLQILVELDFILAKGSLSRRMNAREAELNQEKRLEIIKGKHPLLGEDAIPVDVKLG
DEFNTMVITGPNTGGKTVSLKMVGLFTLMTQSGLHIPAERGTEMGVFEQVFADIGDEQDIEQSLSTFSSHMSNIVKIVDH
ANSESLILLDELGAGTDPTEGSALAMSLLEHFHNLGCRSIATTHYTQLKSFAHAREGVENASVEFDEETLEPTYNLLIGV
PGKSNAFVISRRLGLSDKIISNAKSFLADEEIEVEELITSLTEKEKSSQKMKEELERERAKVEQVKAQLEQERKEISRKK
DEVLQKARRQAEEIISDAKRDAEESLKEARKIAEKKSHKEMAEVSSKVRDKLSGHQQKLREELMDSADSVPLSPEKLKPG
LTVYISNLDKEGQILQVNHDKGEAEVQVGIMKVNVNFSDIFPSEEEKSGSTFSGNVNSSSSSTGRGNVFAGKKERISTEL
DIRGERVEEAINQVDKYLDDALVAGLAEIRIIHGKGTGNLRKGIQFHLEGHPMVSQYRLGNRQEGGEGVTVVKLNN
>Mature_795_residues
TFKKSMDTLELPKIIDQLKKETVSTMTKEICDDLDPSVNYNEIKTWLKETSEAKELLAERDISLRGLRDIRKQLQLAAKD
GTLQGPELFQISEIIGVSNRVRKITDDNFQANYPILSSLISKLPELNHLKKELDDKIDENGEVKDSASVNLRNIRQKIKK
LQSQVKTSVNRILQSGEKYLQDKIVTMRYDRYVVPVKAEYQNMVPGIIHDQSSSGMTVYIEPKEVVEKNNELRQAKREEH
SELEKILQGLSQKIKGYHYQLHDSLQILVELDFILAKGSLSRRMNAREAELNQEKRLEIIKGKHPLLGEDAIPVDVKLGD
EFNTMVITGPNTGGKTVSLKMVGLFTLMTQSGLHIPAERGTEMGVFEQVFADIGDEQDIEQSLSTFSSHMSNIVKIVDHA
NSESLILLDELGAGTDPTEGSALAMSLLEHFHNLGCRSIATTHYTQLKSFAHAREGVENASVEFDEETLEPTYNLLIGVP
GKSNAFVISRRLGLSDKIISNAKSFLADEEIEVEELITSLTEKEKSSQKMKEELERERAKVEQVKAQLEQERKEISRKKD
EVLQKARRQAEEIISDAKRDAEESLKEARKIAEKKSHKEMAEVSSKVRDKLSGHQQKLREELMDSADSVPLSPEKLKPGL
TVYISNLDKEGQILQVNHDKGEAEVQVGIMKVNVNFSDIFPSEEEKSGSTFSGNVNSSSSSTGRGNVFAGKKERISTELD
IRGERVEEAINQVDKYLDDALVAGLAEIRIIHGKGTGNLRKGIQFHLEGHPMVSQYRLGNRQEGGEGVTVVKLNN

Specific function: This Protein Is Involved In The Repair Of Mismatches In DNA. It Is Possible That It Carries Out The Mismatch Recognition Step. This Protein Has A Weak Atpase Activity. [C]

COG id: COG1193

COG function: function code L; Mismatch repair ATPase (MutS family)

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 Smr domain [H]

Homologues:

Organism=Homo sapiens, GI284813531, Length=474, Percent_Identity=25.3164556962025, Blast_Score=122, Evalue=9e-28,
Organism=Homo sapiens, GI36949366, Length=386, Percent_Identity=26.1658031088083, Blast_Score=115, Evalue=1e-25,
Organism=Homo sapiens, GI4504191, Length=226, Percent_Identity=30.5309734513274, Blast_Score=110, Evalue=4e-24,
Organism=Homo sapiens, GI26638666, Length=267, Percent_Identity=32.2097378277154, Blast_Score=106, Evalue=1e-22,
Organism=Homo sapiens, GI4505253, Length=267, Percent_Identity=32.2097378277154, Blast_Score=106, Evalue=1e-22,
Organism=Homo sapiens, GI26638664, Length=268, Percent_Identity=32.089552238806, Blast_Score=101, Evalue=3e-21,
Organism=Homo sapiens, GI262231786, Length=167, Percent_Identity=35.9281437125749, Blast_Score=94, Evalue=7e-19,
Organism=Homo sapiens, GI4557761, Length=153, Percent_Identity=32.6797385620915, Blast_Score=86, Evalue=1e-16,
Organism=Escherichia coli, GI1789089, Length=250, Percent_Identity=27.6, Blast_Score=110, Evalue=4e-25,
Organism=Caenorhabditis elegans, GI17534743, Length=345, Percent_Identity=25.2173913043478, Blast_Score=105, Evalue=9e-23,
Organism=Caenorhabditis elegans, GI17508445, Length=218, Percent_Identity=27.9816513761468, Blast_Score=98, Evalue=2e-20,
Organism=Caenorhabditis elegans, GI17508447, Length=266, Percent_Identity=27.8195488721804, Blast_Score=85, Evalue=2e-16,
Organism=Caenorhabditis elegans, GI17539736, Length=195, Percent_Identity=24.6153846153846, Blast_Score=75, Evalue=2e-13,
Organism=Saccharomyces cerevisiae, GI6324482, Length=233, Percent_Identity=28.755364806867, Blast_Score=102, Evalue=3e-22,
Organism=Saccharomyces cerevisiae, GI6319935, Length=187, Percent_Identity=34.2245989304813, Blast_Score=100, Evalue=8e-22,
Organism=Saccharomyces cerevisiae, GI6320302, Length=298, Percent_Identity=28.1879194630872, Blast_Score=93, Evalue=2e-19,
Organism=Saccharomyces cerevisiae, GI6321912, Length=186, Percent_Identity=28.494623655914, Blast_Score=91, Evalue=9e-19,
Organism=Saccharomyces cerevisiae, GI6321109, Length=186, Percent_Identity=27.4193548387097, Blast_Score=78, Evalue=6e-15,
Organism=Saccharomyces cerevisiae, GI6320047, Length=271, Percent_Identity=27.6752767527675, Blast_Score=77, Evalue=9e-15,
Organism=Drosophila melanogaster, GI24664545, Length=340, Percent_Identity=28.2352941176471, Blast_Score=120, Evalue=4e-27,
Organism=Drosophila melanogaster, GI24584320, Length=195, Percent_Identity=31.2820512820513, Blast_Score=96, Evalue=8e-20,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR005747
- InterPro:   IPR000432
- InterPro:   IPR007696
- InterPro:   IPR002625 [H]

Pfam domain/function: PF00488 MutS_V; PF01713 Smr [H]

EC number: 3.6.3.14

Molecular weight: Translated: 89366; Mature: 89234

Theoretical pI: Translated: 5.72; Mature: 5.72

Prosite motif: PS50828 SMR ; PS00486 DNA_MISMATCH_REPAIR_2

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.3 %Cys     (Translated Protein)
2.3 %Met     (Translated Protein)
2.5 %Cys+Met (Translated Protein)
0.3 %Cys     (Mature Protein)
2.1 %Met     (Mature Protein)
2.4 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MTFKKSMDTLELPKIIDQLKKETVSTMTKEICDDLDPSVNYNEIKTWLKETSEAKELLAE
CCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHH
RDISLRGLRDIRKQLQLAAKDGTLQGPELFQISEIIGVSNRVRKITDDNFQANYPILSSL
CCCCHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHH
ISKLPELNHLKKELDDKIDENGEVKDSASVNLRNIRQKIKKLQSQVKTSVNRILQSGEKY
HHHCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
LQDKIVTMRYDRYVVPVKAEYQNMVPGIIHDQSSSGMTVYIEPKEVVEKNNELRQAKREE
HHHHHHEEEECCEEEEEEHHHHHCCCCEEECCCCCCCEEEECCHHHHHCCHHHHHHHHHH
HSELEKILQGLSQKIKGYHYQLHDSLQILVELDFILAKGSLSRRMNAREAELNQEKRLEI
HHHHHHHHHHHHHHHCCCCEEHHHHHHHHHHHHHHHHCCCHHHHCCHHHHHCCHHHHHHH
IKGKHPLLGEDAIPVDVKLGDEFNTMVITGPNTGGKTVSLKMVGLFTLMTQSGLHIPAER
HCCCCCCCCCCCCEEEEEECCCCCEEEEECCCCCCCEEEEHHHHHHHHHHHCCCCCCHHC
GTEMGVFEQVFADIGDEQDIEQSLSTFSSHMSNIVKIVDHANSESLILLDELGAGTDPTE
CCCCHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCEEEEECCCCCCCCCC
GSALAMSLLEHFHNLGCRSIATTHYTQLKSFAHAREGVENASVEFDEETLEPTYNLLIGV
CHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHCCCEEEEEEC
PGKSNAFVISRRLGLSDKIISNAKSFLADEEIEVEELITSLTEKEKSSQKMKEELERERA
CCCCCCEEEEECCCCHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHH
KVEQVKAQLEQERKEISRKKDEVLQKARRQAEEIISDAKRDAEESLKEARKIAEKKSHKE
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
MAEVSSKVRDKLSGHQQKLREELMDSADSVPLSPEKLKPGLTVYISNLDKEGQILQVNHD
HHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHCCCCEEEEEECCCCCCCEEEEECC
KGEAEVQVGIMKVNVNFSDIFPSEEEKSGSTFSGNVNSSSSSTGRGNVFAGKKERISTEL
CCCCEEEEEEEEEECCHHHCCCCCCCCCCCCEECCCCCCCCCCCCCCCCCCCHHHCCCHH
DIRGERVEEAINQVDKYLDDALVAGLAEIRIIHGKGTGNLRKGIQFHLEGHPMVSQYRLG
CCCHHHHHHHHHHHHHHHHHHHHHHHHHEEEEECCCCCCCCCCCEEEECCCCCHHHHHCC
NRQEGGEGVTVVKLNN
CCCCCCCCEEEEEECC
>Mature Secondary Structure 
TFKKSMDTLELPKIIDQLKKETVSTMTKEICDDLDPSVNYNEIKTWLKETSEAKELLAE
CCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHH
RDISLRGLRDIRKQLQLAAKDGTLQGPELFQISEIIGVSNRVRKITDDNFQANYPILSSL
CCCCHHHHHHHHHHHHHHHCCCCCCCCCHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHH
ISKLPELNHLKKELDDKIDENGEVKDSASVNLRNIRQKIKKLQSQVKTSVNRILQSGEKY
HHHCCCHHHHHHHHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
LQDKIVTMRYDRYVVPVKAEYQNMVPGIIHDQSSSGMTVYIEPKEVVEKNNELRQAKREE
HHHHHHEEEECCEEEEEEHHHHHCCCCEEECCCCCCCEEEECCHHHHHCCHHHHHHHHHH
HSELEKILQGLSQKIKGYHYQLHDSLQILVELDFILAKGSLSRRMNAREAELNQEKRLEI
HHHHHHHHHHHHHHHCCCCEEHHHHHHHHHHHHHHHHCCCHHHHCCHHHHHCCHHHHHHH
IKGKHPLLGEDAIPVDVKLGDEFNTMVITGPNTGGKTVSLKMVGLFTLMTQSGLHIPAER
HCCCCCCCCCCCCEEEEEECCCCCEEEEECCCCCCCEEEEHHHHHHHHHHHCCCCCCHHC
GTEMGVFEQVFADIGDEQDIEQSLSTFSSHMSNIVKIVDHANSESLILLDELGAGTDPTE
CCCCHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCEEEEECCCCCCCCCC
GSALAMSLLEHFHNLGCRSIATTHYTQLKSFAHAREGVENASVEFDEETLEPTYNLLIGV
CHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHCCCEEEEEEC
PGKSNAFVISRRLGLSDKIISNAKSFLADEEIEVEELITSLTEKEKSSQKMKEELERERA
CCCCCCEEEEECCCCHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHH
KVEQVKAQLEQERKEISRKKDEVLQKARRQAEEIISDAKRDAEESLKEARKIAEKKSHKE
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
MAEVSSKVRDKLSGHQQKLREELMDSADSVPLSPEKLKPGLTVYISNLDKEGQILQVNHD
HHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCHHHCCCCEEEEEECCCCCCCEEEEECC
KGEAEVQVGIMKVNVNFSDIFPSEEEKSGSTFSGNVNSSSSSTGRGNVFAGKKERISTEL
CCCCEEEEEEEEEECCHHHCCCCCCCCCCCCEECCCCCCCCCCCCCCCCCCCHHHCCCHH
DIRGERVEEAINQVDKYLDDALVAGLAEIRIIHGKGTGNLRKGIQFHLEGHPMVSQYRLG
CCCHHHHHHHHHHHHHHHHHHHHHHHHHEEEEECCCCCCCCCCCEEEECCCCCHHHHHCC
NRQEGGEGVTVVKLNN
CCCCCCCCEEEEEECC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: ATP; H2O; H+

Specific reaction: ATP + H2O + H+(in) = ADP + phosphate + H+(out)

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA