BacMap

Definition	Akkermansia muciniphila ATCC BAA-835, complete genome.
Accession	NC_010655
Length	2,664,102

Click here to switch to the map view.

The map label for this gene is leuS [H]

Identifier: 187736142

GI number: 187736142

Start: 1997261

End: 1999834

Strand: Reverse

Name: leuS [H]

Synonym: Amuc_1654

Alternate gene names: 187736142

Gene position: 1999834-1997261 (Counterclockwise)

Preceding gene: 187736144

Following gene: 187736141

Centisome position: 75.07

GC content: 57.77

Gene sequence:

>2574_bases
ATGTCCGAGCGCAAGAAACCATATCCCTTTGACGTTTTTGAACCTAAATGGCAACAGATCTGGGACGAGAGGAAAACCTT
TAAAGTAAATAACCCCGGAGAAGAGGGCTTTGATGCGTCCAAACCCAAATACTACGTGCTGGACATGTTCCCCTACCCCA
GCGGGGCGGGCCTGCATGTGGGCCATCCGGAAGGGTACACCGCCACGGACATTGTAGCGCGTTTCAAACGCATGAACGGC
TTCAACGTGCTCCATCCCATGGGGTGGGACTCCTTCGGCCTTCCGGCGGAACAATACGCCATTAAAACCGGACAGCACCC
CTCCGTCACTACCTTCCGGAATATAGACAACTTCCGCCGCCAGCTCAAAATGCTGGGGTTCTCTTACGACTGGGACCGGG
AAATAGCAACAACGGACCATGAATACGTCCGTTGGACCCAGTGGATATTCCTCCAGCTTTACAACTCCTACTACAACAAG
GAACTGAAAAAGGCGCGCCCCGTTTCCGAACTGGAGGAACAGGGATTGAGCCGGGAAGAAATCGACCAGCGCCGGCTGGC
CTACGTAGCGGAAGCTGCCGTCAACTGGTCCCCGGACCTGGGGACCGTCCTTGCCAATGAGGAAGTGGAGGAATGGAAAT
CCAAGGGACACCGCGTGGAACGCCGCCCCCTGCGCCAGTGGATGCTGCGCATCACGGACTACGCGGAACGCCTCATTGAC
GAGCTGGAGCCCCTGGACTGGCCGGAATCCATTAAACTGCTTCAGCGCAACTGGATAGGCAAATCGGAAGGTGCGGAAGT
GGACTTCACCTTGGACGGAGAAACGATCACTGTTTACACCACCAGGCCGGACACCCTCTTTGGAGCCACCTACATGGTTC
TTTCCCCGGAGCACCCTCTGGTAGATACCGTCACCACGCCGGAACAGAAACATGCTGTGGAACAATACCGCGCCCAGTGC
GCCTCCAAAAGCGACCTGGAACGCACGGACCTCTCCAAGGAAAAAACAGGGGTCTTCACCGGAGCCTATGCCGTCAATCC
GGTCAATGGAAAACAAATTCCCGTCTGGATCGCGGACTATGTGCTGATGGGTTACGGAACCGGAGCCATCATGGCCGTCC
CCGCCCATGACGAACGCGACTTCGCCTTTGCCCAGGTCTTCGGCCTGCCCATACTCCAGGTAGTTCAGCCGCCCAGTGAA
GACACGGACTGGCGCGGCTTCTGCGGTTATGAAGGTTCCAGCGTGAACTCCGGCTTCCTGACCGGGCTGCCTACTCCGGA
AGCCAAGGAAAAAATGATCCTCTGGCTGGAAGAAAACGGCAAGGGACGCCGCAAAGTAAACTACAAGCTGCGCGACTGGC
TCTTCTCCCGCCAGCGTTACTGGGGGGAACCATTCCCCATCGTATGGGAAGACGGTCGCCACCGCGCCCTGCCGGAAAGC
GAACTCCCCGTACTCCAGCCGGATCTGGACGACTTCGCCCCCACGGGAGACCCCCGCGGCCCGCTGGTCAAGGCTGCGGA
ATGGATAGCCTACACGCCCACAGCCCACCGGGAAACAAACACCATGCCCCAATGGGCCGGCTCCTGCTGGTACTACCTGC
GTTACCTGGATCCGGCCAACACGGAACGCTTCGTCAGCCGGGAAGCGGAACAATACTGGATGGGCTCCGCCGGCTCCCCC
GGAGGCGTGGACCTGTACGTGGGCGGCACGGAACACGCCGTGCTCCACCTTCTCTATGCCCGCTTCTGGCACAAGGTGCT
CTTTGACCTGGGCTACCTCAGCACCAATGAACCCTTCCAAAAACTCGTCAACCAGGGGCTCATCCTAGGGGAAGACGGCC
AGAAAATGTCCAAATCCCGCGGCAACGTCGTCAATCCGGACGACATCGTCCGCGAATATGGCGCGGACTCCCTGCGGTTA
TATGAAATGTTCATGGGCCCTCTCAAGGACGTGAAACCTTGGGCAACCAAAGGTGTGGAAGGCATTTCCCGCTTCCTGGC
CCGCGTCTGGCGCGTGGCCTTCCGGGAAAATCAGGAAGGAGAATGGGAAATCAACTCCAAACTGGTGGAGAACGCTCCGG
AAGCCGGGGTGCTTGCCGTACGCAAGGAATTGCACAAAACCATTAAAAAAGTGACGGAGGACATCAATGGCATGTCCTTC
AACACCGCCATCGCGAAAATGATGGAATGCACCAATGCCATGACCTCCGCGGATGTGGTGGACGTTCAGGACTATGATGC
TTTCCTGACTCTGCTGAATCCCTTTGCCCCCCACCTTACGGAAGAAATACACAGCCGCCTGCAAACAGCCTTCCCGGCTC
TGGCCCAGACGCAGCTTTGCCAGAAAAGCTGGCCTGAATGGGAGGAAGCCCTGCTGGAGGAAAATACCGTTCCCATGGTC
ATCCAGGTGAACGGCAAGCTGAGGGACAAACTGGAAGTGCCCAAGGACATCTCCCGGGAAGAACTGGAAAAACAGGCCCT
GGCTTCCGCCAAGGTGAAAACCTTCCTGGACGGCGTCACTGTGCGCAAGGTAATTGTCGTACCCGGCCGCCTCGTCAACA
TTGTAGCCAACTGA

Upstream 100 bases:

>100_bases
CCGAAAAACGGCATCATGCCCCAGGAGCATTGGAAGCGCCTGCACTCCGCCGGGTTTAGGCTTGATTGACCCGCGGGCGG
AGTATACATTCCCTCCCGTC

Downstream 100 bases:

>100_bases
CATCCCGAAAAGCCTCCCTCAGCCATGACCATAATCTCCCCGTCCCTGCTGGCCGCTGATTTCTCCCGCATTGGGGAGGA
AGCGCGGCGGGCCTTTGACG

Product: leucyl-tRNA synthetase

Products: NA

Alternate protein names: Leucine--tRNA ligase; LeuRS [H]

Number of amino acids: Translated: 857; Mature: 856

Protein sequence:

>857_residues
MSERKKPYPFDVFEPKWQQIWDERKTFKVNNPGEEGFDASKPKYYVLDMFPYPSGAGLHVGHPEGYTATDIVARFKRMNG
FNVLHPMGWDSFGLPAEQYAIKTGQHPSVTTFRNIDNFRRQLKMLGFSYDWDREIATTDHEYVRWTQWIFLQLYNSYYNK
ELKKARPVSELEEQGLSREEIDQRRLAYVAEAAVNWSPDLGTVLANEEVEEWKSKGHRVERRPLRQWMLRITDYAERLID
ELEPLDWPESIKLLQRNWIGKSEGAEVDFTLDGETITVYTTRPDTLFGATYMVLSPEHPLVDTVTTPEQKHAVEQYRAQC
ASKSDLERTDLSKEKTGVFTGAYAVNPVNGKQIPVWIADYVLMGYGTGAIMAVPAHDERDFAFAQVFGLPILQVVQPPSE
DTDWRGFCGYEGSSVNSGFLTGLPTPEAKEKMILWLEENGKGRRKVNYKLRDWLFSRQRYWGEPFPIVWEDGRHRALPES
ELPVLQPDLDDFAPTGDPRGPLVKAAEWIAYTPTAHRETNTMPQWAGSCWYYLRYLDPANTERFVSREAEQYWMGSAGSP
GGVDLYVGGTEHAVLHLLYARFWHKVLFDLGYLSTNEPFQKLVNQGLILGEDGQKMSKSRGNVVNPDDIVREYGADSLRL
YEMFMGPLKDVKPWATKGVEGISRFLARVWRVAFRENQEGEWEINSKLVENAPEAGVLAVRKELHKTIKKVTEDINGMSF
NTAIAKMMECTNAMTSADVVDVQDYDAFLTLLNPFAPHLTEEIHSRLQTAFPALAQTQLCQKSWPEWEEALLEENTVPMV
IQVNGKLRDKLEVPKDISREELEKQALASAKVKTFLDGVTVRKVIVVPGRLVNIVAN

Sequences:

>Translated_857_residues
MSERKKPYPFDVFEPKWQQIWDERKTFKVNNPGEEGFDASKPKYYVLDMFPYPSGAGLHVGHPEGYTATDIVARFKRMNG
FNVLHPMGWDSFGLPAEQYAIKTGQHPSVTTFRNIDNFRRQLKMLGFSYDWDREIATTDHEYVRWTQWIFLQLYNSYYNK
ELKKARPVSELEEQGLSREEIDQRRLAYVAEAAVNWSPDLGTVLANEEVEEWKSKGHRVERRPLRQWMLRITDYAERLID
ELEPLDWPESIKLLQRNWIGKSEGAEVDFTLDGETITVYTTRPDTLFGATYMVLSPEHPLVDTVTTPEQKHAVEQYRAQC
ASKSDLERTDLSKEKTGVFTGAYAVNPVNGKQIPVWIADYVLMGYGTGAIMAVPAHDERDFAFAQVFGLPILQVVQPPSE
DTDWRGFCGYEGSSVNSGFLTGLPTPEAKEKMILWLEENGKGRRKVNYKLRDWLFSRQRYWGEPFPIVWEDGRHRALPES
ELPVLQPDLDDFAPTGDPRGPLVKAAEWIAYTPTAHRETNTMPQWAGSCWYYLRYLDPANTERFVSREAEQYWMGSAGSP
GGVDLYVGGTEHAVLHLLYARFWHKVLFDLGYLSTNEPFQKLVNQGLILGEDGQKMSKSRGNVVNPDDIVREYGADSLRL
YEMFMGPLKDVKPWATKGVEGISRFLARVWRVAFRENQEGEWEINSKLVENAPEAGVLAVRKELHKTIKKVTEDINGMSF
NTAIAKMMECTNAMTSADVVDVQDYDAFLTLLNPFAPHLTEEIHSRLQTAFPALAQTQLCQKSWPEWEEALLEENTVPMV
IQVNGKLRDKLEVPKDISREELEKQALASAKVKTFLDGVTVRKVIVVPGRLVNIVAN
>Mature_856_residues
SERKKPYPFDVFEPKWQQIWDERKTFKVNNPGEEGFDASKPKYYVLDMFPYPSGAGLHVGHPEGYTATDIVARFKRMNGF
NVLHPMGWDSFGLPAEQYAIKTGQHPSVTTFRNIDNFRRQLKMLGFSYDWDREIATTDHEYVRWTQWIFLQLYNSYYNKE
LKKARPVSELEEQGLSREEIDQRRLAYVAEAAVNWSPDLGTVLANEEVEEWKSKGHRVERRPLRQWMLRITDYAERLIDE
LEPLDWPESIKLLQRNWIGKSEGAEVDFTLDGETITVYTTRPDTLFGATYMVLSPEHPLVDTVTTPEQKHAVEQYRAQCA
SKSDLERTDLSKEKTGVFTGAYAVNPVNGKQIPVWIADYVLMGYGTGAIMAVPAHDERDFAFAQVFGLPILQVVQPPSED
TDWRGFCGYEGSSVNSGFLTGLPTPEAKEKMILWLEENGKGRRKVNYKLRDWLFSRQRYWGEPFPIVWEDGRHRALPESE
LPVLQPDLDDFAPTGDPRGPLVKAAEWIAYTPTAHRETNTMPQWAGSCWYYLRYLDPANTERFVSREAEQYWMGSAGSPG
GVDLYVGGTEHAVLHLLYARFWHKVLFDLGYLSTNEPFQKLVNQGLILGEDGQKMSKSRGNVVNPDDIVREYGADSLRLY
EMFMGPLKDVKPWATKGVEGISRFLARVWRVAFRENQEGEWEINSKLVENAPEAGVLAVRKELHKTIKKVTEDINGMSFN
TAIAKMMECTNAMTSADVVDVQDYDAFLTLLNPFAPHLTEEIHSRLQTAFPALAQTQLCQKSWPEWEEALLEENTVPMVI
QVNGKLRDKLEVPKDISREELEKQALASAKVKTFLDGVTVRKVIVVPGRLVNIVAN

Specific function: Unknown

COG id: COG0495

COG function: function code J; Leucyl-tRNA synthetase

Gene ontology:

Cell location: Cytoplasm [H]

Metaboloic importance: Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Belongs to the class-I aminoacyl-tRNA synthetase family [H]

Homologues:

Organism=Homo sapiens, GI7661872, Length=921, Percent_Identity=32.6818675352877, Blast_Score=421, Evalue=1e-117,
Organism=Escherichia coli, GI1786861, Length=918, Percent_Identity=39.3246187363834, Blast_Score=602, Evalue=1e-173,
Organism=Caenorhabditis elegans, GI71997517, Length=809, Percent_Identity=27.9357231149567, Blast_Score=268, Evalue=1e-71,
Organism=Caenorhabditis elegans, GI71997510, Length=809, Percent_Identity=27.9357231149567, Blast_Score=268, Evalue=1e-71,
Organism=Caenorhabditis elegans, GI212645227, Length=375, Percent_Identity=26.1333333333333, Blast_Score=104, Evalue=2e-22,
Organism=Saccharomyces cerevisiae, GI6323414, Length=850, Percent_Identity=34, Blast_Score=414, Evalue=1e-116,
Organism=Drosophila melanogaster, GI21355409, Length=841, Percent_Identity=31.7479191438763, Blast_Score=318, Evalue=1e-86,

Paralogues:

None

Copy number: 800 Molecules/Cell In: Glucose minimal media [C]

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR001412
- InterPro:   IPR002300
- InterPro:   IPR002302
- InterPro:   IPR014729
- InterPro:   IPR009080
- InterPro:   IPR013155
- InterPro:   IPR009008 [H]

Pfam domain/function: PF08264 Anticodon_1; PF00133 tRNA-synt_1 [H]

EC number: =6.1.1.4 [H]

Molecular weight: Translated: 98084; Mature: 97953

Theoretical pI: Translated: 5.26; Mature: 5.26

Prosite motif: PS00178 AA_TRNA_LIGASE_I

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.6 %Cys     (Translated Protein)
2.3 %Met     (Translated Protein)
2.9 %Cys+Met (Translated Protein)
0.6 %Cys     (Mature Protein)
2.2 %Met     (Mature Protein)
2.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSERKKPYPFDVFEPKWQQIWDERKTFKVNNPGEEGFDASKPKYYVLDMFPYPSGAGLHV
CCCCCCCCCCCCCCCHHHHHHCCCCEEEECCCCCCCCCCCCCCEEEEEECCCCCCCCEEC
GHPEGYTATDIVARFKRMNGFNVLHPMGWDSFGLPAEQYAIKTGQHPSVTTFRNIDNFRR
CCCCCCCHHHHHHHHHHCCCCCEECCCCCCCCCCCHHHHHHCCCCCCCCHHHHHHHHHHH
QLKMLGFSYDWDREIATTDHEYVRWTQWIFLQLYNSYYNKELKKARPVSELEEQGLSREE
HHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHCCCCHHH
IDQRRLAYVAEAAVNWSPDLGTVLANEEVEEWKSKGHRVERRPLRQWMLRITDYAERLID
HHHHHHHHHHHHHCCCCCCCCHHHCCHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHH
ELEPLDWPESIKLLQRNWIGKSEGAEVDFTLDGETITVYTTRPDTLFGATYMVLSPEHPL
HCCCCCCHHHHHHHHHHCCCCCCCCEEEEEECCCEEEEEECCCCCCCCCEEEEECCCCCC
VDTVTTPEQKHAVEQYRAQCASKSDLERTDLSKEKTGVFTGAYAVNPVNGKQIPVWIADY
CCCCCCCHHHHHHHHHHHHHCCCCCCHHHCCCHHHCCEEECCEEECCCCCCCCHHHHHHH
VLMGYGTGAIMAVPAHDERDFAFAQVFGLPILQVVQPPSEDTDWRGFCGYEGSSVNSGFL
HHHHCCCCEEEEECCCCCCCHHHHHHHCCCHHHHCCCCCCCCCCCCCCCCCCCCCCCCCE
TGLPTPEAKEKMILWLEENGKGRRKVNYKLRDWLFSRQRYWGEPFPIVWEDGRHRALPES
ECCCCCCCCCEEEEEEECCCCCCEEECHHHHHHHHHHHHHCCCCCCEEEECCCCCCCCCC
ELPVLQPDLDDFAPTGDPRGPLVKAAEWIAYTPTAHRETNTMPQWAGSCWYYLRYLDPAN
CCCCCCCCHHHCCCCCCCCCCHHHHHHHEEECCCCCCCCCCCCHHHCCCEEEEEECCCCC
TERFVSREAEQYWMGSAGSPGGVDLYVGGTEHAVLHLLYARFWHKVLFDLGYLSTNEPFQ
HHHHHHHHHHHHHCCCCCCCCCEEEEECCCHHHHHHHHHHHHHHHHHHHHCCCCCCHHHH
KLVNQGLILGEDGQKMSKSRGNVVNPDDIVREYGADSLRLYEMFMGPLKDVKPWATKGVE
HHHHCCEEECCCCHHHHHCCCCCCCHHHHHHHHCCCHHHHHHHHHHHHHCCCHHHHHHHH
GISRFLARVWRVAFRENQEGEWEINSKLVENAPEAGVLAVRKELHKTIKKVTEDINGMSF
HHHHHHHHHHHHHHHCCCCCCEEHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHCCCCCH
NTAIAKMMECTNAMTSADVVDVQDYDAFLTLLNPFAPHLTEEIHSRLQTAFPALAQTQLC
HHHHHHHHHHHHHHCCCCEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
QKSWPEWEEALLEENTVPMVIQVNGKLRDKLEVPKDISREELEKQALASAKVKTFLDGVT
HHCCCHHHHHHHCCCCCCEEEEECCCHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHCCHH
VRKVIVVPGRLVNIVAN
EEEEEECCCCEEEEECC
>Mature Secondary Structure 
SERKKPYPFDVFEPKWQQIWDERKTFKVNNPGEEGFDASKPKYYVLDMFPYPSGAGLHV
CCCCCCCCCCCCCCHHHHHHCCCCEEEECCCCCCCCCCCCCCEEEEEECCCCCCCCEEC
GHPEGYTATDIVARFKRMNGFNVLHPMGWDSFGLPAEQYAIKTGQHPSVTTFRNIDNFRR
CCCCCCCHHHHHHHHHHCCCCCEECCCCCCCCCCCHHHHHHCCCCCCCCHHHHHHHHHHH
QLKMLGFSYDWDREIATTDHEYVRWTQWIFLQLYNSYYNKELKKARPVSELEEQGLSREE
HHHHHCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHCCCCHHH
IDQRRLAYVAEAAVNWSPDLGTVLANEEVEEWKSKGHRVERRPLRQWMLRITDYAERLID
HHHHHHHHHHHHHCCCCCCCCHHHCCHHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHHH
ELEPLDWPESIKLLQRNWIGKSEGAEVDFTLDGETITVYTTRPDTLFGATYMVLSPEHPL
HCCCCCCHHHHHHHHHHCCCCCCCCEEEEEECCCEEEEEECCCCCCCCCEEEEECCCCCC
VDTVTTPEQKHAVEQYRAQCASKSDLERTDLSKEKTGVFTGAYAVNPVNGKQIPVWIADY
CCCCCCCHHHHHHHHHHHHHCCCCCCHHHCCCHHHCCEEECCEEECCCCCCCCHHHHHHH
VLMGYGTGAIMAVPAHDERDFAFAQVFGLPILQVVQPPSEDTDWRGFCGYEGSSVNSGFL
HHHHCCCCEEEEECCCCCCCHHHHHHHCCCHHHHCCCCCCCCCCCCCCCCCCCCCCCCCE
TGLPTPEAKEKMILWLEENGKGRRKVNYKLRDWLFSRQRYWGEPFPIVWEDGRHRALPES
ECCCCCCCCCEEEEEEECCCCCCEEECHHHHHHHHHHHHHCCCCCCEEEECCCCCCCCCC
ELPVLQPDLDDFAPTGDPRGPLVKAAEWIAYTPTAHRETNTMPQWAGSCWYYLRYLDPAN
CCCCCCCCHHHCCCCCCCCCCHHHHHHHEEECCCCCCCCCCCCHHHCCCEEEEEECCCCC
TERFVSREAEQYWMGSAGSPGGVDLYVGGTEHAVLHLLYARFWHKVLFDLGYLSTNEPFQ
HHHHHHHHHHHHHCCCCCCCCCEEEEECCCHHHHHHHHHHHHHHHHHHHHCCCCCCHHHH
KLVNQGLILGEDGQKMSKSRGNVVNPDDIVREYGADSLRLYEMFMGPLKDVKPWATKGVE
HHHHCCEEECCCCHHHHHCCCCCCCHHHHHHHHCCCHHHHHHHHHHHHHCCCHHHHHHHH
GISRFLARVWRVAFRENQEGEWEINSKLVENAPEAGVLAVRKELHKTIKKVTEDINGMSF
HHHHHHHHHHHHHHHCCCCCCEEHHHHHHHCCCCCHHHHHHHHHHHHHHHHHHHCCCCCH
NTAIAKMMECTNAMTSADVVDVQDYDAFLTLLNPFAPHLTEEIHSRLQTAFPALAQTQLC
HHHHHHHHHHHHHHCCCCEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
QKSWPEWEEALLEENTVPMVIQVNGKLRDKLEVPKDISREELEKQALASAKVKTFLDGVT
HHCCCHHHHHHHCCCCCCEEEEECCCHHHHCCCCCCCCHHHHHHHHHHHHHHHHHHCCHH
VRKVIVVPGRLVNIVAN
EEEEEECCCCEEEEECC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: NA