BacMap

Definition	Sinorhizobium fredii NGR234 plasmid pNGR234a, complete sequence.
Accession	NC_000914
Length	536,165

Click here to switch to the map view.

The map label for this gene is Not Available

Identifier: 16519941

GI number: 16519941

Start: 199856

End: 202126

Strand: Reverse

Name: Not Available

Synonym: NGR_a01640

Alternate gene names: 16519941

Gene position: 202126-199856 (Counterclockwise)

Preceding gene: 16519940

Following gene: 16519945

Centisome position: 37.7

GC content: 54.07

Gene sequence:

>2271_bases
ATGGGGGGACGAATGCCGCTGTTGAATGTATCGCCATTGAAGTGGCCGATAAGTCTAAAGATTCCGGCTATGACCGTCTG
CGTAGCGGTACTGTCCTGCACGACGGTCGCGACATTCGCGGGAATTACTTCAGTCGCAACAACCAGGAGCTTGATCGAGA
AGCACCTTAATTATGTCGCTATCTCGATGCGAGACGCGCTCCTCACAAAACTCCAGGCGACCAAGTTCGAAGTCGAAGGG
CTCTCCGCCAATCCTGGGCTGCTTCAACTCTTTAATAATACGAGTGTTGGTTTCGCGGCGGTGTCGCCAACAGACCTCAC
GGCAGCGTCGGTAGATAAAGTCGAGAGTGGGAAGTTTAGTCTCGCGGCAACACCAACCACGAAATTCTATGTCGACAATT
ATCAAAAGCTGGATGCTTGGCTCAAGCCGTTGGCCGCCAAGCAGTCATATTCGGGGATCCTTTTAGCAAATGCTGAGGGC
GCAATCATCTATAGCACCGGAACTAATCCGGTCGGCCCCGTAGATGCCAACGGATCGATCAACTTGGCCATCGCAAGCTC
AGCTAACAGTCAGGAGGCGGTGATGACTGATTTCACGCCTCCAACGTTGTCCGCACCGGGGCAGGCTCTATATGCCGTTG
CGATCGTTCACCCGTTCATACCTGACAAACGAAATGGTACTCTACTGATTTCCATGAGTACCGAAATGCTAAATGCAGTC
ATGGGTCAAGCAAAGGGTTTCGGCCCACACAGCGAAGCGCTCATTGCCGGGAGCGACGGCAAACCTCGCTCCTTGTCGTC
CATATCCAGAGACGAAGACGCTGAAGCGGTCGTCAACAGTGACCTGCTCTCCCAAGGTATAAAGACGTCCAATTTCGGCG
CTCAAGAGGTTCTTTCTGCATCACAACAACTGAAATGGCAGGATCACCAGTGGTCGATCATTGCCCTAGAGCCGGAGGCA
GATGTTGTCTCGGCGTCAACTGCAATGTTGATCAAGATTATCGGCATTACGGCTGCCACTGCGATTCTGGCGCTGGCAAT
GGCCATCCTCGCCTCTCGCTCAATATCAGGGCCACTGGCGGGGCTGGTGTCTATTATGAAAAGACTCGCAAACGGTGACA
TAAACGTGCGTGTCGCTGGTGTCGATCGCCGCGACGAGATGGGCGAAATGTCTAGAGCAGTTCTCGTCTTTCGAGATAAC
GCGATAGCTAGGGTTGCTGCGGAGGACGATGCAAGGAGCGCTGAAGAGGCGATGGAGCACGACCGCAGGATGATGGAGAT
GGAGCGGTCAGAGCGGCTCGACGAGCAAGCCCGAGTTATGGCTCAAATTGGCGGAGGCTTAGCAGCACTCTCCGATGGAG
TGTTTAGTAGACCCATCACCGTGGATTTCCCAGAAGAGTATCGTCCGCTCAAGAGCGATTTCAACCGCGCACTAGGGCAA
CTCAGAGAGACAATACGAACTGTCGCGGCTCAAGCCGCGTCGATGTCGTCTATCGTCTCCGAAATAAGCTGCGCAACTGA
TGTCCTGGCGAAACGGACGGAACATCAGGCTATCGTGCTCGATGGTGCCGTGAATACGATGGATGCAATATCAAACGATG
TAAGCGTCACAGCGAACGCGGCAAATAATGCTGATGCGCTTGTCCGCGACGCCCACTCCGCTGCAGCCGCGTCGGACGAG
ATTGTTTCGAGCGCAATAGCGGGCATGTTGGAGATCGAAGAGTCTTCTGCAAAGATTGCAACGATCGTCTCGGTCATCGA
GGAGATTGCACATCAAACGAACCTTTTAGCACTCAACGCTGGTGTTGAAGCATCCAGAGCGGGGGAAGCCGGGAAAGGAT
TCGCGGTCGTTGCTTCGGAGGTCCGGGCGCTCGCACAGCGATCCTCTGACGCCGCCAAGGAAATTAAGGACTTGATCAAT
GTTTCTACCCAACGTGTGGAGCGCGGCAAAGAGCTTGTCGATAGCGCGAGTGAATTGCTCAAGCATATAGCCGCGCGTGT
CGATCTGATCAGGACCACGGTTTCCAACATTGCTGCAACGGCAACGAGCCAAGCAAAGCATCTGTCTGAATTTCAGACTA
CGATCGCTGAGATTGATCAATCTACTCAGCAGACAGCGGCGATGGCCGAGGAATCGGACGCCGCTTGTCGATCCTTGAAC
GCCGAGGCGCAGCATCTGTTGGAACTAATTCAACAATTCGAACTGGGAGGGGGTTCTTCCACCCGACAGCCTCAAAGCCC
GCCCACACAGAGATACTTCATGTCGAGGTAG

Upstream 100 bases:

>100_bases
AAAAAATGGCGTAAGGAAGCATAATTTCTGCGAGCGCTCCCTCGATAACGCACGATCACGCCTTTAATTCGAATCTAGTC
TCACACACCGATTGCTTCGG

Downstream 100 bases:

>100_bases
TCTTCCAGCCCATGCCTGGACCCCTCCCGGCCAATACCCGATTGCTTGACGCCCCCGAAGGGCGCGGCCTCGGATGACAT
CCGGCCGGTGTTGATCCCGA

Product: methyl-accepting chemotaxis protein

Products: NA

Alternate protein names: Methyl-accepting chemotaxis protein

Number of amino acids: Translated: 756; Mature: 755

Protein sequence:

>756_residues
MGGRMPLLNVSPLKWPISLKIPAMTVCVAVLSCTTVATFAGITSVATTRSLIEKHLNYVAISMRDALLTKLQATKFEVEG
LSANPGLLQLFNNTSVGFAAVSPTDLTAASVDKVESGKFSLAATPTTKFYVDNYQKLDAWLKPLAAKQSYSGILLANAEG
AIIYSTGTNPVGPVDANGSINLAIASSANSQEAVMTDFTPPTLSAPGQALYAVAIVHPFIPDKRNGTLLISMSTEMLNAV
MGQAKGFGPHSEALIAGSDGKPRSLSSISRDEDAEAVVNSDLLSQGIKTSNFGAQEVLSASQQLKWQDHQWSIIALEPEA
DVVSASTAMLIKIIGITAATAILALAMAILASRSISGPLAGLVSIMKRLANGDINVRVAGVDRRDEMGEMSRAVLVFRDN
AIARVAAEDDARSAEEAMEHDRRMMEMERSERLDEQARVMAQIGGGLAALSDGVFSRPITVDFPEEYRPLKSDFNRALGQ
LRETIRTVAAQAASMSSIVSEISCATDVLAKRTEHQAIVLDGAVNTMDAISNDVSVTANAANNADALVRDAHSAAAASDE
IVSSAIAGMLEIEESSAKIATIVSVIEEIAHQTNLLALNAGVEASRAGEAGKGFAVVASEVRALAQRSSDAAKEIKDLIN
VSTQRVERGKELVDSASELLKHIAARVDLIRTTVSNIAATATSQAKHLSEFQTTIAEIDQSTQQTAAMAEESDAACRSLN
AEAQHLLELIQQFELGGGSSTRQPQSPPTQRYFMSR

Sequences:

>Translated_756_residues
MGGRMPLLNVSPLKWPISLKIPAMTVCVAVLSCTTVATFAGITSVATTRSLIEKHLNYVAISMRDALLTKLQATKFEVEG
LSANPGLLQLFNNTSVGFAAVSPTDLTAASVDKVESGKFSLAATPTTKFYVDNYQKLDAWLKPLAAKQSYSGILLANAEG
AIIYSTGTNPVGPVDANGSINLAIASSANSQEAVMTDFTPPTLSAPGQALYAVAIVHPFIPDKRNGTLLISMSTEMLNAV
MGQAKGFGPHSEALIAGSDGKPRSLSSISRDEDAEAVVNSDLLSQGIKTSNFGAQEVLSASQQLKWQDHQWSIIALEPEA
DVVSASTAMLIKIIGITAATAILALAMAILASRSISGPLAGLVSIMKRLANGDINVRVAGVDRRDEMGEMSRAVLVFRDN
AIARVAAEDDARSAEEAMEHDRRMMEMERSERLDEQARVMAQIGGGLAALSDGVFSRPITVDFPEEYRPLKSDFNRALGQ
LRETIRTVAAQAASMSSIVSEISCATDVLAKRTEHQAIVLDGAVNTMDAISNDVSVTANAANNADALVRDAHSAAAASDE
IVSSAIAGMLEIEESSAKIATIVSVIEEIAHQTNLLALNAGVEASRAGEAGKGFAVVASEVRALAQRSSDAAKEIKDLIN
VSTQRVERGKELVDSASELLKHIAARVDLIRTTVSNIAATATSQAKHLSEFQTTIAEIDQSTQQTAAMAEESDAACRSLN
AEAQHLLELIQQFELGGGSSTRQPQSPPTQRYFMSR
>Mature_755_residues
GGRMPLLNVSPLKWPISLKIPAMTVCVAVLSCTTVATFAGITSVATTRSLIEKHLNYVAISMRDALLTKLQATKFEVEGL
SANPGLLQLFNNTSVGFAAVSPTDLTAASVDKVESGKFSLAATPTTKFYVDNYQKLDAWLKPLAAKQSYSGILLANAEGA
IIYSTGTNPVGPVDANGSINLAIASSANSQEAVMTDFTPPTLSAPGQALYAVAIVHPFIPDKRNGTLLISMSTEMLNAVM
GQAKGFGPHSEALIAGSDGKPRSLSSISRDEDAEAVVNSDLLSQGIKTSNFGAQEVLSASQQLKWQDHQWSIIALEPEAD
VVSASTAMLIKIIGITAATAILALAMAILASRSISGPLAGLVSIMKRLANGDINVRVAGVDRRDEMGEMSRAVLVFRDNA
IARVAAEDDARSAEEAMEHDRRMMEMERSERLDEQARVMAQIGGGLAALSDGVFSRPITVDFPEEYRPLKSDFNRALGQL
RETIRTVAAQAASMSSIVSEISCATDVLAKRTEHQAIVLDGAVNTMDAISNDVSVTANAANNADALVRDAHSAAAASDEI
VSSAIAGMLEIEESSAKIATIVSVIEEIAHQTNLLALNAGVEASRAGEAGKGFAVVASEVRALAQRSSDAAKEIKDLINV
STQRVERGKELVDSASELLKHIAARVDLIRTTVSNIAATATSQAKHLSEFQTTIAEIDQSTQQTAAMAEESDAACRSLNA
EAQHLLELIQQFELGGGSSTRQPQSPPTQRYFMSR

Specific function: Chemotactic-signal transducers respond to changes in the concentration of attractants and repellents in the environment, transduce a signal from the outside to the inside of the cell, and facilitate sensory adaptation through the variation of the level of

COG id: COG0840

COG function: function code NT; Methyl-accepting chemotaxis protein

Gene ontology:

Cell location: Cell membrane; Multi-pass membrane protein (Potential)

Metaboloic importance: Non_Essential [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 1 methyl-accepting transducer domain

Homologues:

Organism=Escherichia coli, GI1788194, Length=296, Percent_Identity=37.5, Blast_Score=164, Evalue=3e-41,
Organism=Escherichia coli, GI1788195, Length=308, Percent_Identity=36.3636363636364, Blast_Score=160, Evalue=4e-40,
Organism=Escherichia coli, GI2367378, Length=255, Percent_Identity=39.6078431372549, Blast_Score=157, Evalue=3e-39,
Organism=Escherichia coli, GI1787690, Length=276, Percent_Identity=38.0434782608696, Blast_Score=153, Evalue=4e-38,
Organism=Escherichia coli, GI1789453, Length=241, Percent_Identity=38.1742738589212, Blast_Score=140, Evalue=4e-34,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): Y4SI_RHISN (P55652)

Other databases:

- EMBL:   U00090
- PIR:   S43964
- RefSeq:   NP_444061.1
- ProteinModelPortal:   P55652
- GeneID:   962438
- GenomeReviews:   U00090_GR
- KEGG:   rhi:NGR_a01640
- GO:   GO:0006935
- InterPro:   IPR004090
- InterPro:   IPR004089
- InterPro:   IPR003660
- PRINTS:   PR00260
- SMART:   SM00304
- SMART:   SM00283

Pfam domain/function: PF00672 HAMP; PF00015 MCPsignal

EC number: NA

Molecular weight: Translated: 79979; Mature: 79848

Theoretical pI: Translated: 4.89; Mature: 4.89

Prosite motif: PS50111 CHEMOTAXIS_TRANSDUC_2; PS50885 HAMP; PS51257 PROKAR_LIPOPROTEIN; PS00013 PROKAR_LIPOPROTEIN

Important sites: NA

Signals:

None

Transmembrane regions:

HASH(0x403ad0d0)-; HASH(0xae10460)-;

Cys/Met content:

0.5 %Cys     (Translated Protein)
3.0 %Met     (Translated Protein)
3.6 %Cys+Met (Translated Protein)
0.5 %Cys     (Mature Protein)
2.9 %Met     (Mature Protein)
3.4 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MGGRMPLLNVSPLKWPISLKIPAMTVCVAVLSCTTVATFAGITSVATTRSLIEKHLNYVA
CCCCCCCCCCCCCCCCEEECCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEEE
ISMRDALLTKLQATKFEVEGLSANPGLLQLFNNTSVGFAAVSPTDLTAASVDKVESGKFS
EHHHHHHHHHHHHHEEEECCCCCCCCEEEEECCCCCCEEEECCCCCCHHHHHHHCCCCEE
LAATPTTKFYVDNYQKLDAWLKPLAAKQSYSGILLANAEGAIIYSTGTNPVGPVDANGSI
EEECCCEEEECCCHHHHHHHHHHHHHCCCCCEEEEECCCCEEEEECCCCCCCCCCCCCEE
NLAIASSANSQEAVMTDFTPPTLSAPGQALYAVAIVHPFIPDKRNGTLLISMSTEMLNAV
EEEEECCCCCCCCEEECCCCCCCCCCCHHHHHHHHHHCCCCCCCCCEEEEEECHHHHHHH
MGQAKGFGPHSEALIAGSDGKPRSLSSISRDEDAEAVVNSDLLSQGIKTSNFGAQEVLSA
HHHCCCCCCCCCEEEECCCCCCCCHHHCCCCCHHHHHHHHHHHHCCCCCCCCCHHHHHHH
SQQLKWQDHQWSIIALEPEADVVSASTAMLIKIIGITAATAILALAMAILASRSISGPLA
HHHCCCCCCCEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHH
GLVSIMKRLANGDINVRVAGVDRRDEMGEMSRAVLVFRDNAIARVAAEDDARSAEEAMEH
HHHHHHHHHCCCCEEEEEECCCCHHHHHHHHCEEEEEECCCEEEEECCCCHHHHHHHHHH
DRRMMEMERSERLDEQARVMAQIGGGLAALSDGVFSRPITVDFPEEYRPLKSDFNRALGQ
HHHHHHHHHHHHHHHHHHHHHHHCCCHHHHCCCCCCCCEEECCCHHHHHHHHHHHHHHHH
LRETIRTVAAQAASMSSIVSEISCATDVLAKRTEHQAIVLDGAVNTMDAISNDVSVTANA
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEEECCCHHHHHHCCCCEEEECC
ANNADALVRDAHSAAAASDEIVSSAIAGMLEIEESSAKIATIVSVIEEIAHQTNLLALNA
CCCHHHHHHHHHHHHHHHHHHHHHHHHHHHEECCCCHHHHHHHHHHHHHHHHCCEEEEEC
GVEASRAGEAGKGFAVVASEVRALAQRSSDAAKEIKDLINVSTQRVERGKELVDSASELL
CCCHHCCCCCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
KHIAARVDLIRTTVSNIAATATSQAKHLSEFQTTIAEIDQSTQQTAAMAEESDAACRSLN
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC
AEAQHLLELIQQFELGGGSSTRQPQSPPTQRYFMSR
HHHHHHHHHHHHHCCCCCCCCCCCCCCCCHHHCCCH
>Mature Secondary Structure 
GGRMPLLNVSPLKWPISLKIPAMTVCVAVLSCTTVATFAGITSVATTRSLIEKHLNYVA
CCCCCCCCCCCCCCCEEECCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEEE
ISMRDALLTKLQATKFEVEGLSANPGLLQLFNNTSVGFAAVSPTDLTAASVDKVESGKFS
EHHHHHHHHHHHHHEEEECCCCCCCCEEEEECCCCCCEEEECCCCCCHHHHHHHCCCCEE
LAATPTTKFYVDNYQKLDAWLKPLAAKQSYSGILLANAEGAIIYSTGTNPVGPVDANGSI
EEECCCEEEECCCHHHHHHHHHHHHHCCCCCEEEEECCCCEEEEECCCCCCCCCCCCCEE
NLAIASSANSQEAVMTDFTPPTLSAPGQALYAVAIVHPFIPDKRNGTLLISMSTEMLNAV
EEEEECCCCCCCCEEECCCCCCCCCCCHHHHHHHHHHCCCCCCCCCEEEEEECHHHHHHH
MGQAKGFGPHSEALIAGSDGKPRSLSSISRDEDAEAVVNSDLLSQGIKTSNFGAQEVLSA
HHHCCCCCCCCCEEEECCCCCCCCHHHCCCCCHHHHHHHHHHHHCCCCCCCCCHHHHHHH
SQQLKWQDHQWSIIALEPEADVVSASTAMLIKIIGITAATAILALAMAILASRSISGPLA
HHHCCCCCCCEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHH
GLVSIMKRLANGDINVRVAGVDRRDEMGEMSRAVLVFRDNAIARVAAEDDARSAEEAMEH
HHHHHHHHHCCCCEEEEEECCCCHHHHHHHHCEEEEEECCCEEEEECCCCHHHHHHHHHH
DRRMMEMERSERLDEQARVMAQIGGGLAALSDGVFSRPITVDFPEEYRPLKSDFNRALGQ
HHHHHHHHHHHHHHHHHHHHHHHCCCHHHHCCCCCCCCEEECCCHHHHHHHHHHHHHHHH
LRETIRTVAAQAASMSSIVSEISCATDVLAKRTEHQAIVLDGAVNTMDAISNDVSVTANA
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEEECCCHHHHHHCCCCEEEECC
ANNADALVRDAHSAAAASDEIVSSAIAGMLEIEESSAKIATIVSVIEEIAHQTNLLALNA
CCCHHHHHHHHHHHHHHHHHHHHHHHHHHHEECCCCHHHHHHHHHHHHHHHHCCEEEEEC
GVEASRAGEAGKGFAVVASEVRALAQRSSDAAKEIKDLINVSTQRVERGKELVDSASELL
CCCHHCCCCCCCCHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
KHIAARVDLIRTTVSNIAATATSQAKHLSEFQTTIAEIDQSTQQTAAMAEESDAACRSLN
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCC
AEAQHLLELIQQFELGGGSSTRQPQSPPTQRYFMSR
HHHHHHHHHHHHHCCCCCCCCCCCCCCCCHHHCCCH

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 9163424