Definition | Ureaplasma parvum serovar 3 str. ATCC 27815 chromosome, complete genome. |
---|---|
Accession | NC_010503 |
Length | 751,679 |
Click here to switch to the map view.
The map label for this gene is ydcI [H]
Identifier: 170762282
GI number: 170762282
Start: 29794
End: 31914
Strand: Reverse
Name: ydcI [H]
Synonym: UPA3_0029
Alternate gene names: 170762282
Gene position: 31914-29794 (Counterclockwise)
Preceding gene: 170762309
Following gene: 170762061
Centisome position: 4.25
GC content: 24.61
Gene sequence:
>2121_bases ATGATTGATTTAATTATTAAAACACTAGTTCAAAAATTAAAAATTGAGGCAAAATATATAACAAATGTTTTGAATTTATT AGCTGATAATAATACTATTGCATTCATTGCTAGATATCGTAAACATTTGACTAACAATATGGATGAATTTCAAATTCAAG CAATTGCACATGAATATGAATATCTTACAAAATTAAATAAACGTAAAGAAGTAATTATTAAAAATTTAGAACAAAAAGGT TTATTAACTAATGACTTATTAGAATTAATTAATAATTGTCAACGGCTTGTTGATCTTGAAAATCTTTATGAACCTTATGC CTCAAATAAAAAAACAAAAGCATCAATCGCCATTGAAAAAGGGTTAGAACCATTAGCATTATTAATATTAAAAAATAATC CTAATTCTAATATTAAAGAAGTTGCAAAACAATATTTAAATGAACAAGTTTTAAGTGTTGATGAAGCTATTGCTGGAGCT TGTGATATTATTGCCCAAAAAGTTGCTAACGATACAACTTTAAGAGAAATGCTTTATGAAACAATTAACAAACATGCTAA ATTAATCACAAGAATTAATAAAATAACAAATGACCCAACTAAAAACTTTGCTTTATATTATGAGTTTAGTTGCCCAATTA AATATTTAAAAGCATATCAATTAATGGCTATTGATCGAGCTAATGAATTAAAAATCATTGCATTTAAACTTGATTTTAAA AAAGAATTTCTTATTGATTTTGCTGTCAATAAATATACTAGAAAAATCAAAAGTAACAGCTATGACTACATTAAATCAGC TGTTAATGATGGTTTTGATCGTTTATTAATTCCTTCAGTTTCAAATGCTGTTTACAAAGAAAAATTAGAGGAAGCTCACC AACAATCAGCACAAATTTTTAGTAATAATTTACAACAATTATTATTACAAAAACCTTTAAAAAGCCATGTTGTTTTAGGA TTTGATCCAGGATATGTGCATGGTTGCAAATTAGCAATTGTTAATAAAAACAATCAATTATTACATACTGATATTATTTA CCCTCACAAACCACAGATATTAATTACACAAGCTAAAAATACGTTAATATCCTTAATTAATAAATACGAAGTTAATACAA TAGCAATTGGCAATGGAACAGCATCAAATGAAAGTGTAATTTTTATTAGTGATTTAATTAAGGAATTCAAATTAAATCTT AATTATTGTGTAATTAGTGAAGATGGTGCTTCAATTTATTCAGCATCATCAATTGCAAGTGAAGAATTTCCTAACTTAAG TGTTGAAAAACGTTCGGCAATTAGTATTGCACGAAGAATCATTGATCCTTTAAGTGAATTAATAAAAATCGATCCAAAAA GTATTGGTGTAGGTCAATATCAACACGATATTAATAAAAACATTCTTCAACAAAAAGTTGATTTTTGTATTGATTATTGT GTTAATCAAGTTGGTGTTGATGTTAATACTGCTTCAATTCCTTTGTTGTCTAAAGTATCAGGTTTAAATAAGCGAAGTGC AAAAAAAATTTTTGAATATGTTAAAAAACATCAATTTATTGAAAATCGTGAACAATTAAAAACCATTCCTTACATTACCG ATAAAGTTTTTGAGCAAGCCGCTGGTTTTTTACGAATTAATAATGCTAATAATTTTTTAGATAGAACAAGTATTCATCCA GAAGCATATCTAGTTGTTAATGAATTATGTAAATATTTACAATTACCAATTAATAAATTAATAAATAATTATCAAGTTTT AAATCAATTAAATCCTAATGAATTAACTACTATTCTAAAAACAGATATTTATACTATTGAAAACATTATTAATAACTTAA AAAATCCTTTACAAGATGTTCGTGATGATTATGATATTCCTATTTTACGTTCACAAATGGTTGATATTAATAACTTGAAA ATAGGGATGTTAGTACAAGGAACAATTCGTAACCAAACAGAGTTTGGTAGTTTTATTGATATTGGTTTAAAAAATGATGC ATTGTTACATATTTCAAACTATTGTGAAGAAGATAATTTGCATGTTAATAAAAATATTAATGTTTATATTGATAAAATAG ATACAATTACTCAAAAAATTTCATTAAAGTTAAAATTATAG
Upstream 100 bases:
>100_bases CCAATTATCTTTTACTTAGTAATTATAAAGCATTTAAATTAACATAACTAATTTTGACTATCAAAAGTTTATAATTTATT AATTCTAAAAGGGGTGCAAA
Downstream 100 bases:
>100_bases AAATTATGAAAATAAAATTAAAAAAAATAATCATGTCTTTTTTGGGATTGCCAATTTTGGCAATTCCCCTTATCGTTAGC GCTTGTTCGCAATTTAAAAT
Product: S1 RNA-binding domain-containing protein
Products: NA
Alternate protein names: NA
Number of amino acids: Translated: 706; Mature: 706
Protein sequence:
>706_residues MIDLIIKTLVQKLKIEAKYITNVLNLLADNNTIAFIARYRKHLTNNMDEFQIQAIAHEYEYLTKLNKRKEVIIKNLEQKG LLTNDLLELINNCQRLVDLENLYEPYASNKKTKASIAIEKGLEPLALLILKNNPNSNIKEVAKQYLNEQVLSVDEAIAGA CDIIAQKVANDTTLREMLYETINKHAKLITRINKITNDPTKNFALYYEFSCPIKYLKAYQLMAIDRANELKIIAFKLDFK KEFLIDFAVNKYTRKIKSNSYDYIKSAVNDGFDRLLIPSVSNAVYKEKLEEAHQQSAQIFSNNLQQLLLQKPLKSHVVLG FDPGYVHGCKLAIVNKNNQLLHTDIIYPHKPQILITQAKNTLISLINKYEVNTIAIGNGTASNESVIFISDLIKEFKLNL NYCVISEDGASIYSASSIASEEFPNLSVEKRSAISIARRIIDPLSELIKIDPKSIGVGQYQHDINKNILQQKVDFCIDYC VNQVGVDVNTASIPLLSKVSGLNKRSAKKIFEYVKKHQFIENREQLKTIPYITDKVFEQAAGFLRINNANNFLDRTSIHP EAYLVVNELCKYLQLPINKLINNYQVLNQLNPNELTTILKTDIYTIENIINNLKNPLQDVRDDYDIPILRSQMVDINNLK IGMLVQGTIRNQTEFGSFIDIGLKNDALLHISNYCEEDNLHVNKNINVYIDKIDTITQKISLKLKL
Sequences:
>Translated_706_residues MIDLIIKTLVQKLKIEAKYITNVLNLLADNNTIAFIARYRKHLTNNMDEFQIQAIAHEYEYLTKLNKRKEVIIKNLEQKG LLTNDLLELINNCQRLVDLENLYEPYASNKKTKASIAIEKGLEPLALLILKNNPNSNIKEVAKQYLNEQVLSVDEAIAGA CDIIAQKVANDTTLREMLYETINKHAKLITRINKITNDPTKNFALYYEFSCPIKYLKAYQLMAIDRANELKIIAFKLDFK KEFLIDFAVNKYTRKIKSNSYDYIKSAVNDGFDRLLIPSVSNAVYKEKLEEAHQQSAQIFSNNLQQLLLQKPLKSHVVLG FDPGYVHGCKLAIVNKNNQLLHTDIIYPHKPQILITQAKNTLISLINKYEVNTIAIGNGTASNESVIFISDLIKEFKLNL NYCVISEDGASIYSASSIASEEFPNLSVEKRSAISIARRIIDPLSELIKIDPKSIGVGQYQHDINKNILQQKVDFCIDYC VNQVGVDVNTASIPLLSKVSGLNKRSAKKIFEYVKKHQFIENREQLKTIPYITDKVFEQAAGFLRINNANNFLDRTSIHP EAYLVVNELCKYLQLPINKLINNYQVLNQLNPNELTTILKTDIYTIENIINNLKNPLQDVRDDYDIPILRSQMVDINNLK IGMLVQGTIRNQTEFGSFIDIGLKNDALLHISNYCEEDNLHVNKNINVYIDKIDTITQKISLKLKL >Mature_706_residues MIDLIIKTLVQKLKIEAKYITNVLNLLADNNTIAFIARYRKHLTNNMDEFQIQAIAHEYEYLTKLNKRKEVIIKNLEQKG LLTNDLLELINNCQRLVDLENLYEPYASNKKTKASIAIEKGLEPLALLILKNNPNSNIKEVAKQYLNEQVLSVDEAIAGA CDIIAQKVANDTTLREMLYETINKHAKLITRINKITNDPTKNFALYYEFSCPIKYLKAYQLMAIDRANELKIIAFKLDFK KEFLIDFAVNKYTRKIKSNSYDYIKSAVNDGFDRLLIPSVSNAVYKEKLEEAHQQSAQIFSNNLQQLLLQKPLKSHVVLG FDPGYVHGCKLAIVNKNNQLLHTDIIYPHKPQILITQAKNTLISLINKYEVNTIAIGNGTASNESVIFISDLIKEFKLNL NYCVISEDGASIYSASSIASEEFPNLSVEKRSAISIARRIIDPLSELIKIDPKSIGVGQYQHDINKNILQQKVDFCIDYC VNQVGVDVNTASIPLLSKVSGLNKRSAKKIFEYVKKHQFIENREQLKTIPYITDKVFEQAAGFLRINNANNFLDRTSIHP EAYLVVNELCKYLQLPINKLINNYQVLNQLNPNELTTILKTDIYTIENIINNLKNPLQDVRDDYDIPILRSQMVDINNLK IGMLVQGTIRNQTEFGSFIDIGLKNDALLHISNYCEEDNLHVNKNINVYIDKIDTITQKISLKLKL
Specific function: Unknown
COG id: COG2183
COG function: function code K; Transcriptional accessory protein
Gene ontology:
Cell location: Cytoplasm [C]
Metaboloic importance: Non_Essential [C]
Operon status: Not Known
Operon components: None
Similarity: Contains 1 S1 motif domain [H]
Homologues:
Organism=Homo sapiens, GI221136781, Length=787, Percent_Identity=31.2579415501906, Blast_Score=374, Evalue=1e-103, Organism=Homo sapiens, GI27597090, Length=348, Percent_Identity=25.2873563218391, Blast_Score=73, Evalue=1e-12, Organism=Escherichia coli, GI87082262, Length=725, Percent_Identity=33.5172413793103, Blast_Score=437, Evalue=1e-123, Organism=Caenorhabditis elegans, GI17511129, Length=726, Percent_Identity=26.5840220385675, Blast_Score=204, Evalue=2e-52, Organism=Drosophila melanogaster, GI62484314, Length=747, Percent_Identity=29.718875502008, Blast_Score=341, Evalue=9e-94,
Paralogues:
None
Copy number: NA
Swissprot (AC and ID): NA
Other databases:
- InterPro: IPR012340 - InterPro: IPR016027 - InterPro: IPR003029 - InterPro: IPR005227 - InterPro: IPR006641 - InterPro: IPR022967 - InterPro: IPR018974 - InterPro: IPR023097 [H]
Pfam domain/function: PF00575 S1; PF09371 Tex_N [H]
EC number: NA
Molecular weight: Translated: 80661; Mature: 80661
Theoretical pI: Translated: 8.62; Mature: 8.62
Prosite motif: PS50126 S1
Important sites: NA
Signals:
None
Transmembrane regions:
None
Cys/Met content:
1.3 %Cys (Translated Protein) 0.8 %Met (Translated Protein) 2.1 %Cys+Met (Translated Protein) 1.3 %Cys (Mature Protein) 0.8 %Met (Mature Protein) 2.1 %Cys+Met (Mature Protein)
Secondary structure:
>Translated Secondary Structure MIDLIIKTLVQKLKIEAKYITNVLNLLADNNTIAFIARYRKHLTNNMDEFQIQAIAHEYE CHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHCCCHHHHHHHHHHHHH YLTKLNKRKEVIIKNLEQKGLLTNDLLELINNCQRLVDLENLYEPYASNKKTKASIAIEK HHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHC GLEPLALLILKNNPNSNIKEVAKQYLNEQVLSVDEAIAGACDIIAQKVANDTTLREMLYE CCCEEEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHH TINKHAKLITRINKITNDPTKNFALYYEFSCPIKYLKAYQLMAIDRANELKIIAFKLDFK HHHHHHHHHHHHHHHCCCCCCCEEEEEEECCCHHHHHHHHHHEECCCCCEEEEEEEECCC KEFLIDFAVNKYTRKIKSNSYDYIKSAVNDGFDRLLIPSVSNAVYKEKLEEAHQQSAQIF HHHHHHHHHHHHHHHHCCCCHHHHHHHHCCCCCEEECCCHHHHHHHHHHHHHHHHHHHHH SNNLQQLLLQKPLKSHVVLGFDPGYVHGCKLAIVNKNNQLLHTDIIYPHKPQILITQAKN HHHHHHHHHHCCHHHCEEEECCCCCCCCEEEEEEECCCCEEEEEEECCCCCCEEEEHHHH TLISLINKYEVNTIAIGNGTASNESVIFISDLIKEFKLNLNYCVISEDGASIYSASSIAS HHHHHHHHCCCEEEEECCCCCCCCCEEEHHHHHHHHCCCCCEEEEECCCCCHHHHHHHHH EEFPNLSVEKRSAISIARRIIDPLSELIKIDPKSIGVGQYQHDINKNILQQKVDFCIDYC HCCCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHH VNQVGVDVNTASIPLLSKVSGLNKRSAKKIFEYVKKHQFIENREQLKTIPYITDKVFEQA HHHHCCCCCCCCCHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHC AGFLRINNANNFLDRTSIHPEAYLVVNELCKYLQLPINKLINNYQVLNQLNPNELTTILK CCEEEECCCCCCHHHCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHH TDIYTIENIINNLKNPLQDVRDDYDIPILRSQMVDINNLKIGMLVQGTIRNQTEFGSFID HHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHCCCCCCEEEEEEEECCCCCCCCCCCEEE IGLKNDALLHISNYCEEDNLHVNKNINVYIDKIDTITQKISLKLKL ECCCCCEEEEEHHCCCCCCEEECCCCEEEEECHHHHHHHHEEEEEC >Mature Secondary Structure MIDLIIKTLVQKLKIEAKYITNVLNLLADNNTIAFIARYRKHLTNNMDEFQIQAIAHEYE CHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHHHCCCHHHHHHHHHHHHH YLTKLNKRKEVIIKNLEQKGLLTNDLLELINNCQRLVDLENLYEPYASNKKTKASIAIEK HHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHC GLEPLALLILKNNPNSNIKEVAKQYLNEQVLSVDEAIAGACDIIAQKVANDTTLREMLYE CCCEEEEEEEECCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHH TINKHAKLITRINKITNDPTKNFALYYEFSCPIKYLKAYQLMAIDRANELKIIAFKLDFK HHHHHHHHHHHHHHHCCCCCCCEEEEEEECCCHHHHHHHHHHEECCCCCEEEEEEEECCC KEFLIDFAVNKYTRKIKSNSYDYIKSAVNDGFDRLLIPSVSNAVYKEKLEEAHQQSAQIF HHHHHHHHHHHHHHHHCCCCHHHHHHHHCCCCCEEECCCHHHHHHHHHHHHHHHHHHHHH SNNLQQLLLQKPLKSHVVLGFDPGYVHGCKLAIVNKNNQLLHTDIIYPHKPQILITQAKN HHHHHHHHHHCCHHHCEEEECCCCCCCCEEEEEEECCCCEEEEEEECCCCCCEEEEHHHH TLISLINKYEVNTIAIGNGTASNESVIFISDLIKEFKLNLNYCVISEDGASIYSASSIAS HHHHHHHHCCCEEEEECCCCCCCCCEEEHHHHHHHHCCCCCEEEEECCCCCHHHHHHHHH EEFPNLSVEKRSAISIARRIIDPLSELIKIDPKSIGVGQYQHDINKNILQQKVDFCIDYC HCCCCCCCHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHH VNQVGVDVNTASIPLLSKVSGLNKRSAKKIFEYVKKHQFIENREQLKTIPYITDKVFEQA HHHHCCCCCCCCCHHHHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHC AGFLRINNANNFLDRTSIHPEAYLVVNELCKYLQLPINKLINNYQVLNQLNPNELTTILK CCEEEECCCCCCHHHCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHH TDIYTIENIINNLKNPLQDVRDDYDIPILRSQMVDINNLKIGMLVQGTIRNQTEFGSFID HHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHCCCCCCEEEEEEEECCCCCCCCCCCEEE IGLKNDALLHISNYCEEDNLHVNKNINVYIDKIDTITQKISLKLKL ECCCCCEEEEEHHCCCCCCEEECCCCEEEEECHHHHHHHHEEEEEC
PDB accession: NA
Resolution: NA
Structure class: Unstructured
Cofactors: NA
Metal ions: NA
Kcat value (1/min): NA
Specific activity: NA
Km value (mM): NA
Substrates: NA
Specific reaction: NA
General reaction: NA
Inhibitor: NA
Structure determination priority: 9.0
TargetDB status: NA
Availability: NA
References: 9384377 [H]