BacMap

Definition	Herpetosiphon aurantiacus ATCC 23779 chromosome, complete genome.
Accession	NC_009972
Length	6,346,587

Click here to switch to the map view.

The map label for this gene is ydaO [H]

Identifier: 159897720

GI number: 159897720

Start: 1369675

End: 1371558

Strand: Direct

Name: ydaO [H]

Synonym: Haur_1191

Alternate gene names: 159897720

Gene position: 1369675-1371558 (Clockwise)

Preceding gene: 159897719

Following gene: 159897721

Centisome position: 21.58

GC content: 48.04

Gene sequence:

>1884_bases
ATGTTGACCCAATTGAAGGGGGTTTTAGTGGGGAATCCGTTGGAGACTGCGGCCCAATCGCATGAGCGCTTGGATAAAAA
AACCGCGCTCGCAGTCTTCTCGTCTGATGCTTTATCATCAGTCGCCTATGCCACCGAAGAAATGCTTGTCCACCTTGTGC
CAGCCGGCATCATTGCGTTTAGCTCATCGCTGTGGCTGGGCATCGGCATCGCTGTTTTGTTGATGATCGTGACGATCTCG
TATCGCCAAACAATCACGGCCTATCCCAGCGGTGGTGGCTCGTACATCGTGGCCTCGGATAATTTAGGCACTCTTCCGGG
TTTGATCGCTGGCGGTGCATTATTAATTGACTATATTCTGACTGTGGCAGTGTCGATCTCGTCGGGCGTTTCGCAGTTGA
TCTCATTGGTCGAGCCGTTGCGTGATTATCGAATTGAAATTTGTTTGATTGGGATTCTCATTCTGACCTTGGCCAATTTG
CGTGGGATTCGCGAATCGGGGGCGATTTTCTCGCTGCCTACCTACTTTTTTATTACAGTCATTATGTTGACCCTCGGCTA
TGGCTTTTACAAACAATTTACAGGCGATATTCAGCCGTTAGTGCTTTCGGATAACCTGATGGGGCCACATGAACAAAGCT
TCTCGCCATTTGGAACTGAGGCTATGACCGCCTTTTTGCTGATGGGCGCGTTTGCCTCGGGCTGTTCAGCATTAACCGGG
GTTGAGGCAATTTCGAATGGCGTACCAGCATTTCGCAAGCCAGAGCCACACAACGCTCGCGTCACCATGGTTTGGATGGC
GGGATTACTATTAGTGATGTTCGCTGGCATTACCTGGTTTGCTCACAAGTATGGCGCACGCCCGCAATTCAACGAAACCG
TGATTTCGCAAATTGGGCGAGGCATTTGGGGGCGCACGACGGGCAGCGAAACGGGCTTCCCCAAAGTGATGCATGGCATG
TTGCAAATCTCAACCGCCGCAATTTTGCTGGTTGCAGCCAATACCAGCTACGCCGATTTCCCACGATTGATGTCGTTGTT
GGCCCGAGATGGCTTCTTGCCCCGCCAATTCTCATCATTGGGCGATCGTTTGGTCTTCTCGAATGGGATTCTTTTCTTGG
CGGTTGCTGCTGCACTGTTGGTGATTGGTTTTGATGGCTCGGTTACCAACTTAATTCCCTTGTATGCGGTTGGCGTGTTT
CTCTCATTCACACTCTCGCAATCGGGGATGGTGTTGCGCTGGTTGCGGCTCAAAACCAAGGGTTGGCAACTTAATTTAGT
GGTGAATGCAGTTGGCGCGATCGCAACTGGGATCGTTTTGATCATCAACGGCACAACGAAATTCAAAGAAGGTGCATGGT
TGGTGGTTATTTGTATTCCAATTCTCGTTTTGATTTTTACTACGATCAATCGTCATTACAAAGGCGTAGCCAAACAACTT
TCATTGGAAGGGTTTAGCAAACCCGTGCCATTAGAAAATAATGTGATTGTGCTCGTATCATCATTGCATCGTGGCACGGT
TAAAGCGCTTGAATATGCCAAATCAATTGCTCCAGGTAAAGTTCGCGCTTTGTATATTGAATTTGAGCATGAACACGAAA
AAACTGAACGTCTACAAGAACGCTGGCAACAGTGGGAGCCAGATGTGCCCTTGGATATTGAAATATCTAAATATCGTTCA
TTGTTACGCCCAGTTTTACGCTATGTTGATCGGATTGAAGCTGAGCGCAATGATGATATTCTAACCATTATCTTGCCTGA
ATTTATTCCGGCGCGAATTTGGGAATATGCCTTACATAACCAAACCGCCTTCTTCTTGAAAGGTGCGCTGCTATTCCGAC
GCAATAAAATCGTGATTAGCGTGCCATATCATCTTGAACGCTAA

Upstream 100 bases:

>100_bases
AGCTTAAGGGTAATTTATTGCGACCTTAAATACAGAACATTTGTTCAATTAAATATGTGTAATTAACCCTCGTTTTGAGG
AAACGCCAAGGAGTTTGTCC

Downstream 100 bases:

>100_bases
AACTTAGCAACTCTTAATCAAAAAACGCCTGAACTGCCTGTGCAGTCGGGCGTTTTTTCTTGACAGGCAGTGATGGGCAA
CGTATGATTACCGCCGTCTA

Product: amino acid permease-associated protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 627; Mature: 627

Protein sequence:

>627_residues
MLTQLKGVLVGNPLETAAQSHERLDKKTALAVFSSDALSSVAYATEEMLVHLVPAGIIAFSSSLWLGIGIAVLLMIVTIS
YRQTITAYPSGGGSYIVASDNLGTLPGLIAGGALLIDYILTVAVSISSGVSQLISLVEPLRDYRIEICLIGILILTLANL
RGIRESGAIFSLPTYFFITVIMLTLGYGFYKQFTGDIQPLVLSDNLMGPHEQSFSPFGTEAMTAFLLMGAFASGCSALTG
VEAISNGVPAFRKPEPHNARVTMVWMAGLLLVMFAGITWFAHKYGARPQFNETVISQIGRGIWGRTTGSETGFPKVMHGM
LQISTAAILLVAANTSYADFPRLMSLLARDGFLPRQFSSLGDRLVFSNGILFLAVAAALLVIGFDGSVTNLIPLYAVGVF
LSFTLSQSGMVLRWLRLKTKGWQLNLVVNAVGAIATGIVLIINGTTKFKEGAWLVVICIPILVLIFTTINRHYKGVAKQL
SLEGFSKPVPLENNVIVLVSSLHRGTVKALEYAKSIAPGKVRALYIEFEHEHEKTERLQERWQQWEPDVPLDIEISKYRS
LLRPVLRYVDRIEAERNDDILTIILPEFIPARIWEYALHNQTAFFLKGALLFRRNKIVISVPYHLER

Sequences:

>Translated_627_residues
MLTQLKGVLVGNPLETAAQSHERLDKKTALAVFSSDALSSVAYATEEMLVHLVPAGIIAFSSSLWLGIGIAVLLMIVTIS
YRQTITAYPSGGGSYIVASDNLGTLPGLIAGGALLIDYILTVAVSISSGVSQLISLVEPLRDYRIEICLIGILILTLANL
RGIRESGAIFSLPTYFFITVIMLTLGYGFYKQFTGDIQPLVLSDNLMGPHEQSFSPFGTEAMTAFLLMGAFASGCSALTG
VEAISNGVPAFRKPEPHNARVTMVWMAGLLLVMFAGITWFAHKYGARPQFNETVISQIGRGIWGRTTGSETGFPKVMHGM
LQISTAAILLVAANTSYADFPRLMSLLARDGFLPRQFSSLGDRLVFSNGILFLAVAAALLVIGFDGSVTNLIPLYAVGVF
LSFTLSQSGMVLRWLRLKTKGWQLNLVVNAVGAIATGIVLIINGTTKFKEGAWLVVICIPILVLIFTTINRHYKGVAKQL
SLEGFSKPVPLENNVIVLVSSLHRGTVKALEYAKSIAPGKVRALYIEFEHEHEKTERLQERWQQWEPDVPLDIEISKYRS
LLRPVLRYVDRIEAERNDDILTIILPEFIPARIWEYALHNQTAFFLKGALLFRRNKIVISVPYHLER
>Mature_627_residues
MLTQLKGVLVGNPLETAAQSHERLDKKTALAVFSSDALSSVAYATEEMLVHLVPAGIIAFSSSLWLGIGIAVLLMIVTIS
YRQTITAYPSGGGSYIVASDNLGTLPGLIAGGALLIDYILTVAVSISSGVSQLISLVEPLRDYRIEICLIGILILTLANL
RGIRESGAIFSLPTYFFITVIMLTLGYGFYKQFTGDIQPLVLSDNLMGPHEQSFSPFGTEAMTAFLLMGAFASGCSALTG
VEAISNGVPAFRKPEPHNARVTMVWMAGLLLVMFAGITWFAHKYGARPQFNETVISQIGRGIWGRTTGSETGFPKVMHGM
LQISTAAILLVAANTSYADFPRLMSLLARDGFLPRQFSSLGDRLVFSNGILFLAVAAALLVIGFDGSVTNLIPLYAVGVF
LSFTLSQSGMVLRWLRLKTKGWQLNLVVNAVGAIATGIVLIINGTTKFKEGAWLVVICIPILVLIFTTINRHYKGVAKQL
SLEGFSKPVPLENNVIVLVSSLHRGTVKALEYAKSIAPGKVRALYIEFEHEHEKTERLQERWQQWEPDVPLDIEISKYRS
LLRPVLRYVDRIEAERNDDILTIILPEFIPARIWEYALHNQTAFFLKGALLFRRNKIVISVPYHLER

Specific function: Unknown

COG id: COG0531

COG function: function code E; Amino acid transporters

Gene ontology:

Cell location: Cell membrane; Multi-pass membrane protein (Potential) [H]

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Belongs to the amino acid-polyamine-organocation (APC) superfamily [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR002293 [H]

Pfam domain/function: NA

EC number: NA

Molecular weight: Translated: 68822; Mature: 68822

Theoretical pI: Translated: 9.21; Mature: 9.21

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.5 %Cys     (Translated Protein)
2.2 %Met     (Translated Protein)
2.7 %Cys+Met (Translated Protein)
0.5 %Cys     (Mature Protein)
2.2 %Met     (Mature Protein)
2.7 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MLTQLKGVLVGNPLETAAQSHERLDKKTALAVFSSDALSSVAYATEEMLVHLVPAGIIAF
CCCCCCCEEECCCHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHH
SSSLWLGIGIAVLLMIVTISYRQTITAYPSGGGSYIVASDNLGTLPGLIAGGALLIDYIL
HCHHHHHHHHHHHHHHHHHHHHHEEEECCCCCCCEEEECCCCCCCHHHHHHHHHHHHHHH
TVAVSISSGVSQLISLVEPLRDYRIEICLIGILILTLANLRGIRESGAIFSLPTYFFITV
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEECHHHHHHHH
IMLTLGYGFYKQFTGDIQPLVLSDNLMGPHEQSFSPFGTEAMTAFLLMGAFASGCSALTG
HHHHHCCHHHHHHCCCCCEEEEECCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHH
VEAISNGVPAFRKPEPHNARVTMVWMAGLLLVMFAGITWFAHKYGARPQFNETVISQIGR
HHHHHCCCCCCCCCCCCCCEEEHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHCC
GIWGRTTGSETGFPKVMHGMLQISTAAILLVAANTSYADFPRLMSLLARDGFLPRQFSSL
CCCCCCCCCCCCCHHHHHHHHHHHHHEEEEEEECCCCCHHHHHHHHHHHCCCCHHHHHHH
GDRLVFSNGILFLAVAAALLVIGFDGSVTNLIPLYAVGVFLSFTLSQSGMVLRWLRLKTK
CCEEECCCCHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHCCCCCCEEEEEECCCC
GWQLNLVVNAVGAIATGIVLIINGTTKFKEGAWLVVICIPILVLIFTTINRHYKGVAKQL
CEEEEEHHHHHHHHHCCEEEEEECCCCCCCCCEEHHHHHHHHHHHHHHHHHHHHHHHHHH
SLEGFSKPVPLENNVIVLVSSLHRGTVKALEYAKSIAPGKVRALYIEFEHEHEKTERLQE
HHCCCCCCCCCCCCEEEEEECCCCHHHHHHHHHHHCCCCCEEEEEEEECCHHHHHHHHHH
RWQQWEPDVPLDIEISKYRSLLRPVLRYVDRIEAERNDDILTIILPEFIPARIWEYALHN
HHHHCCCCCCEEEEHHHHHHHHHHHHHHHHHHHCCCCCCEEEEECCHHHHHHHHHHHHCC
QTAFFLKGALLFRRNKIVISVPYHLER
CHHHHHHHHHHEECCEEEEECCCCCCC
>Mature Secondary Structure
MLTQLKGVLVGNPLETAAQSHERLDKKTALAVFSSDALSSVAYATEEMLVHLVPAGIIAF
CCCCCCCEEECCCHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHHHHHHH
SSSLWLGIGIAVLLMIVTISYRQTITAYPSGGGSYIVASDNLGTLPGLIAGGALLIDYIL
HCHHHHHHHHHHHHHHHHHHHHHEEEECCCCCCCEEEECCCCCCCHHHHHHHHHHHHHHH
TVAVSISSGVSQLISLVEPLRDYRIEICLIGILILTLANLRGIRESGAIFSLPTYFFITV
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEECHHHHHHHH
IMLTLGYGFYKQFTGDIQPLVLSDNLMGPHEQSFSPFGTEAMTAFLLMGAFASGCSALTG
HHHHHCCHHHHHHCCCCCEEEEECCCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHH
VEAISNGVPAFRKPEPHNARVTMVWMAGLLLVMFAGITWFAHKYGARPQFNETVISQIGR
HHHHHCCCCCCCCCCCCCCEEEHHHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHCC
GIWGRTTGSETGFPKVMHGMLQISTAAILLVAANTSYADFPRLMSLLARDGFLPRQFSSL
CCCCCCCCCCCCCHHHHHHHHHHHHHEEEEEEECCCCCHHHHHHHHHHHCCCCHHHHHHH
GDRLVFSNGILFLAVAAALLVIGFDGSVTNLIPLYAVGVFLSFTLSQSGMVLRWLRLKTK
CCEEECCCCHHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHCCCCCCEEEEEECCCC
GWQLNLVVNAVGAIATGIVLIINGTTKFKEGAWLVVICIPILVLIFTTINRHYKGVAKQL
CEEEEEHHHHHHHHHCCEEEEEECCCCCCCCCEEHHHHHHHHHHHHHHHHHHHHHHHHHH
SLEGFSKPVPLENNVIVLVSSLHRGTVKALEYAKSIAPGKVRALYIEFEHEHEKTERLQE
HHCCCCCCCCCCCCEEEEEECCCCHHHHHHHHHHHCCCCCEEEEEEEECCHHHHHHHHHH
RWQQWEPDVPLDIEISKYRSLLRPVLRYVDRIEAERNDDILTIILPEFIPARIWEYALHN
HHHHCCCCCCEEEEHHHHHHHHHHHHHHHHHHHCCCCCCEEEEECCHHHHHHHHHHHHCC
QTAFFLKGALLFRRNKIVISVPYHLER
CHHHHHHHHHHEECCEEEEECCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 9384377 [H]