BacMap

Definition	Bacillus anthracis str. Sterne chromosome, complete genome.
Accession	NC_005945
Length	5,228,663

Click here to switch to the map view.

The map label for this gene is arnA [H]

Identifier: 49183507

GI number: 49183507

Start: 500802

End: 501767

Strand: Direct

Name: arnA [H]

Synonym: BAS0479

Alternate gene names: 49183507

Gene position: 500802-501767 (Clockwise)

Preceding gene: 49183506

Following gene: 49183508

Centisome position: 9.58

GC content: 36.44

Gene sequence:

>966_bases
ATGAGTAAGAAATGTTTAATTACAGGCGGAGCAGGATTTATTGGATCCCATTTAGCTGAAGAGTTGGTGGGAAGAGGTTA
TAATGTCACGATTGTTGATAACTTCTATAAAGGGAAAAATAAATATCATGATGAGTTAATGAAAGAAATTCGGGTTATTC
CAATAAGTGTCTTAGACAAAAATTCTATTTATGAACTCGTAAACCAGCATGATGTTGTGTTTCATTTAGCAGCAATTTTA
GGTGTGAAAACGACAATGGAAAAGAGTATAGAGCTAATTGAAACGAATTTTGATGGAACGAGAAACATTTTACAAGCAGC
GCTAAAAGGAAAAAAGAAAGTAGTTTTTGCGTCTACTTCAGAAGTATATGGTAAGGCAAAGCCACCCTTCTCTGAAGAAG
GAGACCGATTATACGGTGCAACTTCTAAAATACGTTGGAGTTATGCAATTTGTAAAACGTTAGAAGAAACATTATGTTTA
GGATACGCTTTAGAAGGTTTACCTGTAACGATTGTTCGTTATTTTAATATTTATGGTCCACGAGCGAAAGATGGTCCGTA
TGCAGGGGTAATCCCGCGATTTATTAGTGCGGCCCTGCAGGGAGAAGACATTCTCGTATATGGAGATGGAGAGCAAACAC
GTTGCTTTACGTATGTAAGTGATGCGGTAGAGGCAACGATTCGGGCAATGGATGAGAAGGTAAATGGTGAGATTATTAAT
ATAGGTTCTGAGAATGAAAAAAGTATAAAAGAAGTAGCAGAGGTCATTAAAAAATTAACGGATTCTTCTTCAAAGATTGT
GCAAGTACCTTTTGAAGAAGTATATCCACATGGTTTTGAAGAAATTCCAAATAGAAGACCAGACGTAACAAAATTAAAAG
ATCTTGTTCAATTTCAGGCGAAAGTAACGTGGGAAGACGGATTGAAGGAAACAATTAAGTGGTTTCGTGAAGAAGACAAT
GGCTAA

Upstream 100 bases:

>100_bases
GTATTTTAATTTTAACGGATCATTCTAATATTGATTGGAAGCTTTTTAAAGGAATAAAGCGAGTAGTAGATACACGTGGA
ATTGTAAAGAAGGTGAGTAA

Downstream 100 bases:

>100_bases
GTCATTATCTGTTATTATTCCTGCATGGAATGAAATCGATACGATTTCAGACGTTATTCAATCGGTAAAAGGATTAAATC
CATTAGAGATTATTGTAGTA

Product: NAD-dependent epimerase/dehydratase family protein

Products: NA

Alternate protein names: UDP-4-amino-4-deoxy-L-arabinose formyltransferase; ArnAFT; UDP-L-Ara4N formyltransferase; UDP-glucuronic acid oxidase, UDP-4-keto-hexauronic acid decarboxylating; ArnADH; UDP-GlcUA decarboxylase; UDP-glucuronic acid dehydrogenase [H]

Number of amino acids: Translated: 321; Mature: 320

Protein sequence:

>321_residues
MSKKCLITGGAGFIGSHLAEELVGRGYNVTIVDNFYKGKNKYHDELMKEIRVIPISVLDKNSIYELVNQHDVVFHLAAIL
GVKTTMEKSIELIETNFDGTRNILQAALKGKKKVVFASTSEVYGKAKPPFSEEGDRLYGATSKIRWSYAICKTLEETLCL
GYALEGLPVTIVRYFNIYGPRAKDGPYAGVIPRFISAALQGEDILVYGDGEQTRCFTYVSDAVEATIRAMDEKVNGEIIN
IGSENEKSIKEVAEVIKKLTDSSSKIVQVPFEEVYPHGFEEIPNRRPDVTKLKDLVQFQAKVTWEDGLKETIKWFREEDN
G

Sequences:

>Translated_321_residues
MSKKCLITGGAGFIGSHLAEELVGRGYNVTIVDNFYKGKNKYHDELMKEIRVIPISVLDKNSIYELVNQHDVVFHLAAIL
GVKTTMEKSIELIETNFDGTRNILQAALKGKKKVVFASTSEVYGKAKPPFSEEGDRLYGATSKIRWSYAICKTLEETLCL
GYALEGLPVTIVRYFNIYGPRAKDGPYAGVIPRFISAALQGEDILVYGDGEQTRCFTYVSDAVEATIRAMDEKVNGEIIN
IGSENEKSIKEVAEVIKKLTDSSSKIVQVPFEEVYPHGFEEIPNRRPDVTKLKDLVQFQAKVTWEDGLKETIKWFREEDN
G
>Mature_320_residues
SKKCLITGGAGFIGSHLAEELVGRGYNVTIVDNFYKGKNKYHDELMKEIRVIPISVLDKNSIYELVNQHDVVFHLAAILG
VKTTMEKSIELIETNFDGTRNILQAALKGKKKVVFASTSEVYGKAKPPFSEEGDRLYGATSKIRWSYAICKTLEETLCLG
YALEGLPVTIVRYFNIYGPRAKDGPYAGVIPRFISAALQGEDILVYGDGEQTRCFTYVSDAVEATIRAMDEKVNGEIINI
GSENEKSIKEVAEVIKKLTDSSSKIVQVPFEEVYPHGFEEIPNRRPDVTKLKDLVQFQAKVTWEDGLKETIKWFREEDNG

Specific function: Bifunctional enzyme that catalyzes the oxidative decarboxylation of UDP-glucuronic acid (UDP-GlcUA) to UDP-4-keto- arabinose (UDP-Ara4O) and the addition of a formyl group to UDP-4- amino-4-deoxy-L-arabinose (UDP-L-Ara4N) to form UDP-L-4-formamido- arabin

COG id: COG0451

COG function: function code MG; Nucleoside-diphosphate-sugar epimerases

Gene ontology:

Cell location: Cytoplasm [C]

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: In the C-terminal section; belongs to the sugar epimerase family. UDP-glucuronic acid decarboxylase subfamily [H]

Homologues:

Organism=Homo sapiens, GI42516563, Length=321, Percent_Identity=35.202492211838, Blast_Score=179, Evalue=3e-45,
Organism=Homo sapiens, GI7657641, Length=330, Percent_Identity=30, Blast_Score=120, Evalue=2e-27,
Organism=Homo sapiens, GI56237023, Length=290, Percent_Identity=25.1724137931034, Blast_Score=84, Evalue=2e-16,
Organism=Homo sapiens, GI56118217, Length=290, Percent_Identity=25.1724137931034, Blast_Score=84, Evalue=2e-16,
Organism=Homo sapiens, GI189083684, Length=290, Percent_Identity=25.1724137931034, Blast_Score=84, Evalue=2e-16,
Organism=Homo sapiens, GI193211614, Length=240, Percent_Identity=25, Blast_Score=74, Evalue=2e-13,
Organism=Homo sapiens, GI8393516, Length=240, Percent_Identity=25, Blast_Score=74, Evalue=2e-13,
Organism=Escherichia coli, GI1788589, Length=334, Percent_Identity=28.7425149700599, Blast_Score=121, Evalue=5e-29,
Organism=Escherichia coli, GI48994969, Length=350, Percent_Identity=29.1428571428571, Blast_Score=99, Evalue=3e-22,
Organism=Escherichia coli, GI1788353, Length=341, Percent_Identity=29.3255131964809, Blast_Score=99, Evalue=3e-22,
Organism=Escherichia coli, GI1788365, Length=342, Percent_Identity=28.6549707602339, Blast_Score=85, Evalue=6e-18,
Organism=Escherichia coli, GI1786974, Length=342, Percent_Identity=22.8070175438596, Blast_Score=81, Evalue=1e-16,
Organism=Escherichia coli, GI1790049, Length=330, Percent_Identity=23.030303030303, Blast_Score=67, Evalue=1e-12,
Organism=Caenorhabditis elegans, GI17539532, Length=322, Percent_Identity=33.2298136645963, Blast_Score=160, Evalue=7e-40,
Organism=Caenorhabditis elegans, GI17568069, Length=334, Percent_Identity=31.1377245508982, Blast_Score=115, Evalue=2e-26,
Organism=Caenorhabditis elegans, GI71982035, Length=290, Percent_Identity=27.2413793103448, Blast_Score=90, Evalue=2e-18,
Organism=Caenorhabditis elegans, GI71982038, Length=292, Percent_Identity=27.0547945205479, Blast_Score=85, Evalue=6e-17,
Organism=Caenorhabditis elegans, GI115532424, Length=336, Percent_Identity=25.8928571428571, Blast_Score=80, Evalue=2e-15,
Organism=Saccharomyces cerevisiae, GI6319493, Length=357, Percent_Identity=23.8095238095238, Blast_Score=65, Evalue=1e-11,
Organism=Drosophila melanogaster, GI21356223, Length=322, Percent_Identity=37.5776397515528, Blast_Score=184, Evalue=6e-47,
Organism=Drosophila melanogaster, GI19923002, Length=260, Percent_Identity=27.3076923076923, Blast_Score=75, Evalue=8e-14,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR021168
- InterPro:   IPR001509
- InterPro:   IPR005793
- InterPro:   IPR002376
- InterPro:   IPR011034
- InterPro:   IPR016040 [H]

Pfam domain/function: PF01370 Epimerase; PF02911 Formyl_trans_C; PF00551 Formyl_trans_N [H]

EC number: =2.1.2.13; =1.1.1.305 [H]

Molecular weight: Translated: 35978; Mature: 35846

Theoretical pI: Translated: 5.79; Mature: 5.79

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.2 %Cys     (Translated Protein)
1.2 %Met     (Translated Protein)
2.5 %Cys+Met (Translated Protein)
1.2 %Cys     (Mature Protein)
0.9 %Met     (Mature Protein)
2.2 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MSKKCLITGGAGFIGSHLAEELVGRGYNVTIVDNFYKGKNKYHDELMKEIRVIPISVLDK
CCCCEEEECCCHHHHHHHHHHHHCCCCEEEEEECCCCCCCHHHHHHHHHHHCCEEEEECC
NSIYELVNQHDVVFHLAAILGVKTTMEKSIELIETNFDGTRNILQAALKGKKKVVFASTS
HHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHCCCCEEEEEECH
EVYGKAKPPFSEEGDRLYGATSKIRWSYAICKTLEETLCLGYALEGLPVTIVRYFNIYGP
HHCCCCCCCCCCCCCEEECCCHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEHHHHHCCCC
RAKDGPYAGVIPRFISAALQGEDILVYGDGEQTRCFTYVSDAVEATIRAMDEKVNGEIIN
CCCCCCCCHHHHHHHHHHHCCCEEEEEECCCCCCHHHHHHHHHHHHHHHHHHHCCCCEEE
IGSENEKSIKEVAEVIKKLTDSSSKIVQVPFEEVYPHGFEEIPNRRPDVTKLKDLVQFQA
CCCCCHHHHHHHHHHHHHHHCCCCCEEECCHHHHCCCCHHHCCCCCCCHHHHHHHHHHHH
KVTWEDGLKETIKWFREEDNG
HCCHHHHHHHHHHHHHHCCCC
>Mature Secondary Structure 
SKKCLITGGAGFIGSHLAEELVGRGYNVTIVDNFYKGKNKYHDELMKEIRVIPISVLDK
CCCEEEECCCHHHHHHHHHHHHCCCCEEEEEECCCCCCCHHHHHHHHHHHCCEEEEECC
NSIYELVNQHDVVFHLAAILGVKTTMEKSIELIETNFDGTRNILQAALKGKKKVVFASTS
HHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCHHHHHHHHHHCCCCEEEEEECH
EVYGKAKPPFSEEGDRLYGATSKIRWSYAICKTLEETLCLGYALEGLPVTIVRYFNIYGP
HHCCCCCCCCCCCCCEEECCCHHHHHHHHHHHHHHHHHHHHHHHCCCCEEEHHHHHCCCC
RAKDGPYAGVIPRFISAALQGEDILVYGDGEQTRCFTYVSDAVEATIRAMDEKVNGEIIN
CCCCCCCCHHHHHHHHHHHCCCEEEEEECCCCCCHHHHHHHHHHHHHHHHHHHCCCCEEE
IGSENEKSIKEVAEVIKKLTDSSSKIVQVPFEEVYPHGFEEIPNRRPDVTKLKDLVQFQA
CCCCCHHHHHHHHHHHHHHHCCCCCEEECCHHHHCCCCHHHCCCCCCCHHHHHHHHHHHH
KVTWEDGLKETIKWFREEDNG
HCCHHHHHHHHHHHHHHCCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 10.0

TargetDB status: NA

Availability: NA

References: NA