BacMap

Definition	Clostridium botulinum A str. ATCC 3502, complete genome.
Accession	NC_009495
Length	3,886,916

Click here to switch to the map view.

The map label for this gene is chiD [H]

Identifier: 148379047

GI number: 148379047

Start: 1163311

End: 1164810

Strand: Direct

Name: chiD [H]

Synonym: CBO1057

Alternate gene names: 148379047

Gene position: 1163311-1164810 (Clockwise)

Preceding gene: 148379046

Following gene: 148379048

Centisome position: 29.93

GC content: 32.27

Gene sequence:

>1500_bases
ATGAAAAAAGTGTTTAAAAGAATATTTCCAATCTCTTTAGTATTAGTTATGGTATTTTTGTTTATGCCTATAACTAATGT
ATTTGCTAGCTCAAATTCTTCTGACAAAATATTGGTAGGATATTGGCATAATTTTGACAATGGCACTGGAATTATTAGAC
TAAAAGATGTATCTACTAAGTGGGATGTTATAAATGTAGCATTTGGAGAATCTATAGGAGATAGGGCTACTATAAAATTT
TCACCGGAAATAGGAACCGATCAAGAATTTAAAGAAGACATTGCATATCTTAATAGCATAGGAAAAAAAGTTGTTCTTTC
TATTGGAGGACAAAATGGGGTAGTATTATTACCCGATGAAAATGCAAAAAAGAATTTTATAGATTCTATGATATCTTTGA
TTAATAAGTATGGATTTAATGGCATAGATATTGATTTGGAATCTGGGATAAATTTAATAAATAATGATAAAGATTTTAAG
AATCCTAAGACTCCACAGATTGTAAACCTTATTTCTGCTGTTAGAGCTATATGTGATCATTATGGTCCAGATTTTGTATT
AAGTATGGCTCCTGAAACAGCATATGTACAAGGTGGATATGTGGCTTATGCAGGAATTTGGGGAGCTTATTTACCAATAA
TACATGGATTAAGGGATAAACTTACTTATATCCATGTACAGCATTATAATGCGGGAGGAAATACAGCACTTGATGGAAAT
AATTATACACAGGGAACAGCAGATTATGAGGTGGCAATGGCAGAAATGTTATTACAAGGTTTTCCTGTAGCAGGGAATGC
AGATAATATATTTACACCATTAAAGCAAGAACAGGTGGTAATAGGTTTACCAGCTTGTCCGTCAGCTGCTCCTAGTGGAG
GATATATTAAACCTAGCGAAATGAAAAAGGCATTGAACTATCTTATGAGAGGAATTCCTTATGGAGGAAAGTATAAGCTT
GTAAATAGTAATGGATATCCAGCTTTCAAAGGATTAATGACATGGTCAATTAATTGGGATGCAAAAAGTAATTATGAATT
TTCAACAAGTTATAGAGAATATTTTGATAATTTTAAGCAACCACCAGTAACTGAGAAACCATCTATACCAATAGGTTTAA
AGGGAGAAGCTATAAGTAAGACACAAATAAATATAGCATGGAATTTAGCACTTGGAGCAACTAGCTATGATTTAAAGGTT
GATGGAAACATAATAAATAATGTGAATAATCCATACAAACATATTAATCTCAAACCAGGCTCTATGCATAGCTATGAGGT
AAGGGCTGTGAATTCAGTAGGGAATAGCGAATGGAGTAAAGCTATAATAGTACAGACTAAATCTGAATCTGATGTAGAAA
AATGGGGAACAAATATTTTATATAAAGTTGGAGACATTGTAAATTATGAAGGAATTAATTACAGATGCATACAGACACAT
ACTTCTCTAATAGGATGGGAACCTATAAATACTCCTACCCTTTGGGAAAAAACAAACTAG

Upstream 100 bases:

>100_bases
TGTTTAAAAATTTAGTCATTATAATATATTTGGAATAATTTAATGGATAAAGTCCTATGTATTAGTATGAAAGTATTAAT
AATGAAAGGATATTAGAAAA

Downstream 100 bases:

>100_bases
ATATATTGAATTTTAATTATATCTATGATTGAGATAGTCATAAATAAAATTTAACTATAAACAGAGAAGGGCCTTCTCAT
AATGAATTTTATGCATTATG

Product: extracellular exochitinase

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 499; Mature: 499

Protein sequence:

>499_residues
MKKVFKRIFPISLVLVMVFLFMPITNVFASSNSSDKILVGYWHNFDNGTGIIRLKDVSTKWDVINVAFGESIGDRATIKF
SPEIGTDQEFKEDIAYLNSIGKKVVLSIGGQNGVVLLPDENAKKNFIDSMISLINKYGFNGIDIDLESGINLINNDKDFK
NPKTPQIVNLISAVRAICDHYGPDFVLSMAPETAYVQGGYVAYAGIWGAYLPIIHGLRDKLTYIHVQHYNAGGNTALDGN
NYTQGTADYEVAMAEMLLQGFPVAGNADNIFTPLKQEQVVIGLPACPSAAPSGGYIKPSEMKKALNYLMRGIPYGGKYKL
VNSNGYPAFKGLMTWSINWDAKSNYEFSTSYREYFDNFKQPPVTEKPSIPIGLKGEAISKTQINIAWNLALGATSYDLKV
DGNIINNVNNPYKHINLKPGSMHSYEVRAVNSVGNSEWSKAIIVQTKSESDVEKWGTNILYKVGDIVNYEGINYRCIQTH
TSLIGWEPINTPTLWEKTN

Sequences:

>Translated_499_residues
MKKVFKRIFPISLVLVMVFLFMPITNVFASSNSSDKILVGYWHNFDNGTGIIRLKDVSTKWDVINVAFGESIGDRATIKF
SPEIGTDQEFKEDIAYLNSIGKKVVLSIGGQNGVVLLPDENAKKNFIDSMISLINKYGFNGIDIDLESGINLINNDKDFK
NPKTPQIVNLISAVRAICDHYGPDFVLSMAPETAYVQGGYVAYAGIWGAYLPIIHGLRDKLTYIHVQHYNAGGNTALDGN
NYTQGTADYEVAMAEMLLQGFPVAGNADNIFTPLKQEQVVIGLPACPSAAPSGGYIKPSEMKKALNYLMRGIPYGGKYKL
VNSNGYPAFKGLMTWSINWDAKSNYEFSTSYREYFDNFKQPPVTEKPSIPIGLKGEAISKTQINIAWNLALGATSYDLKV
DGNIINNVNNPYKHINLKPGSMHSYEVRAVNSVGNSEWSKAIIVQTKSESDVEKWGTNILYKVGDIVNYEGINYRCIQTH
TSLIGWEPINTPTLWEKTN
>Mature_499_residues
MKKVFKRIFPISLVLVMVFLFMPITNVFASSNSSDKILVGYWHNFDNGTGIIRLKDVSTKWDVINVAFGESIGDRATIKF
SPEIGTDQEFKEDIAYLNSIGKKVVLSIGGQNGVVLLPDENAKKNFIDSMISLINKYGFNGIDIDLESGINLINNDKDFK
NPKTPQIVNLISAVRAICDHYGPDFVLSMAPETAYVQGGYVAYAGIWGAYLPIIHGLRDKLTYIHVQHYNAGGNTALDGN
NYTQGTADYEVAMAEMLLQGFPVAGNADNIFTPLKQEQVVIGLPACPSAAPSGGYIKPSEMKKALNYLMRGIPYGGKYKL
VNSNGYPAFKGLMTWSINWDAKSNYEFSTSYREYFDNFKQPPVTEKPSIPIGLKGEAISKTQINIAWNLALGATSYDLKV
DGNIINNVNNPYKHINLKPGSMHSYEVRAVNSVGNSEWSKAIIVQTKSESDVEKWGTNILYKVGDIVNYEGINYRCIQTH
TSLIGWEPINTPTLWEKTN

Specific function: Unknown

COG id: COG3469

COG function: function code G; Chitinase

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Contains 1 fibronectin type-III domain [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003610
- InterPro:   IPR008957
- InterPro:   IPR003961
- InterPro:   IPR001223
- InterPro:   IPR001579
- InterPro:   IPR017853
- InterPro:   IPR013781
- InterPro:   IPR013783
- InterPro:   IPR015520 [H]

Pfam domain/function: PF02839 CBM_5_12; PF00041 fn3; PF00704 Glyco_hydro_18 [H]

EC number: =3.2.1.14 [H]

Molecular weight: Translated: 55329; Mature: 55329

Theoretical pI: Translated: 7.25; Mature: 7.25

Prosite motif: PS50853 FN3 ; PS01095 CHITINASE_18

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.6 %Cys     (Translated Protein)
2.2 %Met     (Translated Protein)
2.8 %Cys+Met (Translated Protein)
0.6 %Cys     (Mature Protein)
2.2 %Met     (Mature Protein)
2.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MKKVFKRIFPISLVLVMVFLFMPITNVFASSNSSDKILVGYWHNFDNGTGIIRLKDVSTK
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCEEEEEEEECCCCCCEEEEEEECCCC
WDVINVAFGESIGDRATIKFSPEIGTDQEFKEDIAYLNSIGKKVVLSIGGQNGVVLLPDE
CCEEEEEECCCCCCCEEEEECCCCCCCHHHHHHHHHHHHCCCEEEEEECCCCCEEEECCC
NAKKNFIDSMISLINKYGFNGIDIDLESGINLINNDKDFKNPKTPQIVNLISAVRAICDH
CCHHHHHHHHHHHHHHCCCCCEEEEHHCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHH
YGPDFVLSMAPETAYVQGGYVAYAGIWGAYLPIIHGLRDKLTYIHVQHYNAGGNTALDGN
CCCCEEEEECCCCEEEECCEEEEHHHHHHHHHHHHHHHCCEEEEEEEEECCCCCCEECCC
NYTQGTADYEVAMAEMLLQGFPVAGNADNIFTPLKQEQVVIGLPACPSAAPSGGYIKPSE
CCCCCCCHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCEEEECCCCCCCCCCCCCCCHHH
MKKALNYLMRGIPYGGKYKLVNSNGYPAFKGLMTWSINWDAKSNYEFSTSYREYFDNFKQ
HHHHHHHHHHCCCCCCEEEEEECCCCCCEECEEEEEEECCCCCCCEECHHHHHHHHCCCC
PPVTEKPSIPIGLKGEAISKTQINIAWNLALGATSYDLKVDGNIINNVNNPYKHINLKPG
CCCCCCCCCCCCCCCCCCCEEEEEEEEEEEECCEEEEEEECCCCCCCCCCCCEEEEECCC
SMHSYEVRAVNSVGNSEWSKAIIVQTKSESDVEKWGTNILYKVGDIVNYEGINYRCIQTH
CCCCEEEEEECCCCCCCCCEEEEEEECCCCCHHHHCCCEEEECCCEEEECCCCEEEEEEC
TSLIGWEPINTPTLWEKTN
CCEEECCCCCCCCCCCCCC
>Mature Secondary Structure
MKKVFKRIFPISLVLVMVFLFMPITNVFASSNSSDKILVGYWHNFDNGTGIIRLKDVSTK
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCEEEEEEEECCCCCCEEEEEEECCCC
WDVINVAFGESIGDRATIKFSPEIGTDQEFKEDIAYLNSIGKKVVLSIGGQNGVVLLPDE
CCEEEEEECCCCCCCEEEEECCCCCCCHHHHHHHHHHHHCCCEEEEEECCCCCEEEECCC
NAKKNFIDSMISLINKYGFNGIDIDLESGINLINNDKDFKNPKTPQIVNLISAVRAICDH
CCHHHHHHHHHHHHHHCCCCCEEEEHHCCCCCCCCCCCCCCCCCHHHHHHHHHHHHHHHH
YGPDFVLSMAPETAYVQGGYVAYAGIWGAYLPIIHGLRDKLTYIHVQHYNAGGNTALDGN
CCCCEEEEECCCCEEEECCEEEEHHHHHHHHHHHHHHHCCEEEEEEEEECCCCCCEECCC
NYTQGTADYEVAMAEMLLQGFPVAGNADNIFTPLKQEQVVIGLPACPSAAPSGGYIKPSE
CCCCCCCHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCCEEEECCCCCCCCCCCCCCCHHH
MKKALNYLMRGIPYGGKYKLVNSNGYPAFKGLMTWSINWDAKSNYEFSTSYREYFDNFKQ
HHHHHHHHHHCCCCCCEEEEEECCCCCCEECEEEEEEECCCCCCCEECHHHHHHHHCCCC
PPVTEKPSIPIGLKGEAISKTQINIAWNLALGATSYDLKVDGNIINNVNNPYKHINLKPG
CCCCCCCCCCCCCCCCCCCEEEEEEEEEEEECCEEEEEEECCCCCCCCCCCCEEEEECCC
SMHSYEVRAVNSVGNSEWSKAIIVQTKSESDVEKWGTNILYKVGDIVNYEGINYRCIQTH
CCCCEEEEEECCCCCCCCCEEEEEEECCCCCHHHHCCCEEEECCCEEEECCCCEEEEEEC
TSLIGWEPINTPTLWEKTN
CCEEECCCCCCCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 1729234 [H]