BacMap

Definition	Vibrio cholerae O395 chromosome 2, complete sequence.
Accession	NC_009457
Length	3,024,069

Click here to switch to the map view.

The map label for this gene is endo I [H]

Identifier: 147674479

GI number: 147674479

Start: 314090

End: 315814

Strand: Direct

Name: endo I [H]

Synonym: VC0395_A0298

Alternate gene names: 147674479

Gene position: 314090-315814 (Clockwise)

Preceding gene: 147675501

Following gene: 147673823

Centisome position: 10.39

GC content: 49.74

Gene sequence:

>1725_bases
TTGAGAGAGGGACTTTTATCCATGTTTAAACTCAAACATACCGCATGGTGGGTGGCCATGGCGTGTGCATTGCCTGCGCA
AGCGGCGATGAATATTCAGCCTGATCCACAAAATCCTGGTGGATATTTGGTGGCTAAAGCGGATATTGCCGCAGCAGAAC
AAGCCAAAACCGCCAATCCTATGTATGCCATTTGGTCAAATGCCTTAGCGACCCGCGCCAATGCGATTGTTGATGCGATC
GAGCCGGGACTGGCGACAAACCCTGATAACGTGAAACGGGTTGAACGCGTATTTCCTGAGTCTGAGTGGAATTTCCTCAC
TCACATGGCGGCACCTGAATACACTTATACCCGTTTCTTGCGTGCGATTGGCAAATTCCCGGCATTTTGTGCCGAGTATA
CCGATGGCCGCAATTCTGACGCGATTTGTAAAAAATCGATCGTGACCGCTTTTGCTCACTTTGCTCAGGAAACTGGTGGA
CACATCGCGAAGGACAACATTTCTGATAACCCATTAGCGCTGGAAGAGTGGCAACAAGCGCTGGTGCATGTGCGTGAAAT
GGGCTGGTCTGAAGGTCAAGAAGGTTATACCACGGGGTGTGGTCAAAATGACTGGCAGAACAAGAAGTGGCCTTGTGCTA
CTGGGCAAGGTTACTTTGGCCGTGGAGCAAAACAGCTTTCTTACCACTTTAACTACGGCGCTTTCTCCGAGGCTATGTTT
GATGGTGATGCAACAGTATTGTTGAACAACCCCGGTTTAGTGGCTGATTCGTGGTTGAACCTTGCGTCTGCAATCTGGTT
CTTCCTCACGCCACAAGCACCAAAACCTGCCATGTTGCATGTGATTGATCGTACTTGGGTGCCTTCACAGCGTGAAATTG
ATGCAGGGATTGGTTACGGTTTCGGCACCACGATCAATATCATCAATGGTGGTATTGAGTGCGGGGAGCAAAACAAAGAT
AAAGGGCAGCCGGTTAACCGTATTCGTTATTGGGAAGGCTTAGCGGCGCATTATCAAATCCCTATTGAAGCTGATGAGAA
GAATACCTGCTGGCAGCAACTGCCTTACGGCAGCCTTAACCTCAATGGTGCGACCGATGTGCTTTACACAAACTGGGATG
GTAACTGGAAATATTATCCAGATCGTCCGGGTGGCTACTCATTTGAATGTGAGTTGGTGGGGTTCCAAACCGCGTATTCT
GCTTTGGTGGAAGGGGATTATGAGAAGTGTGTGACTAATCTGTATGGTTCACATGCGAGCTGGCCAAAAGTTCGTGTAGT
GGAAAAACTTGATCCATTACCTACCGATCCGACAGATCCACCTGTAGGTGGTGCCCCTGCGTGGGAAGTGGGTAAGGTTT
ATAACTCAGGTGACAAGGTCAGTTATAAAGGTGCGGTTTACCAAGCTAAATGGTGGACACAAGGTGATGAACCTTCTAAA
GGCGGGCCTTGGGCGTTAGTTTCTGGTGAGCCAACACCACCAACTGAGCCAACGCCAAGCGAGCCAGTACCTCCCACTGA
ACCTGTACCACCATCGGAGCCAACACCAGTGCCGCCGACAGAGCCAGCCCCTACGGATGCCATTGTGTGGCAACCTGGAG
TCACTAAGGTCTCGAACGGCGATAAAGTGACCTATAACGGCCAATGCTTTATTACTAAGAACAGTCCAGGCGTTTGGGAG
TCACCTACTCAATCTAACTGGTTCTGGGATAAGGTGTCCTGCTAA

Upstream 100 bases:

>100_bases
GATTTACATCGGCTGGAAATGGCTCGCAATTCTGGCTTTTTTCTTATTTTTCACTATTAAATTAGTTATCAATAAGCCTA
CTCTCAAATGGATTTCCAAG

Downstream 100 bases:

>100_bases
GTTGTTGTATTAAAAGTGTTTATTTCATCGCTCAACTTAGGTTGGGCGATTTTTTACTCGCATCTGTAACTAACTGTTTC
AACAATCTAAGTTTCCAATA

Product: putative chitinase

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 574; Mature: 574

Protein sequence:

>574_residues
MREGLLSMFKLKHTAWWVAMACALPAQAAMNIQPDPQNPGGYLVAKADIAAAEQAKTANPMYAIWSNALATRANAIVDAI
EPGLATNPDNVKRVERVFPESEWNFLTHMAAPEYTYTRFLRAIGKFPAFCAEYTDGRNSDAICKKSIVTAFAHFAQETGG
HIAKDNISDNPLALEEWQQALVHVREMGWSEGQEGYTTGCGQNDWQNKKWPCATGQGYFGRGAKQLSYHFNYGAFSEAMF
DGDATVLLNNPGLVADSWLNLASAIWFFLTPQAPKPAMLHVIDRTWVPSQREIDAGIGYGFGTTINIINGGIECGEQNKD
KGQPVNRIRYWEGLAAHYQIPIEADEKNTCWQQLPYGSLNLNGATDVLYTNWDGNWKYYPDRPGGYSFECELVGFQTAYS
ALVEGDYEKCVTNLYGSHASWPKVRVVEKLDPLPTDPTDPPVGGAPAWEVGKVYNSGDKVSYKGAVYQAKWWTQGDEPSK
GGPWALVSGEPTPPTEPTPSEPVPPTEPVPPSEPTPVPPTEPAPTDAIVWQPGVTKVSNGDKVTYNGQCFITKNSPGVWE
SPTQSNWFWDKVSC

Sequences:

>Translated_574_residues
MREGLLSMFKLKHTAWWVAMACALPAQAAMNIQPDPQNPGGYLVAKADIAAAEQAKTANPMYAIWSNALATRANAIVDAI
EPGLATNPDNVKRVERVFPESEWNFLTHMAAPEYTYTRFLRAIGKFPAFCAEYTDGRNSDAICKKSIVTAFAHFAQETGG
HIAKDNISDNPLALEEWQQALVHVREMGWSEGQEGYTTGCGQNDWQNKKWPCATGQGYFGRGAKQLSYHFNYGAFSEAMF
DGDATVLLNNPGLVADSWLNLASAIWFFLTPQAPKPAMLHVIDRTWVPSQREIDAGIGYGFGTTINIINGGIECGEQNKD
KGQPVNRIRYWEGLAAHYQIPIEADEKNTCWQQLPYGSLNLNGATDVLYTNWDGNWKYYPDRPGGYSFECELVGFQTAYS
ALVEGDYEKCVTNLYGSHASWPKVRVVEKLDPLPTDPTDPPVGGAPAWEVGKVYNSGDKVSYKGAVYQAKWWTQGDEPSK
GGPWALVSGEPTPPTEPTPSEPVPPTEPVPPSEPTPVPPTEPAPTDAIVWQPGVTKVSNGDKVTYNGQCFITKNSPGVWE
SPTQSNWFWDKVSC
>Mature_574_residues
MREGLLSMFKLKHTAWWVAMACALPAQAAMNIQPDPQNPGGYLVAKADIAAAEQAKTANPMYAIWSNALATRANAIVDAI
EPGLATNPDNVKRVERVFPESEWNFLTHMAAPEYTYTRFLRAIGKFPAFCAEYTDGRNSDAICKKSIVTAFAHFAQETGG
HIAKDNISDNPLALEEWQQALVHVREMGWSEGQEGYTTGCGQNDWQNKKWPCATGQGYFGRGAKQLSYHFNYGAFSEAMF
DGDATVLLNNPGLVADSWLNLASAIWFFLTPQAPKPAMLHVIDRTWVPSQREIDAGIGYGFGTTINIINGGIECGEQNKD
KGQPVNRIRYWEGLAAHYQIPIEADEKNTCWQQLPYGSLNLNGATDVLYTNWDGNWKYYPDRPGGYSFECELVGFQTAYS
ALVEGDYEKCVTNLYGSHASWPKVRVVEKLDPLPTDPTDPPVGGAPAWEVGKVYNSGDKVSYKGAVYQAKWWTQGDEPSK
GGPWALVSGEPTPPTEPTPSEPVPPTEPVPPSEPTPVPPTEPAPTDAIVWQPGVTKVSNGDKVTYNGQCFITKNSPGVWE
SPTQSNWFWDKVSC

Specific function: Hydrolyzes chitin oligosaccharides; (GlcNAc)4 to (GlcNAc)2 and (GlcNAc)5,6 to (GlcNAc)2 and (GlcNAc)3. Inactive towards chitin, glucosamine oligosaccharides, glycoproteins and glycopeptides containing (GlcNAc)2 [H]

COG id: COG3979

COG function: function code R; Uncharacterized protein contain chitin-binding domain type 3

Gene ontology:

Cell location: Periplasm (Probable) [H]

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Belongs to the glycosyl hydrolase 18 family [H]

Homologues:

Organism=Caenorhabditis elegans, GI17563934, Length=330, Percent_Identity=28.4848484848485, Blast_Score=105, Evalue=5e-23,
Organism=Caenorhabditis elegans, GI71983294, Length=353, Percent_Identity=27.1954674220963, Blast_Score=84, Evalue=3e-16,
Organism=Caenorhabditis elegans, GI17564732, Length=369, Percent_Identity=26.0162601626016, Blast_Score=83, Evalue=3e-16,
Organism=Caenorhabditis elegans, GI17563086, Length=369, Percent_Identity=26.0162601626016, Blast_Score=83, Evalue=3e-16,
Organism=Caenorhabditis elegans, GI71983301, Length=349, Percent_Identity=26.9340974212034, Blast_Score=83, Evalue=4e-16,
Organism=Caenorhabditis elegans, GI17565884, Length=252, Percent_Identity=29.7619047619048, Blast_Score=82, Evalue=7e-16,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003610
- InterPro:   IPR009470
- InterPro:   IPR011583
- InterPro:   IPR001223
- InterPro:   IPR017853
- InterPro:   IPR013781 [H]

Pfam domain/function: PF02839 CBM_5_12; PF06483 ChiC; PF00704 Glyco_hydro_18 [H]

EC number: =3.2.1.14 [H]

Molecular weight: Translated: 63192; Mature: 63192

Theoretical pI: Translated: 4.74; Mature: 4.74

Prosite motif: PS00189 LIPOYL

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

1.9 %Cys     (Translated Protein)
1.6 %Met     (Translated Protein)
3.5 %Cys+Met (Translated Protein)
1.9 %Cys     (Mature Protein)
1.6 %Met     (Mature Protein)
3.5 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MREGLLSMFKLKHTAWWVAMACALPAQAAMNIQPDPQNPGGYLVAKADIAAAEQAKTANP
CCHHHHHHHHHHHHHHHHHHHHHCCHHHHCCCCCCCCCCCCEEEEECCHHHHHHHCCCCC
MYAIWSNALATRANAIVDAIEPGLATNPDNVKRVERVFPESEWNFLTHMAAPEYTYTRFL
HHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHCCCCCCCCHHHHCCCCHHHHHHH
RAIGKFPAFCAEYTDGRNSDAICKKSIVTAFAHFAQETGGHIAKDNISDNPLALEEWQQA
HHHHCCHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHCCCEEECCCCCCCCCHHHHHHH
LVHVREMGWSEGQEGYTTGCGQNDWQNKKWPCATGQGYFGRGAKQLSYHFNYGAFSEAMF
HHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEEECCCCHHHHEE
DGDATVLLNNPGLVADSWLNLASAIWFFLTPQAPKPAMLHVIDRTWVPSQREIDAGIGYG
CCCCEEEECCCCCCHHHHHHHHHHHHHEECCCCCCCCEEEEECCCCCCCCCCCCCCCCCC
FGTTINIINGGIECGEQNKDKGQPVNRIRYWEGLAAHYQIPIEADEKNTCWQQLPYGSLN
CCCEEEEEECCCCCCCCCCCCCCCHHHHHHHCCCEEEEEEEEECCCCCCHHHHCCCCCEE
LNGATDVLYTNWDGNWKYYPDRPGGYSFECELVGFQTAYSALVEGDYEKCVTNLYGSHAS
CCCCCEEEEECCCCCEEECCCCCCCCEEEEEEEEHHHHHHHHHCCCHHHHHHHHHCCCCC
WPKVRVVEKLDPLPTDPTDPPVGGAPAWEVGKVYNSGDKVSYKGAVYQAKWWTQGDEPSK
CCCEEHHHHCCCCCCCCCCCCCCCCCCHHHHHHCCCCCCEEECCEEEEEECCCCCCCCCC
GGPWALVSGEPTPPTEPTPSEPVPPTEPVPPSEPTPVPPTEPAPTDAIVWQPGVTKVSNG
CCCEEEECCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEECCCCCEECCC
DKVTYNGQCFITKNSPGVWESPTQSNWFWDKVSC
CEEEECCEEEEECCCCCCCCCCCCCCCEEECCCC
>Mature Secondary Structure
MREGLLSMFKLKHTAWWVAMACALPAQAAMNIQPDPQNPGGYLVAKADIAAAEQAKTANP
CCHHHHHHHHHHHHHHHHHHHHHCCHHHHCCCCCCCCCCCCEEEEECCHHHHHHHCCCCC
MYAIWSNALATRANAIVDAIEPGLATNPDNVKRVERVFPESEWNFLTHMAAPEYTYTRFL
HHHHHHHHHHHHHHHHHHHHCCCCCCCCHHHHHHHHHCCCCCCCCHHHHCCCCHHHHHHH
RAIGKFPAFCAEYTDGRNSDAICKKSIVTAFAHFAQETGGHIAKDNISDNPLALEEWQQA
HHHHCCHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHCCCEEECCCCCCCCCHHHHHHH
LVHVREMGWSEGQEGYTTGCGQNDWQNKKWPCATGQGYFGRGAKQLSYHFNYGAFSEAMF
HHHHHHCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEEEEECCCCHHHHEE
DGDATVLLNNPGLVADSWLNLASAIWFFLTPQAPKPAMLHVIDRTWVPSQREIDAGIGYG
CCCCEEEECCCCCCHHHHHHHHHHHHHEECCCCCCCCEEEEECCCCCCCCCCCCCCCCCC
FGTTINIINGGIECGEQNKDKGQPVNRIRYWEGLAAHYQIPIEADEKNTCWQQLPYGSLN
CCCEEEEEECCCCCCCCCCCCCCCHHHHHHHCCCEEEEEEEEECCCCCCHHHHCCCCCEE
LNGATDVLYTNWDGNWKYYPDRPGGYSFECELVGFQTAYSALVEGDYEKCVTNLYGSHAS
CCCCCEEEEECCCCCEEECCCCCCCCEEEEEEEEHHHHHHHHHCCCHHHHHHHHHCCCCC
WPKVRVVEKLDPLPTDPTDPPVGGAPAWEVGKVYNSGDKVSYKGAVYQAKWWTQGDEPSK
CCCEEHHHHCCCCCCCCCCCCCCCCCCHHHHHHCCCCCCEEECCEEEEEECCCCCCCCCC
GGPWALVSGEPTPPTEPTPSEPVPPTEPVPPSEPTPVPPTEPAPTDAIVWQPGVTKVSNG
CCCEEEECCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCEEEECCCCCEECCC
DKVTYNGQCFITKNSPGVWESPTQSNWFWDKVSC
CEEEECCEEEEECCCCCCCCCCCCCCCEEECCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha Beta

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 8969204 [H]