Definition Clostridium botulinum A2 str. Kyoto chromosome, complete genome.
Accession NC_012563
Length 4,155,278

Click here to switch to the map view.

The map label for this gene is pip [H]

Identifier: 226948266

GI number: 226948266

Start: 1184366

End: 1186534

Strand: Direct

Name: pip [H]

Synonym: CLM_1146

Alternate gene names: 226948266

Gene position: 1184366-1186534 (Clockwise)

Preceding gene: 226948264

Following gene: 226948267

Centisome position: 28.5

GC content: 27.34

Gene sequence:

>2169_bases
ATGAATAGATTTAAAAACATAATTAAGGTATATAAGAGAGATATTAAAAGCTTAAATAAGAATTTTATTGCAATAATCAT
AATATTAGGGGTTTGTGTATTACCCTCACTTTATGCTTGGGTCAATATTAAAGCTTGTTGGGATCCTTATGAAAACACAA
GTACAGTACCTATAGCTGTAATTAATAATGATAAAGGTACAGATTTTGGAGGTAAAGAGCTCAATGTAGGAAATGAGATG
GTGAAAAAACTTAAGAGTAATGATAAAATTGGATGGAAGTTTACTAATAAAAAGGAAGCGGATATGGGTGTTATAGATGG
TACATATTATGCCAGTATAGAAATACCAAAGGATTTTTCAGCAGATATAGTTAGTGTTTTATCAGATAATCCTAAACATC
CAGAAATAATTTATAAAGTTGATACAAAAGAAAATCCTGTTGCAGCGAAAATAACTGGAATGGCTAAAAATACATTAATA
AATGAGATAACTACCACTTTTATTACTACTGTAAATAAAACTGTATTTTCTTCTATAAATGAAATAGGTAGAAATCTTGA
AAAAAATAAGAATGAAATAATAAAACTTAAAGAATCTATTATTTCAATGAATCGAAACATGGATTTAATTTTAGCAGGAT
TGGAAAGCGTAAATACTAATTCTAAAAATCTAAATGAATATTTAAGTGTAGTTAGAACTACTTTCCCAGAAATAACCAAG
GGGTTAGAAAATATTAATTCTAAATCCTCAAATACAAATGAAACAATAAATCAAACTAATAATATATTTAATAATTCCTT
AAATAATATAAATGTTATATTAAAGCAGGCTATATCGACTAATAATCGTGTTCAATCAGTATTAGATAATTTAATAGTTT
TAAATAATGAATCTTCAAATAACGAAGCAAATAGCTCTATAGCAAATTTAATTATGGATATAGATAGTGCAAATAAAAAT
ATTGATTCTATGATAGAATTCCTTGAAAAAATAAATAACACAAAGCCAAATACTGAAGTGTCAAAATTTATAGTATCCCT
TAATAATGTTAAAGGAGCTTTAAATGAAGAAAAACAAAAATTAATAAAGATACAAGAAATTGCTTCAAATTCTAGTAAAG
TAAATGAAAATTCAATAAATGAATTAAAAAGAAACATATCTAATACAAATAAGCAAATTGAAAGTGTAATGAATGTTTTT
AATTCAAATACAAGACAGGAATTAAGCACTATAATTAATAATTTTAAAAATTCTATTCAAGATGCTAGTAAACTTATAAA
GGCAGGTAATGGATTAAATACACAAATAGAAAATTTATTAGCAACATCTACAAAGGGAGCTGATTTATCAGCAAAGCTAA
GTAAAGAATTAATTGATAAGTTAACAGAATATAAAGGGATAATAGGTCAACTAAGTAAAAAATTAGAGCTGGTTAGTAAT
GATGATTTAATACAAATAATAAGTGTACTTCAAAATAATCCTATGCTAATGTCACAGACCGCAGCATATCCTTTTAATAT
TAAGGAAGAAGCAGTATATACTATACCTAATTATGGGTCTGCAATGACTCCAGTATATAGTGTGTTAGCCCTTTGGGTTG
GAACTTTAATACTGGTATCTTTGTTAAAAACAGAGGTGGTAGATTTTGAAGGCAGTGAGAATATAACTATAAGACAAAAA
TACTTTGGTAAAATGCTTACATTTATAACTTTAGCTGCTATGCAAGGGTTTATAGTAGCTGTTGGAAATAAGGCTATACT
AGGAGTTTATACAGTTAGTTTTCCCCTTATGCTTGCGTTTTCTGTAGTGTCATCTATTGTATTTGCTATAATAACTTATA
CTTTGGTAGCTATATTTGGTAAGTTCGGTAATGCTCTGGCAATAGTATTTATGATATTACAATTAGCAGGTAGTGGTGGA
ACTTATCCAATACAAGTCGATCCATTAATATTTAGAATACTACAACCATTTTTCCCATTTACCTATAGTATAGGGGGTTT
TAGAGAGGCAATAGGAGGACCTCTTGTATCTAGTGTAATATTAGATTTTATAATGCTTATATTAATGGGGGGCATATTTG
TTTTAATAGGATTTTTCTTAAAATCTCCGTTACATCATAAAATTAGTAAGTTTGACGAAGACTTTAAGGCTTCAGGAATA
TCAGAATAA

Upstream 100 bases:

>100_bases
TCTGTTTCACGGCTGTTTATGACTTAAATATAAAATTTGTTAGTTATGATATATTCATCTACTTTGGTTTTTATAAAGAA
TTAGGAGGAAATAATTTGGA

Downstream 100 bases:

>100_bases
ATAGAGAAAATAAAGAGGTGAGCATATGAAAAAGGTATTTAGAATATTTTCAAGAGATTTAAAAAATATAGTTAAACATC
CTGCAGCCATTATAGTAGTA

Product: putative phage infection protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 722; Mature: 722

Protein sequence:

>722_residues
MNRFKNIIKVYKRDIKSLNKNFIAIIIILGVCVLPSLYAWVNIKACWDPYENTSTVPIAVINNDKGTDFGGKELNVGNEM
VKKLKSNDKIGWKFTNKKEADMGVIDGTYYASIEIPKDFSADIVSVLSDNPKHPEIIYKVDTKENPVAAKITGMAKNTLI
NEITTTFITTVNKTVFSSINEIGRNLEKNKNEIIKLKESIISMNRNMDLILAGLESVNTNSKNLNEYLSVVRTTFPEITK
GLENINSKSSNTNETINQTNNIFNNSLNNINVILKQAISTNNRVQSVLDNLIVLNNESSNNEANSSIANLIMDIDSANKN
IDSMIEFLEKINNTKPNTEVSKFIVSLNNVKGALNEEKQKLIKIQEIASNSSKVNENSINELKRNISNTNKQIESVMNVF
NSNTRQELSTIINNFKNSIQDASKLIKAGNGLNTQIENLLATSTKGADLSAKLSKELIDKLTEYKGIIGQLSKKLELVSN
DDLIQIISVLQNNPMLMSQTAAYPFNIKEEAVYTIPNYGSAMTPVYSVLALWVGTLILVSLLKTEVVDFEGSENITIRQK
YFGKMLTFITLAAMQGFIVAVGNKAILGVYTVSFPLMLAFSVVSSIVFAIITYTLVAIFGKFGNALAIVFMILQLAGSGG
TYPIQVDPLIFRILQPFFPFTYSIGGFREAIGGPLVSSVILDFIMLILMGGIFVLIGFFLKSPLHHKISKFDEDFKASGI
SE

Sequences:

>Translated_722_residues
MNRFKNIIKVYKRDIKSLNKNFIAIIIILGVCVLPSLYAWVNIKACWDPYENTSTVPIAVINNDKGTDFGGKELNVGNEM
VKKLKSNDKIGWKFTNKKEADMGVIDGTYYASIEIPKDFSADIVSVLSDNPKHPEIIYKVDTKENPVAAKITGMAKNTLI
NEITTTFITTVNKTVFSSINEIGRNLEKNKNEIIKLKESIISMNRNMDLILAGLESVNTNSKNLNEYLSVVRTTFPEITK
GLENINSKSSNTNETINQTNNIFNNSLNNINVILKQAISTNNRVQSVLDNLIVLNNESSNNEANSSIANLIMDIDSANKN
IDSMIEFLEKINNTKPNTEVSKFIVSLNNVKGALNEEKQKLIKIQEIASNSSKVNENSINELKRNISNTNKQIESVMNVF
NSNTRQELSTIINNFKNSIQDASKLIKAGNGLNTQIENLLATSTKGADLSAKLSKELIDKLTEYKGIIGQLSKKLELVSN
DDLIQIISVLQNNPMLMSQTAAYPFNIKEEAVYTIPNYGSAMTPVYSVLALWVGTLILVSLLKTEVVDFEGSENITIRQK
YFGKMLTFITLAAMQGFIVAVGNKAILGVYTVSFPLMLAFSVVSSIVFAIITYTLVAIFGKFGNALAIVFMILQLAGSGG
TYPIQVDPLIFRILQPFFPFTYSIGGFREAIGGPLVSSVILDFIMLILMGGIFVLIGFFLKSPLHHKISKFDEDFKASGI
SE
>Mature_722_residues
MNRFKNIIKVYKRDIKSLNKNFIAIIIILGVCVLPSLYAWVNIKACWDPYENTSTVPIAVINNDKGTDFGGKELNVGNEM
VKKLKSNDKIGWKFTNKKEADMGVIDGTYYASIEIPKDFSADIVSVLSDNPKHPEIIYKVDTKENPVAAKITGMAKNTLI
NEITTTFITTVNKTVFSSINEIGRNLEKNKNEIIKLKESIISMNRNMDLILAGLESVNTNSKNLNEYLSVVRTTFPEITK
GLENINSKSSNTNETINQTNNIFNNSLNNINVILKQAISTNNRVQSVLDNLIVLNNESSNNEANSSIANLIMDIDSANKN
IDSMIEFLEKINNTKPNTEVSKFIVSLNNVKGALNEEKQKLIKIQEIASNSSKVNENSINELKRNISNTNKQIESVMNVF
NSNTRQELSTIINNFKNSIQDASKLIKAGNGLNTQIENLLATSTKGADLSAKLSKELIDKLTEYKGIIGQLSKKLELVSN
DDLIQIISVLQNNPMLMSQTAAYPFNIKEEAVYTIPNYGSAMTPVYSVLALWVGTLILVSLLKTEVVDFEGSENITIRQK
YFGKMLTFITLAAMQGFIVAVGNKAILGVYTVSFPLMLAFSVVSSIVFAIITYTLVAIFGKFGNALAIVFMILQLAGSGG
TYPIQVDPLIFRILQPFFPFTYSIGGFREAIGGPLVSSVILDFIMLILMGGIFVLIGFFLKSPLHHKISKFDEDFKASGI
SE

Specific function: Required for phage infection [H]

COG id: COG1511

COG function: function code S; Predicted membrane protein

Gene ontology:

Cell location: Cell membrane; Multi-pass membrane protein [H]

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Contains 1 ABC transmembrane type-2 domain [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR013525
- InterPro:   IPR017501
- InterPro:   IPR017500 [H]

Pfam domain/function: PF01061 ABC2_membrane [H]

EC number: NA

Molecular weight: Translated: 79925; Mature: 79925

Theoretical pI: Translated: 9.09; Mature: 9.09

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.3 %Cys     (Translated Protein)
2.5 %Met     (Translated Protein)
2.8 %Cys+Met (Translated Protein)
0.3 %Cys     (Mature Protein)
2.5 %Met     (Mature Protein)
2.8 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MNRFKNIIKVYKRDIKSLNKNFIAIIIILGVCVLPSLYAWVNIKACWDPYENTSTVPIAV
CCHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHEEEEECCCCCCCCCCEEEEE
INNDKGTDFGGKELNVGNEMVKKLKSNDKIGWKFTNKKEADMGVIDGTYYASIEIPKDFS
EECCCCCCCCCCCCCCCHHHHHHHHCCCCCCEEECCCCCCCCCEECCEEEEEEECCCCCH
ADIVSVLSDNPKHPEIIYKVDTKENPVAAKITGMAKNTLINEITTTFITTVNKTVFSSIN
HHHHHHHCCCCCCCEEEEEECCCCCCCEEEEHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
EIGRNLEKNKNEIIKLKESIISMNRNMDLILAGLESVNTNSKNLNEYLSVVRTTFPEITK
HHHHHHHCCHHHHHHHHHHHHHHCCCCHHEEECHHHCCCCCCHHHHHHHHHHHHHHHHHH
GLENINSKSSNTNETINQTNNIFNNSLNNINVILKQAISTNNRVQSVLDNLIVLNNESSN
HHHHCCCCCCCCHHHHHHHHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHCCEEECCCCCC
NEANSSIANLIMDIDSANKNIDSMIEFLEKINNTKPNTEVSKFIVSLNNVKGALNEEKQK
CHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHCCHHHHH
LIKIQEIASNSSKVNENSINELKRNISNTNKQIESVMNVFNSNTRQELSTIINNFKNSIQ
HHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHH
DASKLIKAGNGLNTQIENLLATSTKGADLSAKLSKELIDKLTEYKGIIGQLSKKLELVSN
HHHHHHHCCCCCCHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCC
DDLIQIISVLQNNPMLMSQTAAYPFNIKEEAVYTIPNYGSAMTPVYSVLALWVGTLILVS
CCHHHHHHHHCCCCCEEECCCCCCCCCCCCEEEECCCCCCHHHHHHHHHHHHHHHHHHHH
LLKTEVVDFEGSENITIRQKYFGKMLTFITLAAMQGFIVAVGNKAILGVYTVSFPLMLAF
HHHHHHHCCCCCCCCEEHHHHHHHHHHHHHHHHHHCEEEEECCCEEEEHHHHHHHHHHHH
SVVSSIVFAIITYTLVAIFGKFGNALAIVFMILQLAGSGGTYPIQVDPLIFRILQPFFPF
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCEEEECHHHHHHHHHHHHH
TYSIGGFREAIGGPLVSSVILDFIMLILMGGIFVLIGFFLKSPLHHKISKFDEDFKASGI
HHCCCHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHCHHHHCCCC
SE
CC
>Mature Secondary Structure
MNRFKNIIKVYKRDIKSLNKNFIAIIIILGVCVLPSLYAWVNIKACWDPYENTSTVPIAV
CCHHHHHHHHHHHHHHHHCCHHHHHHHHHHHHHHHHHHHHEEEEECCCCCCCCCCEEEEE
INNDKGTDFGGKELNVGNEMVKKLKSNDKIGWKFTNKKEADMGVIDGTYYASIEIPKDFS
EECCCCCCCCCCCCCCCHHHHHHHHCCCCCCEEECCCCCCCCCEECCEEEEEEECCCCCH
ADIVSVLSDNPKHPEIIYKVDTKENPVAAKITGMAKNTLINEITTTFITTVNKTVFSSIN
HHHHHHHCCCCCCCEEEEEECCCCCCCEEEEHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
EIGRNLEKNKNEIIKLKESIISMNRNMDLILAGLESVNTNSKNLNEYLSVVRTTFPEITK
HHHHHHHCCHHHHHHHHHHHHHHCCCCHHEEECHHHCCCCCCHHHHHHHHHHHHHHHHHH
GLENINSKSSNTNETINQTNNIFNNSLNNINVILKQAISTNNRVQSVLDNLIVLNNESSN
HHHHCCCCCCCCHHHHHHHHHHHHCCCHHHHHHHHHHHCCCHHHHHHHHCCEEECCCCCC
NEANSSIANLIMDIDSANKNIDSMIEFLEKINNTKPNTEVSKFIVSLNNVKGALNEEKQK
CHHHHHHHHHHHHHCCCCCCHHHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHCCHHHHH
LIKIQEIASNSSKVNENSINELKRNISNTNKQIESVMNVFNSNTRQELSTIINNFKNSIQ
HHHHHHHHCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHH
DASKLIKAGNGLNTQIENLLATSTKGADLSAKLSKELIDKLTEYKGIIGQLSKKLELVSN
HHHHHHHCCCCCCHHHHHHHHHCCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCC
DDLIQIISVLQNNPMLMSQTAAYPFNIKEEAVYTIPNYGSAMTPVYSVLALWVGTLILVS
CCHHHHHHHHCCCCCEEECCCCCCCCCCCCEEEECCCCCCHHHHHHHHHHHHHHHHHHHH
LLKTEVVDFEGSENITIRQKYFGKMLTFITLAAMQGFIVAVGNKAILGVYTVSFPLMLAF
HHHHHHHCCCCCCCCEEHHHHHHHHHHHHHHHHHHCEEEEECCCEEEEHHHHHHHHHHHH
SVVSSIVFAIITYTLVAIFGKFGNALAIVFMILQLAGSGGTYPIQVDPLIFRILQPFFPF
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCEEEECHHHHHHHHHHHHH
TYSIGGFREAIGGPLVSSVILDFIMLILMGGIFVLIGFFLKSPLHHKISKFDEDFKASGI
HHCCCHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCHHHHHHHHHCHHHHCCCC
SE
CC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 8366036 [H]