Definition Bacillus anthracis str. Sterne chromosome, complete genome.
Accession NC_005945
Length 5,228,663

Click here to switch to the map view.

The map label for this gene is pip [H]

Identifier: 49183388

GI number: 49183388

Start: 388645

End: 391470

Strand: Direct

Name: pip [H]

Synonym: BAS0360

Alternate gene names: 49183388

Gene position: 388645-391470 (Clockwise)

Preceding gene: 49183387

Following gene: 49183390

Centisome position: 7.43

GC content: 34.85

Gene sequence:

>2826_bases
ATGAAACAAATTTGGCGTATTTATAAGACAGATTTACGAAATGTAGCCAAACATTGGGCTGCAATTGTTATTGTTGTAGG
GTTAATGATTTTACCATCGTTATATGCATGGTTTAACATTAAAGCTTCCTGGGATCCGTATGGAAATACAAAAGAGGTTC
CCATTGCAGTTTCTAACCAAGATGCAGGCTCTAATTTAAGAGGGAAAGATATTAATATCGGGAACGAGATTGTAGATTCT
CTGAAGAAAAACAAAAATCTTGGTTGGAAATTTGTAGATGAAAAGCAAGCAATTTACGGAGTTGAACGCGGGGATTACTA
TGCGAGCATTACAATCCCAAAAGACTTCTCTGAAAAGATTGCAACGGTTCTGGATGAAAATCCACAGAAACCAGAACTTG
ATTACTATGTAAATGAAAAGGTAAACGCGATTGCACCAAAAATTACAGCAAAAGGTGCATCAGGTATTACAGAAGAAATT
AGTAAAAACTTTGTTAAAACAGCAAATGGTGAGATTTTTAAAATCTTCAATGACCTTGGAATCGATTTAGAAACAAACTT
ACCAAGTATTGAGAAAGTAAAAGATCTTGTATTTAAGTTAGAAGCGCAGTTCCCAGAAATGAATACACTGATGGATAAGG
CGTTAGATGATGCGACTCGAGCAGAGGATCTAGTAAAAGTAGCGCAAAAAGAGTTGCCAGTTGTAGAAAGTGTTATTAAT
GATGGGCAAGAAGCGTTAACAAATTTAGATAAGTTCTTTGCAAACAATGATCAAACATTGCAAAATGCACCTGGGACGAT
ACGAAATCATTTAACAGCGGCTAAAAATGTAATGGATAAAGCTAATGCTTTTACGGATTTTTTAATGCATCCAGGAATAG
ACTTTTCTGGTATGAAAGGATTGCCTGAGTTTCCAGCGCGTCCGGATCTTTCAAAGTTGAACGATGAAGGTTATAAAAAT
ATTGCAAGAAATATTAATCAAACAGTGAATAACGTTTTAAACTCGGCACGTGCAGGAACAACATACGGTAAAAGTGTTGT
AAACGGATTGCAAAATGGTCAATTTGATCCAGAAAAGGCAAAACAAGATCTTAATGCGGTTTCTGAAAATCTTCAAGGTC
GTACAGATAGTATTGCATATCTTATTAATGTATTTACTGAACTACAAAAATCAGCGACGACTGATTTTGGTCAAAGCTTT
TTCCAAGGCCGTGTGGATCGCTTAACTAAGCTTAAAAGCGGTATGGAAAATGCAAACAACGGTATTAAAGACATTGTAAA
TGTTATTGGCACAGGACAAGAAGTAAAGAAAGATGTAACAGATGTAGCAAATCAAAAATTAGATGCAGCAAATGGATTAA
TTGATCAAGCAGAAAAAGATTATAATGAAACATTTGTAGCAGATTATAAAAAAGCAGTTAGCACAGTCGATCAAGCTAAA
GCTGATGCAAATGAAGCGTATGATAGTGTGAAAAATGAATATGATAAGTTCAAAAATGGTGTTGAAGATGCTAAAGCAAA
CATATCAAATAAAGGTGTAACTGATTTAGAATGGGCAAAAGTATCTTTAAACGATTTAAATGGTCAATTACAAGCTACTA
ATAATCTAATTGGTGATGCGATTCCGGTTTTAGAAAGCACAAATAAGGTATTAGCAGATGTAAATAGCGGAAAAAACCTT
AATGGCGGAATTGCAAAATTGAACAAAATACAAAATTCTGTTCAAAAAGGTATAGATGCAACGAATAAGGCAACTACACT
AATTAACAATGGACAGAAGCCTACAAAAGAGGTTGTAGAAAGTATTAATGAAGCAACTCAAAATGCTTCAGCTCAATTAG
GAGATTTCTTAGCAACATATGATTCAGAAATCGTTCCAAACTTTAACACAGCAATTGAACGTACGAAACGTATGTCTAAA
AACACATCTCAAATTTTAAAAGAAGCAGACAAAAAGCTTCCAGATGTTAAAAAATTACTAGAAGATTCATCAAAAGGTTT
AGTAGACGGTAGAAAGAAATTAGCAGATATTAAAGCTGAAATGCCAGCTACTGAGAAAAAGATTAAAGAATTAGCAGATA
AAATTCGTGATTTTGAATCTGAAGAGGATTTAAAAGACATCATCCGTTTGTTGAAAAACGATGTTGAGAAGCAAAGTGAT
TACTTTGCAAATCCAGTAAATTTAAAAGAGAATAAATTATTTGCAATGCCGAACTATGGTTCAGCAATGTCACCATTCTA
TACAGTGCTTGCATTATGGGTAGGCGCATTATTAATGGTTTCGTTATTAACAGTAGAAGTACATGAAGAGGGCGCGAATT
ATAAGAGCCATGAAATTTACTTCGGACGTTTATTAACATTCTTAACGATGGGTCTTTCACAGGCGTTTATCGTATCGATG
GGAGATATATTCTTACTCGGTACGTACGTAGTCGATAAGTTCTGGTTTGTATTATTTAGTTTATTTATAGGTGGAGTATT
TGTTTGTATCGTGTACTCACTCGTTTCTATTTTCGGAAACGTAGGGAAATCGATGGCGATCATTTTACTTGTACTGCAAG
TAGCAGGATCGGGCGGAACATTCCCAATTCAAATGACACCGGCGTTCTTCCAAGCGATTTATCCGTTCTTACCGTTCACA
TACGCAATTAGTGCAATTCGTGAAACAGTAGGCGGAATGCTATGGGATATTGTAACGCGAGATTTACTTGTGTTAAGTGC
TTTCGTAGTAGTTATGATTGTTGCTGCGTTATTACTGAAAACACCAATTAACAAATCAAGTGAAAAATTCGTTGAGAATG
CAAAAGGAAGTAAAATCATTCACTAA

Upstream 100 bases:

>100_bases
TTCGTTTTCGGTTAATCCACGATATAGAAAGTGATATAATTGCAAAATGTATGTATCATTTTCTAAAGAAGGAAAAATAT
ATAATTAGGTGATAACTTCT

Downstream 100 bases:

>100_bases
CATAAAAGGTTCCTACCGATAGAGGTAGGAACCTTTTTGTTTAATCAAATTTTAATTTCTTTAATGCTTCTGCGAATGGG
TTATTTAATGGTTCTTCCTC

Product: hypothetical protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 941; Mature: 941

Protein sequence:

>941_residues
MKQIWRIYKTDLRNVAKHWAAIVIVVGLMILPSLYAWFNIKASWDPYGNTKEVPIAVSNQDAGSNLRGKDINIGNEIVDS
LKKNKNLGWKFVDEKQAIYGVERGDYYASITIPKDFSEKIATVLDENPQKPELDYYVNEKVNAIAPKITAKGASGITEEI
SKNFVKTANGEIFKIFNDLGIDLETNLPSIEKVKDLVFKLEAQFPEMNTLMDKALDDATRAEDLVKVAQKELPVVESVIN
DGQEALTNLDKFFANNDQTLQNAPGTIRNHLTAAKNVMDKANAFTDFLMHPGIDFSGMKGLPEFPARPDLSKLNDEGYKN
IARNINQTVNNVLNSARAGTTYGKSVVNGLQNGQFDPEKAKQDLNAVSENLQGRTDSIAYLINVFTELQKSATTDFGQSF
FQGRVDRLTKLKSGMENANNGIKDIVNVIGTGQEVKKDVTDVANQKLDAANGLIDQAEKDYNETFVADYKKAVSTVDQAK
ADANEAYDSVKNEYDKFKNGVEDAKANISNKGVTDLEWAKVSLNDLNGQLQATNNLIGDAIPVLESTNKVLADVNSGKNL
NGGIAKLNKIQNSVQKGIDATNKATTLINNGQKPTKEVVESINEATQNASAQLGDFLATYDSEIVPNFNTAIERTKRMSK
NTSQILKEADKKLPDVKKLLEDSSKGLVDGRKKLADIKAEMPATEKKIKELADKIRDFESEEDLKDIIRLLKNDVEKQSD
YFANPVNLKENKLFAMPNYGSAMSPFYTVLALWVGALLMVSLLTVEVHEEGANYKSHEIYFGRLLTFLTMGLSQAFIVSM
GDIFLLGTYVVDKFWFVLFSLFIGGVFVCIVYSLVSIFGNVGKSMAIILLVLQVAGSGGTFPIQMTPAFFQAIYPFLPFT
YAISAIRETVGGMLWDIVTRDLLVLSAFVVVMIVAALLLKTPINKSSEKFVENAKGSKIIH

Sequences:

>Translated_941_residues
MKQIWRIYKTDLRNVAKHWAAIVIVVGLMILPSLYAWFNIKASWDPYGNTKEVPIAVSNQDAGSNLRGKDINIGNEIVDS
LKKNKNLGWKFVDEKQAIYGVERGDYYASITIPKDFSEKIATVLDENPQKPELDYYVNEKVNAIAPKITAKGASGITEEI
SKNFVKTANGEIFKIFNDLGIDLETNLPSIEKVKDLVFKLEAQFPEMNTLMDKALDDATRAEDLVKVAQKELPVVESVIN
DGQEALTNLDKFFANNDQTLQNAPGTIRNHLTAAKNVMDKANAFTDFLMHPGIDFSGMKGLPEFPARPDLSKLNDEGYKN
IARNINQTVNNVLNSARAGTTYGKSVVNGLQNGQFDPEKAKQDLNAVSENLQGRTDSIAYLINVFTELQKSATTDFGQSF
FQGRVDRLTKLKSGMENANNGIKDIVNVIGTGQEVKKDVTDVANQKLDAANGLIDQAEKDYNETFVADYKKAVSTVDQAK
ADANEAYDSVKNEYDKFKNGVEDAKANISNKGVTDLEWAKVSLNDLNGQLQATNNLIGDAIPVLESTNKVLADVNSGKNL
NGGIAKLNKIQNSVQKGIDATNKATTLINNGQKPTKEVVESINEATQNASAQLGDFLATYDSEIVPNFNTAIERTKRMSK
NTSQILKEADKKLPDVKKLLEDSSKGLVDGRKKLADIKAEMPATEKKIKELADKIRDFESEEDLKDIIRLLKNDVEKQSD
YFANPVNLKENKLFAMPNYGSAMSPFYTVLALWVGALLMVSLLTVEVHEEGANYKSHEIYFGRLLTFLTMGLSQAFIVSM
GDIFLLGTYVVDKFWFVLFSLFIGGVFVCIVYSLVSIFGNVGKSMAIILLVLQVAGSGGTFPIQMTPAFFQAIYPFLPFT
YAISAIRETVGGMLWDIVTRDLLVLSAFVVVMIVAALLLKTPINKSSEKFVENAKGSKIIH
>Mature_941_residues
MKQIWRIYKTDLRNVAKHWAAIVIVVGLMILPSLYAWFNIKASWDPYGNTKEVPIAVSNQDAGSNLRGKDINIGNEIVDS
LKKNKNLGWKFVDEKQAIYGVERGDYYASITIPKDFSEKIATVLDENPQKPELDYYVNEKVNAIAPKITAKGASGITEEI
SKNFVKTANGEIFKIFNDLGIDLETNLPSIEKVKDLVFKLEAQFPEMNTLMDKALDDATRAEDLVKVAQKELPVVESVIN
DGQEALTNLDKFFANNDQTLQNAPGTIRNHLTAAKNVMDKANAFTDFLMHPGIDFSGMKGLPEFPARPDLSKLNDEGYKN
IARNINQTVNNVLNSARAGTTYGKSVVNGLQNGQFDPEKAKQDLNAVSENLQGRTDSIAYLINVFTELQKSATTDFGQSF
FQGRVDRLTKLKSGMENANNGIKDIVNVIGTGQEVKKDVTDVANQKLDAANGLIDQAEKDYNETFVADYKKAVSTVDQAK
ADANEAYDSVKNEYDKFKNGVEDAKANISNKGVTDLEWAKVSLNDLNGQLQATNNLIGDAIPVLESTNKVLADVNSGKNL
NGGIAKLNKIQNSVQKGIDATNKATTLINNGQKPTKEVVESINEATQNASAQLGDFLATYDSEIVPNFNTAIERTKRMSK
NTSQILKEADKKLPDVKKLLEDSSKGLVDGRKKLADIKAEMPATEKKIKELADKIRDFESEEDLKDIIRLLKNDVEKQSD
YFANPVNLKENKLFAMPNYGSAMSPFYTVLALWVGALLMVSLLTVEVHEEGANYKSHEIYFGRLLTFLTMGLSQAFIVSM
GDIFLLGTYVVDKFWFVLFSLFIGGVFVCIVYSLVSIFGNVGKSMAIILLVLQVAGSGGTFPIQMTPAFFQAIYPFLPFT
YAISAIRETVGGMLWDIVTRDLLVLSAFVVVMIVAALLLKTPINKSSEKFVENAKGSKIIH

Specific function: Required for phage infection [H]

COG id: COG1511

COG function: function code S; Predicted membrane protein

Gene ontology:

Cell location: Cell membrane; Multi-pass membrane protein [H]

Metaboloic importance: NA

Operon status: Not Known

Operon components: None

Similarity: Contains 1 ABC transmembrane type-2 domain [H]

Homologues:

None

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR013525
- InterPro:   IPR017501
- InterPro:   IPR017500 [H]

Pfam domain/function: PF01061 ABC2_membrane [H]

EC number: NA

Molecular weight: Translated: 103898; Mature: 103898

Theoretical pI: Translated: 5.33; Mature: 5.33

Prosite motif: NA

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.1 %Cys     (Translated Protein)
2.0 %Met     (Translated Protein)
2.1 %Cys+Met (Translated Protein)
0.1 %Cys     (Mature Protein)
2.0 %Met     (Mature Protein)
2.1 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MKQIWRIYKTDLRNVAKHWAAIVIVVGLMILPSLYAWFNIKASWDPYGNTKEVPIAVSNQ
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEEEECCCCCCCCCCCCEEECCC
DAGSNLRGKDINIGNEIVDSLKKNKNLGWKFVDEKQAIYGVERGDYYASITIPKDFSEKI
CCCCCCCCCCCCCCHHHHHHHHHCCCCCCEEECCHHHHHCCCCCCEEEEEECCCHHHHHH
ATVLDENPQKPELDYYVNEKVNAIAPKITAKGASGITEEISKNFVKTANGEIFKIFNDLG
HHHHCCCCCCCCCCHHHCCCHHHHCCCHHCCCCCCHHHHHHHHHHHHCCCHHEEHHHHHC
IDLETNLPSIEKVKDLVFKLEAQFPEMNTLMDKALDDATRAEDLVKVAQKELPVVESVIN
CCCCCCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
DGQEALTNLDKFFANNDQTLQNAPGTIRNHLTAAKNVMDKANAFTDFLMHPGIDFSGMKG
CCHHHHHHHHHHHCCCCCHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCC
LPEFPARPDLSKLNDEGYKNIARNINQTVNNVLNSARAGTTYGKSVVNGLQNGQFDPEKA
CCCCCCCCCHHHHCHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHCCCCCHHHH
KQDLNAVSENLQGRTDSIAYLINVFTELQKSATTDFGQSFFQGRVDRLTKLKSGMENANN
HHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHCCC
GIKDIVNVIGTGQEVKKDVTDVANQKLDAANGLIDQAEKDYNETFVADYKKAVSTVDQAK
CHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
ADANEAYDSVKNEYDKFKNGVEDAKANISNKGVTDLEWAKVSLNDLNGQLQATNNLIGDA
HHHHHHHHHHHHHHHHHHCCHHHHHHCCCCCCCCCCHHHHHHHHHCCCCHHHHHHHHHHH
IPVLESTNKVLADVNSGKNLNGGIAKLNKIQNSVQKGIDATNKATTLINNGQKPTKEVVE
HHHHHHCCHHHHCCCCCCCCCHHHHHHHHHHHHHHHCCCCCCHHHHHHCCCCCCHHHHHH
SINEATQNASAQLGDFLATYDSEIVPNFNTAIERTKRMSKNTSQILKEADKKLPDVKKLL
HHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHCCHHHHHHHHHHHCCHHHHHHH
EDSSKGLVDGRKKLADIKAEMPATEKKIKELADKIRDFESEEDLKDIIRLLKNDVEKQSD
HCCCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHH
YFANPVNLKENKLFAMPNYGSAMSPFYTVLALWVGALLMVSLLTVEVHEEGANYKSHEIY
HCCCCCCCCCCEEEECCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHH
FGRLLTFLTMGLSQAFIVSMGDIFLLGTYVVDKFWFVLFSLFIGGVFVCIVYSLVSIFGN
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
VGKSMAIILLVLQVAGSGGTFPIQMTPAFFQAIYPFLPFTYAISAIRETVGGMLWDIVTR
HHHHHHHHHHHHHHCCCCCCEEEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
DLLVLSAFVVVMIVAALLLKTPINKSSEKFVENAKGSKIIH
HHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHCCCCCCCCC
>Mature Secondary Structure
MKQIWRIYKTDLRNVAKHWAAIVIVVGLMILPSLYAWFNIKASWDPYGNTKEVPIAVSNQ
CHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEEEECCCCCCCCCCCCEEECCC
DAGSNLRGKDINIGNEIVDSLKKNKNLGWKFVDEKQAIYGVERGDYYASITIPKDFSEKI
CCCCCCCCCCCCCCHHHHHHHHHCCCCCCEEECCHHHHHCCCCCCEEEEEECCCHHHHHH
ATVLDENPQKPELDYYVNEKVNAIAPKITAKGASGITEEISKNFVKTANGEIFKIFNDLG
HHHHCCCCCCCCCCHHHCCCHHHHCCCHHCCCCCCHHHHHHHHHHHHCCCHHEEHHHHHC
IDLETNLPSIEKVKDLVFKLEAQFPEMNTLMDKALDDATRAEDLVKVAQKELPVVESVIN
CCCCCCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
DGQEALTNLDKFFANNDQTLQNAPGTIRNHLTAAKNVMDKANAFTDFLMHPGIDFSGMKG
CCHHHHHHHHHHHCCCCCHHHCCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCCCC
LPEFPARPDLSKLNDEGYKNIARNINQTVNNVLNSARAGTTYGKSVVNGLQNGQFDPEKA
CCCCCCCCCHHHHCHHHHHHHHHHHHHHHHHHHHHHCCCCHHHHHHHHHHHCCCCCHHHH
KQDLNAVSENLQGRTDSIAYLINVFTELQKSATTDFGQSFFQGRVDRLTKLKSGMENANN
HHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHCHHHHHHHHHHHHHHHHHHHHHHHHCCC
GIKDIVNVIGTGQEVKKDVTDVANQKLDAANGLIDQAEKDYNETFVADYKKAVSTVDQAK
CHHHHHHHHCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
ADANEAYDSVKNEYDKFKNGVEDAKANISNKGVTDLEWAKVSLNDLNGQLQATNNLIGDA
HHHHHHHHHHHHHHHHHHCCHHHHHHCCCCCCCCCCHHHHHHHHHCCCCHHHHHHHHHHH
IPVLESTNKVLADVNSGKNLNGGIAKLNKIQNSVQKGIDATNKATTLINNGQKPTKEVVE
HHHHHHCCHHHHCCCCCCCCCHHHHHHHHHHHHHHHCCCCCCHHHHHHCCCCCCHHHHHH
SINEATQNASAQLGDFLATYDSEIVPNFNTAIERTKRMSKNTSQILKEADKKLPDVKKLL
HHHHHHHHHHHHHHHHHHHHCCCCCCCHHHHHHHHHHHCCHHHHHHHHHHHCCHHHHHHH
EDSSKGLVDGRKKLADIKAEMPATEKKIKELADKIRDFESEEDLKDIIRLLKNDVEKQSD
HCCCCCHHHHHHHHHHHHHHCCCHHHHHHHHHHHHHCCCCHHHHHHHHHHHHHHHHHHHH
YFANPVNLKENKLFAMPNYGSAMSPFYTVLALWVGALLMVSLLTVEVHEEGANYKSHEIY
HCCCCCCCCCCEEEECCCCCCHHHHHHHHHHHHHHHHHHHHHHHHHHHHCCCCCCHHHHH
FGRLLTFLTMGLSQAFIVSMGDIFLLGTYVVDKFWFVLFSLFIGGVFVCIVYSLVSIFGN
HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
VGKSMAIILLVLQVAGSGGTFPIQMTPAFFQAIYPFLPFTYAISAIRETVGGMLWDIVTR
HHHHHHHHHHHHHHCCCCCCEEEEECHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH
DLLVLSAFVVVMIVAALLLKTPINKSSEKFVENAKGSKIIH
HHHHHHHHHHHHHHHHHHHHCCCCCCHHHHHHCCCCCCCCC

PDB accession: NA

Resolution: NA

Structure class: Alpha

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 6.0

TargetDB status: NA

Availability: NA

References: 8366036 [H]