BacMap

Definition	Yersinia pseudotuberculosis YPIII chromosome, complete genome.
Accession	NC_010465
Length	4,689,441

Click here to switch to the map view.

The map label for this gene is yeeJ [C]

Identifier: 170023559

GI number: 170023559

Start: 1441580

End: 1447510

Strand: Reverse

Name: yeeJ [C]

Synonym: YPK_1315

Alternate gene names: 170023559

Gene position: 1447510-1441580 (Counterclockwise)

Preceding gene: 170023561

Following gene: 170023556

Centisome position: 30.87

GC content: 56.03

Gene sequence:

>5931_bases
ATGATTAAATATTTTTCTTTTTTTAAAAAACCAGAGCCTATTGTCGGTATTTTACCGAACAGACAAAGTCATCATATTCT
CCCAACCCACATCAGACGGGTTGCCTGGGGCACTCTGCTATTACAATTATTTATCCCGCTGAGCGTCTCTTTCTCACCGG
CAATTGCGGCAATGAAGGCGTCAAAAGCCGACACAATGGTCTCCTATTCATCTACTGAGCCTTATGTGCTGGGATCGGGT
GAAACGGTCGCTATGGTGGCGAAAAAATACGGGATTACCGTTGATGAACTCAAAAAAATAAATATTTATCGGACTTTTTC
CCGTCCCTTCACTGCCCTGACAACGGGCGATGAAATTGATATCCCCCGTAAAGCCTCTCCCTTCTCGGTTGATAACAATA
AAGACAACAGACTTTCAGTAGAAAATACATTAGCCGGTCATGCAGTGGCGGGTGCCACTGCCTTATCCAACGGTGATGTC
GCTAAATCCGGTGAGCGGATGGTGCGTTCTGCGGCCAGCAATGAATTCAATAACTCAGCACAACAGTGGCTGAGCCAGTT
CGGTACTGCTCGCGTACAGTTGAATATTAATGATGACTTCCATCTGGACGGCAGCGCGGCCGATGTCTTGATCCCGCTAT
ACGATAATGAGAAATCCATTCTCTTTACCCAACTCGGTGCCCGCAATAAAGACAGCCGCAATACGGTCAATATGGGGGCC
GGGGTGCGTACCTTCCAGGGGAACTGGATGTATGGTGCCAATACCTTCTTTGATAATGATCTCACCGGTAAAAACCGGCG
GATCGGTGTGGGCGCAGAAGCCTGGACTGATTATCTGAAATTGTCCGCCAACAACTATTTTGGTATCACGGACTGGCACC
AGTCCCGGGACTTTATCGATTATAACGAACGCCCGGCCAACGGTTATGACCTGCGTGCGGAAGCTTATTTACCGTCGTAT
CCCCAGTTAGGTGGTAAGGCGATGTATGAAAAATACCGGGGTGATGATGTCGCGCTGTTTGGCAAAGATAACCGCCAGAA
AAATCCGCACGCCATTACTGCGGGAGTGAATTATACCCCCATCCCATTAGTGACTATTGGCGCTGAACATCGCGCCGGTA
AAGGTGGGCAAAATGACAGCAATATCAACTTCCAATTGAATTATCGCCTGGGTGAAACGTGGCAATCCCATATCGACCCT
TCAGCCGTTGCAGCGAGCCGCACACTGGCCGGGAGTCGCTATGATTTGGTTGAACGTAACAATCATATTGTGCTGGATTA
CCAGAAGCAGAATTTGGTGCGGTTGTCCTTACCGGACAGTCTGGCGGGCGATCCTTTCTCGCAGCTCTCCGTCACCGCGC
AAGTGACGGCAACACACGGGCTTGAGCGTATAGATTGGCAAAGTGCAGAGCTGATGGCGGCAGGTGGCGTGTTAAAACAA
ACCAGCAAAAATGGGCTGGAGATAACGCTGCCTGAGTATCAGATGAACAGAACCGGTGGTAACAGTTATATTCTGAACGC
CATCGCCTATGACACCCAAGGTAATGCTTCCAGTCAGGCAAGCATGCTTATCACGGTGAATGCACAAAAAATAAACATTG
CCAACTCTACGTTGGTGGCAGTGCCGATCAATATCGAAGCCAATAACAGCGACACCTCGGTGGTGACGCTGACGCTGAAA
GACGACAACAATATCCCGGTAACTGGCCAAGATGTGACCTTTCTTAGTCCCCTGGGAACACTGAGTGCCATGACCGATAG
CGGCAACGGTGTCTACACCGCGACCCTGACGGCGGGAACGGTATCGGGCACCACCGCAGTCAGCTCGAATATCAACGGCA
GTGCGCTGGACATGACCCCAGCTACGGTGACCCTGAACGGCAACAGTGGCGAACTGAGCATCACCCACTCTATGTTGGTG
GCAGCGCCAGTCAATATCGAAGCCAATGGCAGTGACACCTCGGTGGTGACGCTGACACTGCGTGACAGCAACAACAACCC
GGTCACCGGACAGACAGTGACCTTTGCCGGGACGCTCGGCACCCTTGGCGCAGTTACTGAGGGTAGCAGTGGTGTCTACA
CCGCCACCCTGACCGCCGGGATCATGGTGGGGACGTCCAGTATCACCGCCAGTGTGAACAGCACCGCGCTGGGCGTGACG
CCGGCCACCGTGACCCTGAACGGCGACAGCGGCAACCTGAGCACCACGAACTCCACCCTGGTGGCAGCGCCAGTCAATAT
CGAAGCCAATAGCAGCGACACTTCGGTGGTGACGTTGACATTGCGTGATAACAACAACAACCCGGTTACCGGTCAAACGG
TCGTCTTTACCAGCACCCTCGGGACGCTGGGCAATGTGACCGAGCAGGCCAGTGGTGTGTATACCGCGACCCTGACGGCC
GGCACCGTATCCGGTGTCGCCAGCCTGAGTGTCAGTGTGGGCGGCAATGCGCTGGGCGTGACACCAGCCACCGTGACCCT
GAACGGCGACAGCGGTAATCTGAGCACCACGAACTCCACGTTGGTGGCAGCGCCAGTCAATATCGAAGCCAATAGCAGCG
ACACCTCGGTGGTGACGTTGACATTGCGTGATAACAACAACAACCCGGTCACCGGACAGACGGTGAACTTTGCCGGGACG
CTGGGCACCCTTGGGACGGTAAGTGAAGGCAGTAGCGGGGTTTATACCACGACCCTGACGGCGGGGACCGTAGCCGGTGT
CGCCAGCCTGAGTGTCAATGTGGGCGGCAATGCGCTGGGCGTGACGCCAGCCACCGTGACCCTGAACGGCAACAGCGGCA
ACCTGAGCGCTACGAACTCCACGTTGGTGGCAGCGCCGGTCAATATCGAAGCCAATAGCAGCGACACCTCGGTGGTGACG
TTGACATTGCGTGATAACAACAACAACCCGGTTACCGGTCAAACGGTCGCCTTTACCAGCACCCTCGGGACGCTGGGCAA
TGTGACCGAGCAGGCCAGCGGTGTGTATACCGCGACCCTGACGGCGGGGACCGTTTCCGGTGTCGCCAGCCTGAGTGTCA
GTGTGAACAGCAATGCGCTGGGCGTGACGCCGGCCACCGTGACCCTGAACGGCGACAGCGGCAACCTGAGCACCACGAAC
TCCACGTTGGTGGCAGCCCCAGTCAATATCGAAGCCAATAGCAGCGACACCTCGGTGGTGACGTTGACATTGCGTGATAA
CAACAACAACCCGGTCACCGGGCAGACGGTCGCCTTTACCAGCACCCTCGGGACGCTGGGCAATGTGACCGAGCAGGCCA
GCGGCCTCTATACCGCGACCCTGACCGCCGGCACCGTATCCGGTGTCGCCAGCCTGAGTGTCAATGTGGGCGGCAATGCG
CTGGGCGTGACGCCAGCCACCGTGACCCTGAACGGCGACAGCGGCAACCTGAGCGCCACGAACTCCACCCTGGTGGCAGC
GCCAGTCAATATCGAAGCCAATAGCAGCGACACCTCGGTGGTGACGTTGACATTGCGTGATAACAACAACAACCCGGTTA
CCGGTCAAACGGTCGCCTTTACCAGCACCCTCGGGACGCTGGGCAATGTGACCGAGCAGGCCAGCGGCCTCTATACCGCG
ACCCTGACCGCCGGCACCGTATCCGGTGTCGCCAGCCTGAGTGTCAATGTGGGCGGCACCGCGCTGGGCGTGACGCCGGC
CACCGTGACCCTGAACGGCGACAGCGGCAACCTGAGCACCACGAACTCCACGTTGGTGGCAGCGCCAGTCAATATCGAAG
CCAATAGCAGCGACACTTCGGTGGTGACGTTGACATTGCGTGATAACAACAACAACCCGGTTACCGGTCAAACGGTCGCC
TTTACCAGCACCCTCGGGACGCTGGGCAATGTGACCGAGCAGGCCAGCGGCCTCTATACCGCGACCCTGACCGCCGGCAC
CGTATCCGGTGTCGCCAGCCTGAGTGTCAGTGTGAACAGCACCGCGCTGGGCGTGACACCAGCCACCGTGACCCTGAACG
GCGACAGCGGCAACCTGAGCACCACGAACTCCACGTTGGTGGCAGCGCCAGTCAATATCGAAGCCAATAGCAGCGACACT
TCGGTGGTGACGTTGACATTGCGTGATAACAACAACAACCCGGTCACCGGTCAAACGGTCGCCTTTACCAGCACCCTCGG
GACGCTGGGCAATGTGACCGAGCAGGCCAGTGGTGTGTATACCGCGACCCTGACCGCCGGCACCGTAGCCGGTGTCGCCA
GCCTGAGTGTCAATGTGGGCGGCAATGCGCTGGGCGTGACGCCAGCCACCGTGACCCTGAACGGCGACAGCGGCAACCTG
AGCACCACGAACTCCACGTTGGTGGCAGCGCCAGTCAATATCGAAGCCAATAGCAGCGACACTTCGGTGGTGACGTTGAC
ATTGCGTGATAACAACAACAACCCGGTCACCGGTCAAACGGTCGCCTTTACCAGCACCCTCGGGACGCTGGGCAATGTGA
CCGAGCAGGCCAGTGGTGTGTATACCGCGACCCTGACCGCCGGCACCGTATCCGGTGTCGCCAGCCTGAGTGTCAGTGTG
GGCAGCAGTGCGCTGGGCGTGACGCCAGCCACCGTGACCCTGAACGGCGACAGCGGCAACCTGAGCACCACGAACTCCAC
GTTGGTGGCAGCACCAGTCAATATCGAAGCCAATAACAGTGACACCTCGGTGGTGACGTTGACATTGCGTGATAACAACA
ACAACCCGGTTACCGGTCAAACGGTCGCCTTTACCAGCACCCTCGGGACGCTGGGCAATGTGACCGAGCAGGCCAGCGGT
GTGTATACCGCGACCCTGACGGCGGGGACCGTTTCCGGTGTCGCCAGCCTGAGTGTCAGTGTGAACAGCAATGCGCTGGG
CGTGACGCCGGCCACCGTGACCCTGAACGGCGACAGCGGCAACCTGAGCACCACGAACTCCACGTTGGTGGCAGCCCCAG
TCAATATCGAAGCCAATAGCAGCGACACCTCGGTGGTGACGTTGACATTGCGTGATAACAACAACAACCCGGTCACCGGT
CAAACGGTCGTCTTTACCAGCACCCTCGGGACGCTGGGCAATGTGACCGAGCAGGCCAGCGGCCTCTATACCGCCACCCT
GACGGCCGGTACCGTATCCGGTGTCGCCAGCCTGAGTGTCAGTGTGGGCGGCAATGCGCTGGGCGTGACAGGCAACATCA
CACTGGCACCTGGTGCATTAGATGCTGCGCGCTCAATATTGGCAGTGAACAAACCTAGCATTAACGCCGATGACCGAATT
GGCTCCACCATTACCTTTACCGCACAGGATGCGCAAGGTAATGCCATTACCGGTCTGGACATTGCGTTTATGACTGACTT
GGAAAATAGCCAGATAATGACGTTAGTAGACCATAATGATGGTACCTATACGGCGAATATTAATGGTACCCAAACGGGTA
TCGCAAATATTGCGGTACAGTCATCAGGTGCCACGATCGCGGGGCTCGCTGCAACGATGGTGACAATAACGCCGGGGGCA
TGGAATACAACACAAGCAACCCCTGTCATGACAGTGGCTCTACCTATTACGACATGCCAGTCAAGCTCTGGTGTTTATAA
GCGGTATTATATAGGGATTGTAACTCACGAATTGTACGATAATTACGGTAATGAGATTAGCGGGATACTTACCTATAATC
TTGGTGCAGGAAGGTATACGACGGTCACATCTCAAAATTCATCTGTATCTGGGTCTAATGGGCTAACACGGAGAAGCAAT
AGTCCTGTCAGTCATTTTATCTTAACTTCTGATGCTTATACCAGTCAGGCAGCCTGTTATGCCGAGAGAATTGCAAATGT
AAATGTAACGATAACGGTTACTGCAATTACAGATGACTTCAAGACATCCGCTGTTAATAAAGTCTTTATTTTAGGAACCG
GATCTAACTAA

Upstream 100 bases:

>100_bases
AAAACGAGTGCACAATCCCATTATAATAACTATGTGTAATGAATAACCTTTATTTATTATCCTTAATAAAGAAGGGTGTT
CGTTATCTATGAGCGTATAT

Downstream 100 bases:

>100_bases
TCCAACATGTTACAGGCCATTCCGGCATGCCATTTATTATTGCCGGAATATAAAAGGCTCATGGTTAGGAAACTGGATCG
CTGTTTTGTCTCTGTTTCCT

Product: Ig domain-containing protein

Products: NA

Alternate protein names: NA

Number of amino acids: Translated: 1976; Mature: 1976

Protein sequence:

>1976_residues
MIKYFSFFKKPEPIVGILPNRQSHHILPTHIRRVAWGTLLLQLFIPLSVSFSPAIAAMKASKADTMVSYSSTEPYVLGSG
ETVAMVAKKYGITVDELKKINIYRTFSRPFTALTTGDEIDIPRKASPFSVDNNKDNRLSVENTLAGHAVAGATALSNGDV
AKSGERMVRSAASNEFNNSAQQWLSQFGTARVQLNINDDFHLDGSAADVLIPLYDNEKSILFTQLGARNKDSRNTVNMGA
GVRTFQGNWMYGANTFFDNDLTGKNRRIGVGAEAWTDYLKLSANNYFGITDWHQSRDFIDYNERPANGYDLRAEAYLPSY
PQLGGKAMYEKYRGDDVALFGKDNRQKNPHAITAGVNYTPIPLVTIGAEHRAGKGGQNDSNINFQLNYRLGETWQSHIDP
SAVAASRTLAGSRYDLVERNNHIVLDYQKQNLVRLSLPDSLAGDPFSQLSVTAQVTATHGLERIDWQSAELMAAGGVLKQ
TSKNGLEITLPEYQMNRTGGNSYILNAIAYDTQGNASSQASMLITVNAQKINIANSTLVAVPINIEANNSDTSVVTLTLK
DDNNIPVTGQDVTFLSPLGTLSAMTDSGNGVYTATLTAGTVSGTTAVSSNINGSALDMTPATVTLNGNSGELSITHSMLV
AAPVNIEANGSDTSVVTLTLRDSNNNPVTGQTVTFAGTLGTLGAVTEGSSGVYTATLTAGIMVGTSSITASVNSTALGVT
PATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVVFTSTLGTLGNVTEQASGVYTATLTA
GTVSGVASLSVSVGGNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVNFAGT
LGTLGTVSEGSSGVYTTTLTAGTVAGVASLSVNVGGNALGVTPATVTLNGNSGNLSATNSTLVAAPVNIEANSSDTSVVT
LTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSVNSNALGVTPATVTLNGDSGNLSTTN
STLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVNVGGNA
LGVTPATVTLNGDSGNLSATNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTA
TLTAGTVSGVASLSVNVGGTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVA
FTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVNSTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDT
SVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVAGVASLSVNVGGNALGVTPATVTLNGDSGNL
STTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSV
GSSALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANNSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASG
VYTATLTAGTVSGVASLSVSVNSNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTG
QTVVFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVGGNALGVTGNITLAPGALDAARSILAVNKPSINADDRI
GSTITFTAQDAQGNAITGLDIAFMTDLENSQIMTLVDHNDGTYTANINGTQTGIANIAVQSSGATIAGLAATMVTITPGA
WNTTQATPVMTVALPITTCQSSSGVYKRYYIGIVTHELYDNYGNEISGILTYNLGAGRYTTVTSQNSSVSGSNGLTRRSN
SPVSHFILTSDAYTSQAACYAERIANVNVTITVTAITDDFKTSAVNKVFILGTGSN

Sequences:

>Translated_1976_residues
MIKYFSFFKKPEPIVGILPNRQSHHILPTHIRRVAWGTLLLQLFIPLSVSFSPAIAAMKASKADTMVSYSSTEPYVLGSG
ETVAMVAKKYGITVDELKKINIYRTFSRPFTALTTGDEIDIPRKASPFSVDNNKDNRLSVENTLAGHAVAGATALSNGDV
AKSGERMVRSAASNEFNNSAQQWLSQFGTARVQLNINDDFHLDGSAADVLIPLYDNEKSILFTQLGARNKDSRNTVNMGA
GVRTFQGNWMYGANTFFDNDLTGKNRRIGVGAEAWTDYLKLSANNYFGITDWHQSRDFIDYNERPANGYDLRAEAYLPSY
PQLGGKAMYEKYRGDDVALFGKDNRQKNPHAITAGVNYTPIPLVTIGAEHRAGKGGQNDSNINFQLNYRLGETWQSHIDP
SAVAASRTLAGSRYDLVERNNHIVLDYQKQNLVRLSLPDSLAGDPFSQLSVTAQVTATHGLERIDWQSAELMAAGGVLKQ
TSKNGLEITLPEYQMNRTGGNSYILNAIAYDTQGNASSQASMLITVNAQKINIANSTLVAVPINIEANNSDTSVVTLTLK
DDNNIPVTGQDVTFLSPLGTLSAMTDSGNGVYTATLTAGTVSGTTAVSSNINGSALDMTPATVTLNGNSGELSITHSMLV
AAPVNIEANGSDTSVVTLTLRDSNNNPVTGQTVTFAGTLGTLGAVTEGSSGVYTATLTAGIMVGTSSITASVNSTALGVT
PATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVVFTSTLGTLGNVTEQASGVYTATLTA
GTVSGVASLSVSVGGNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVNFAGT
LGTLGTVSEGSSGVYTTTLTAGTVAGVASLSVNVGGNALGVTPATVTLNGNSGNLSATNSTLVAAPVNIEANSSDTSVVT
LTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSVNSNALGVTPATVTLNGDSGNLSTTN
STLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVNVGGNA
LGVTPATVTLNGDSGNLSATNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTA
TLTAGTVSGVASLSVNVGGTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVA
FTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVNSTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDT
SVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVAGVASLSVNVGGNALGVTPATVTLNGDSGNL
STTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSV
GSSALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANNSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASG
VYTATLTAGTVSGVASLSVSVNSNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTG
QTVVFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVGGNALGVTGNITLAPGALDAARSILAVNKPSINADDRI
GSTITFTAQDAQGNAITGLDIAFMTDLENSQIMTLVDHNDGTYTANINGTQTGIANIAVQSSGATIAGLAATMVTITPGA
WNTTQATPVMTVALPITTCQSSSGVYKRYYIGIVTHELYDNYGNEISGILTYNLGAGRYTTVTSQNSSVSGSNGLTRRSN
SPVSHFILTSDAYTSQAACYAERIANVNVTITVTAITDDFKTSAVNKVFILGTGSN
>Mature_1976_residues
MIKYFSFFKKPEPIVGILPNRQSHHILPTHIRRVAWGTLLLQLFIPLSVSFSPAIAAMKASKADTMVSYSSTEPYVLGSG
ETVAMVAKKYGITVDELKKINIYRTFSRPFTALTTGDEIDIPRKASPFSVDNNKDNRLSVENTLAGHAVAGATALSNGDV
AKSGERMVRSAASNEFNNSAQQWLSQFGTARVQLNINDDFHLDGSAADVLIPLYDNEKSILFTQLGARNKDSRNTVNMGA
GVRTFQGNWMYGANTFFDNDLTGKNRRIGVGAEAWTDYLKLSANNYFGITDWHQSRDFIDYNERPANGYDLRAEAYLPSY
PQLGGKAMYEKYRGDDVALFGKDNRQKNPHAITAGVNYTPIPLVTIGAEHRAGKGGQNDSNINFQLNYRLGETWQSHIDP
SAVAASRTLAGSRYDLVERNNHIVLDYQKQNLVRLSLPDSLAGDPFSQLSVTAQVTATHGLERIDWQSAELMAAGGVLKQ
TSKNGLEITLPEYQMNRTGGNSYILNAIAYDTQGNASSQASMLITVNAQKINIANSTLVAVPINIEANNSDTSVVTLTLK
DDNNIPVTGQDVTFLSPLGTLSAMTDSGNGVYTATLTAGTVSGTTAVSSNINGSALDMTPATVTLNGNSGELSITHSMLV
AAPVNIEANGSDTSVVTLTLRDSNNNPVTGQTVTFAGTLGTLGAVTEGSSGVYTATLTAGIMVGTSSITASVNSTALGVT
PATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVVFTSTLGTLGNVTEQASGVYTATLTA
GTVSGVASLSVSVGGNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVNFAGT
LGTLGTVSEGSSGVYTTTLTAGTVAGVASLSVNVGGNALGVTPATVTLNGNSGNLSATNSTLVAAPVNIEANSSDTSVVT
LTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSVNSNALGVTPATVTLNGDSGNLSTTN
STLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVNVGGNA
LGVTPATVTLNGDSGNLSATNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTA
TLTAGTVSGVASLSVNVGGTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVA
FTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVNSTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDT
SVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVAGVASLSVNVGGNALGVTPATVTLNGDSGNL
STTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSV
GSSALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANNSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASG
VYTATLTAGTVSGVASLSVSVNSNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTG
QTVVFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVGGNALGVTGNITLAPGALDAARSILAVNKPSINADDRI
GSTITFTAQDAQGNAITGLDIAFMTDLENSQIMTLVDHNDGTYTANINGTQTGIANIAVQSSGATIAGLAATMVTITPGA
WNTTQATPVMTVALPITTCQSSSGVYKRYYIGIVTHELYDNYGNEISGILTYNLGAGRYTTVTSQNSSVSGSNGLTRRSN
SPVSHFILTSDAYTSQAACYAERIANVNVTITVTAITDDFKTSAVNKVFILGTGSN

Specific function: Unknown

COG id: NA

COG function: NA

Gene ontology:

Cell location: Cytoplasmic

Metaboloic importance: Unknown [C]

Operon status: Not Known

Operon components: None

Similarity: Contains 17 Big-1 (bacterial Ig-like domain 1) domains [H]

Homologues:

Organism=Escherichia coli, GI145693153, Length=1804, Percent_Identity=30.09977827051, Blast_Score=523, Evalue=1e-149,
Organism=Escherichia coli, GI145693120, Length=379, Percent_Identity=33.7730870712401, Blast_Score=210, Evalue=9e-55,
Organism=Drosophila melanogaster, GI221472639, Length=1144, Percent_Identity=22.2027972027972, Blast_Score=69, Evalue=5e-11,

Paralogues:

None

Copy number: NA

Swissprot (AC and ID): NA

Other databases:

- InterPro:   IPR003344
- InterPro:   IPR003535
- InterPro:   IPR008964
- InterPro:   IPR022409 [H]

Pfam domain/function: PF02369 Big_1 [H]

EC number: NA

Molecular weight: Translated: 201210; Mature: 201210

Theoretical pI: Translated: 4.37; Mature: 4.37

Prosite motif: PS51127 BIG1 ; PS00283 SOYBEAN_KUNITZ

Important sites: NA

Signals:

None

Transmembrane regions:

None

Cys/Met content:

0.1 %Cys     (Translated Protein)
1.0 %Met     (Translated Protein)
1.1 %Cys+Met (Translated Protein)
0.1 %Cys     (Mature Protein)
1.0 %Met     (Mature Protein)
1.1 %Cys+Met (Mature Protein)

Secondary structure:

>Translated Secondary Structure
MIKYFSFFKKPEPIVGILPNRQSHHILPTHIRRVAWGTLLLQLFIPLSVSFSPAIAAMKA
CCCHHHHHCCCCCEEEECCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCCHHHEEEC
SKADTMVSYSSTEPYVLGSGETVAMVAKKYGITVDELKKINIYRTFSRPFTALTTGDEID
CCCCEEEEECCCCCEEEECCCEEEEEEHHHCCCHHHEEEEEEEEECCCCEEEEECCCCCC
IPRKASPFSVDNNKDNRLSVENTLAGHAVAGATALSNGDVAKSGERMVRSAASNEFNNSA
CCCCCCCCCCCCCCCCEEEEHHCCCCCEEECEEEECCCCCCCCHHHHHHHHHCCCCCHHH
QQWLSQFGTARVQLNINDDFHLDGSAADVLIPLYDNEKSILFTQLGARNKDSRNTVNMGA
HHHHHHCCCEEEEEEECCCEEECCCCCEEEEEEECCCCEEEEEECCCCCCCCCCEEECCC
GVRTFQGNWMYGANTFFDNDLTGKNRRIGVGAEAWTDYLKLSANNYFGITDWHQSRDFID
CEEEEECCEEECCCEEECCCCCCCCCEEECCHHHHCEEEEEECCCEEEECCCCCCCCCCC
YNERPANGYDLRAEAYLPSYPQLGGKAMYEKYRGDDVALFGKDNRQKNPHAITAGVNYTP
CCCCCCCCEEEEEEECCCCCCCCCCHHHHHHHCCCEEEEEECCCCCCCCCEEEECCCCCC
IPLVTIGAEHRAGKGGQNDSNINFQLNYRLGETWQSHIDPSAVAASRTLAGSRYDLVERN
CEEEEECCCCCCCCCCCCCCEEEEEEEEEECCHHHHHCCHHHHHHHHHCCCCEEEEEECC
NHIVLDYQKQNLVRLSLPDSLAGDPFSQLSVTAQVTATHGLERIDWQSAELMAAGGVLKQ
CEEEEEECCCCEEEEECCCCCCCCCHHHEEEEEEEEECCCCCCCCCCCCEEEECCCEEEC
TSKNGLEITLPEYQMNRTGGNSYILNAIAYDTQGNASSQASMLITVNAQKINIANSTLVA
CCCCCCEEEECCEEECCCCCCEEEEEEEEECCCCCCCCCEEEEEEEEEEEEEECCCEEEE
VPINIEANNSDTSVVTLTLKDDNNIPVTGQDVTFLSPLGTLSAMTDSGNGVYTATLTAGT
EEEEEECCCCCCEEEEEEEECCCCCCCCCCCEEEECCCCCEEEEECCCCEEEEEEEEECC
VSGTTAVSSNINGSALDMTPATVTLNGNSGELSITHSMLVAAPVNIEANGSDTSVVTLTL
CCCCEEEECCCCCCEEEECCEEEEEECCCCEEEEEEEEEEEEEEEEECCCCCCEEEEEEE
RDSNNNPVTGQTVTFAGTLGTLGAVTEGSSGVYTATLTAGIMVGTSSITASVNSTALGVT
ECCCCCCCCCEEEEEEECCCCCCEEECCCCCEEEEEEEEEEEEECCEEEEECCCEEEEEC
PATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVVFTSTL
EEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEECC
GTLGNVTEQASGVYTATLTAGTVSGVASLSVSVGGNALGVTPATVTLNGDSGNLSTTNST
CCCCCCHHHCCCEEEEEEECCCCCCEEEEEEEECCCEEECCEEEEEEECCCCCCEECCCE
LVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVNFAGTLGTLGTVSEGSSGVYTTTLT
EEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEECCCCCEECCCCCCCEEEEEEE
AGTVAGVASLSVNVGGNALGVTPATVTLNGNSGNLSATNSTLVAAPVNIEANSSDTSVVT
CCCEEEEEEEEEEECCCEEECCEEEEEEECCCCCEEECCCEEEEEEEEEECCCCCCEEEE
LTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSVNSNAL
EEEEECCCCCCCCEEEEEEEHHCCCCCCHHHCCCEEEEEEECCCCCCEEEEEEEECCCEE
GVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFT
EECEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEE
STLGTLGNVTEQASGLYTATLTAGTVSGVASLSVNVGGNALGVTPATVTLNGDSGNLSAT
EHHCCCCCHHHHCCCEEEEEEECCCCCCEEEEEEEECCCEEECCEEEEEEECCCCCEEEC
NSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTA
CCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEEHHCCCCCHHHHCCCEEEE
TLTAGTVSGVASLSVNVGGTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTS
EEECCCCCCEEEEEEECCCEEEECCEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCE
VVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVNS
EEEEEEEECCCCCCCCEEEEEEEHHCCCCCHHHHCCCEEEEEEECCCCCCEEEEEEEECC
TALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTV
EEEEEEEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEE
AFTSTLGTLGNVTEQASGVYTATLTAGTVAGVASLSVNVGGNALGVTPATVTLNGDSGNL
EEEEHHCCCCCCHHHCCCEEEEEEECCCEEEEEEEEEEECCCEEECCEEEEEEECCCCCC
STTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGV
EECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEEHHCCCCCCHHHCCCE
YTATLTAGTVSGVASLSVSVGSSALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANNS
EEEEEECCCCCCEEEEEEECCCCCCCCCEEEEEEECCCCCCEECCCEEEEEEEEEECCCC
DTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVS
CCEEEEEEEEECCCCCCCCEEEEEEEHHCCCCCCHHHCCCEEEEEEECCCCCCEEEEEEE
VNSNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTG
ECCCEEEECEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCC
QTVVFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVGGNALGVTGNITLAPGAL
EEEEEEECCCCCCCHHHHCCCEEEEEEECCCCCCEEEEEEEECCCEEEEEEEEEECCCCH
DAARSILAVNKPSINADDRIGSTITFTAQDAQGNAITGLDIAFMTDLENSQIMTLVDHND
HHHCCEEEECCCCCCCCCCCCCEEEEEEECCCCCEEEEEEEEEEECCCCCEEEEEEECCC
GTYTANINGTQTGIANIAVQSSGATIAGLAATMVTITPGAWNTTQATPVMTVALPITTCQ
CEEEEECCCCCCCEEEEEEECCCCEEEEEEEEEEEECCCCCCCCCCCEEEEEEEEEEECC
SSSGVYKRYYIGIVTHELYDNYGNEISGILTYNLGAGRYTTVTSQNSSVSGSNGLTRRSN
CCCCCEEEEEEEEEEEEHHHCCCCCEEEEEEEECCCCEEEEEECCCCCCCCCCCCCCCCC
SPVSHFILTSDAYTSQAACYAERIANVNVTITVTAITDDFKTSAVNKVFILGTGSN
CCCEEEEEECCCCCCHHHHHHHHHCCCEEEEEEEEEECCCCCCCCCEEEEEECCCC
>Mature Secondary Structure
MIKYFSFFKKPEPIVGILPNRQSHHILPTHIRRVAWGTLLLQLFIPLSVSFSPAIAAMKA
CCCHHHHHCCCCCEEEECCCCCCCCCCHHHHHHHHHHHHHHHHHHCCCCCCCCHHHEEEC
SKADTMVSYSSTEPYVLGSGETVAMVAKKYGITVDELKKINIYRTFSRPFTALTTGDEID
CCCCEEEEECCCCCEEEECCCEEEEEEHHHCCCHHHEEEEEEEEECCCCEEEEECCCCCC
IPRKASPFSVDNNKDNRLSVENTLAGHAVAGATALSNGDVAKSGERMVRSAASNEFNNSA
CCCCCCCCCCCCCCCCEEEEHHCCCCCEEECEEEECCCCCCCCHHHHHHHHHCCCCCHHH
QQWLSQFGTARVQLNINDDFHLDGSAADVLIPLYDNEKSILFTQLGARNKDSRNTVNMGA
HHHHHHCCCEEEEEEECCCEEECCCCCEEEEEEECCCCEEEEEECCCCCCCCCCEEECCC
GVRTFQGNWMYGANTFFDNDLTGKNRRIGVGAEAWTDYLKLSANNYFGITDWHQSRDFID
CEEEEECCEEECCCEEECCCCCCCCCEEECCHHHHCEEEEEECCCEEEECCCCCCCCCCC
YNERPANGYDLRAEAYLPSYPQLGGKAMYEKYRGDDVALFGKDNRQKNPHAITAGVNYTP
CCCCCCCCEEEEEEECCCCCCCCCCHHHHHHHCCCEEEEEECCCCCCCCCEEEECCCCCC
IPLVTIGAEHRAGKGGQNDSNINFQLNYRLGETWQSHIDPSAVAASRTLAGSRYDLVERN
CEEEEECCCCCCCCCCCCCCEEEEEEEEEECCHHHHHCCHHHHHHHHHCCCCEEEEEECC
NHIVLDYQKQNLVRLSLPDSLAGDPFSQLSVTAQVTATHGLERIDWQSAELMAAGGVLKQ
CEEEEEECCCCEEEEECCCCCCCCCHHHEEEEEEEEECCCCCCCCCCCCEEEECCCEEEC
TSKNGLEITLPEYQMNRTGGNSYILNAIAYDTQGNASSQASMLITVNAQKINIANSTLVA
CCCCCCEEEECCEEECCCCCCEEEEEEEEECCCCCCCCCEEEEEEEEEEEEEECCCEEEE
VPINIEANNSDTSVVTLTLKDDNNIPVTGQDVTFLSPLGTLSAMTDSGNGVYTATLTAGT
EEEEEECCCCCCEEEEEEEECCCCCCCCCCCEEEECCCCCEEEEECCCCEEEEEEEEECC
VSGTTAVSSNINGSALDMTPATVTLNGNSGELSITHSMLVAAPVNIEANGSDTSVVTLTL
CCCCEEEECCCCCCEEEECCEEEEEECCCCEEEEEEEEEEEEEEEEECCCCCCEEEEEEE
RDSNNNPVTGQTVTFAGTLGTLGAVTEGSSGVYTATLTAGIMVGTSSITASVNSTALGVT
ECCCCCCCCCEEEEEEECCCCCCEEECCCCCEEEEEEEEEEEEECCEEEEECCCEEEEEC
PATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVVFTSTL
EEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEECC
GTLGNVTEQASGVYTATLTAGTVSGVASLSVSVGGNALGVTPATVTLNGDSGNLSTTNST
CCCCCCHHHCCCEEEEEEECCCCCCEEEEEEEECCCEEECCEEEEEEECCCCCCEECCCE
LVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVNFAGTLGTLGTVSEGSSGVYTTTLT
EEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEECCCCCEECCCCCCCEEEEEEE
AGTVAGVASLSVNVGGNALGVTPATVTLNGNSGNLSATNSTLVAAPVNIEANSSDTSVVT
CCCEEEEEEEEEEECCCEEECCEEEEEEECCCCCEEECCCEEEEEEEEEECCCCCCEEEE
LTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVSVNSNAL
EEEEECCCCCCCCEEEEEEEHHCCCCCCHHHCCCEEEEEEECCCCCCEEEEEEEECCCEE
GVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFT
EECEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEE
STLGTLGNVTEQASGLYTATLTAGTVSGVASLSVNVGGNALGVTPATVTLNGDSGNLSAT
EHHCCCCCHHHHCCCEEEEEEECCCCCCEEEEEEEECCCEEECCEEEEEEECCCCCEEEC
NSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTA
CCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEEHHCCCCCHHHHCCCEEEE
TLTAGTVSGVASLSVNVGGTALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTS
EEECCCCCCEEEEEEECCCEEEECCEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCE
VVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVNS
EEEEEEEECCCCCCCCEEEEEEEHHCCCCCHHHHCCCEEEEEEECCCCCCEEEEEEEECC
TALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTV
EEEEEEEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEE
AFTSTLGTLGNVTEQASGVYTATLTAGTVAGVASLSVNVGGNALGVTPATVTLNGDSGNL
EEEEHHCCCCCCHHHCCCEEEEEEECCCEEEEEEEEEEECCCEEECCEEEEEEECCCCCC
STTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGV
EECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCCEEEEEEEHHCCCCCCHHHCCCE
YTATLTAGTVSGVASLSVSVGSSALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANNS
EEEEEECCCCCCEEEEEEECCCCCCCCCEEEEEEECCCCCCEECCCEEEEEEEEEECCCC
DTSVVTLTLRDNNNNPVTGQTVAFTSTLGTLGNVTEQASGVYTATLTAGTVSGVASLSVS
CCEEEEEEEEECCCCCCCCEEEEEEEHHCCCCCCHHHCCCEEEEEEECCCCCCEEEEEEE
VNSNALGVTPATVTLNGDSGNLSTTNSTLVAAPVNIEANSSDTSVVTLTLRDNNNNPVTG
ECCCEEEECEEEEEEECCCCCCEECCCEEEEEEEEEECCCCCCEEEEEEEEECCCCCCCC
QTVVFTSTLGTLGNVTEQASGLYTATLTAGTVSGVASLSVSVGGNALGVTGNITLAPGAL
EEEEEEECCCCCCCHHHHCCCEEEEEEECCCCCCEEEEEEEECCCEEEEEEEEEECCCCH
DAARSILAVNKPSINADDRIGSTITFTAQDAQGNAITGLDIAFMTDLENSQIMTLVDHND
HHHCCEEEECCCCCCCCCCCCCEEEEEEECCCCCEEEEEEEEEEECCCCCEEEEEEECCC
GTYTANINGTQTGIANIAVQSSGATIAGLAATMVTITPGAWNTTQATPVMTVALPITTCQ
CEEEEECCCCCCCEEEEEEECCCCEEEEEEEEEEEECCCCCCCCCCCEEEEEEEEEEECC
SSSGVYKRYYIGIVTHELYDNYGNEISGILTYNLGAGRYTTVTSQNSSVSGSNGLTRRSN
CCCCCEEEEEEEEEEEEHHHCCCCCEEEEEEEECCCCEEEEEECCCCCCCCCCCCCCCCC
SPVSHFILTSDAYTSQAACYAERIANVNVTITVTAITDDFKTSAVNKVFILGTGSN
CCCEEEEEECCCCCCHHHHHHHHHCCCEEEEEEEEEECCCCCCCCCEEEEEECCCC

PDB accession: NA

Resolution: NA

Structure class: Unstructured

Cofactors: NA

Metal ions: NA

Kcat value (1/min): NA

Specific activity: NA

Km value (mM): NA

Substrates: NA

Specific reaction: NA

General reaction: NA

Inhibitor: NA

Structure determination priority: 9.0

TargetDB status: NA

Availability: NA

References: 11206551; 11258796 [H]