CAZyme3D

You are here: Home Cite us: 2025

Entry ID

Information for CAZyme ID: EFA00965.2

Basic Information

GenBank IDEFA00965.2
FamilyCBM14, GH18
Sequence Length2393
UniProt IDD6WH41(100,100)Download
Average pLDDT?40.63
CAZy50 ID811
CAZy50 RepYes, EFA00965.2
Structure ClusterSC_CBM14_clus8, SC_GH18_clus304
EC Number(s)-
Substrates(s)-

Taxonomy

Tax ID7070
KingdomEukaryota
PhylumArthropoda
ClassInsecta
OrderColeoptera
FamilyTenebrionidae
GenusTribolium
SpeciesTribolium castaneum

Protein Sequence:
90 < plddt <=100;
70 < plddt <= 90;
50 < plddt <= 70;
0 <= plddt <= 50;     Download help

MSTDICRWLF  LLFFLTTWTK  YSNSKEIRVV  CYYTNWSVYR  PGTAKFSPQN  INPYLCTHLI60
YAFGGFTKEN  TLKPFDKYQD  IEKGGYAKFT  GLKTYNKNLK  TMLAIGGWNE  GSSRFSPMVA120
NPERRKELIK  NAIKFLRQNH  FDGLDLDWEY  PSFRDGGKSR  DKDNYAQLVQ  ELREEFDRES180
EKTGRPRLLL  TMAVPAGIEY  INKGYDVPKL  TKYLDWMNIL  SYDYHSAFEP  AVNHHAPLYP240
LEEPSEYNYD  TELNIDYTIQ  HYLKKGADPS  KLVLGIPTYG  RSYTLFNPDA  NEIGAPADGP300
GDMGEATREN  GYLAYYEVCE  YIKTQNWEVV  QPNPDAMGPY  AFKDNQWVGY  DDDKIARKKA360
EYVAEKGLGG  IMFWSIDNDD  FRGNCHGKPY  PIIEAAKEAL  ISAYGLTDEN  LVSPPTKPIK420
TKTRNRTQSS  SKSTDENSEK  KKSTSSIVSR  RRNRIKTKSE  ELSNSQSKSH  RKESRRTTEG480
PVYSSLELVT  PSYTTPAPPS  TPDLGGGFKC  EDEGFYPHPK  DCKKYYWCLS  GPGELGIVAH540
LFTCPAGLYF  NKAADSCDYT  RNVLCNKKLS  KATTTTTTTT  TTEASTLKTS  TARVPPKITA600
ATSRTTVFRT  STTTEAYDDE  YEYEDDVEEN  KNSEEDPKVI  KELLDLIKKA  GGIEELEKQL660
KIHEDGSASV  SNSDTTTPSS  ISKSLVERVL  GKGAKVGGKK  NSYSFLTRNS  RGPQNEGLNT720
HEDKETTQDK  GRPKYTTITR  QRSTNNKNED  EEEESSDEAS  KSTKKQPEYV  NIRRARVSTT780
TEEPEENSKS  QLNRNKILGE  EDETEDEQPS  RKKTSGPQYV  NIRRQRPSTT  EETSTSKYTV840
IRRGTTTEPA  EPEEDETTKS  NVVSTSTEKI  DLKSRYSILR  RGSTTEATTT  ESGSISSTSS900
PKRRGTTLPS  VPERKRTRGT  LAPGTTPSSE  DTTTTRYKSI  KRGSTSEAPT  TDKTLPEDST960
LKYSTFTRTP  ASTQAAPAAT  EPETAVTVNV  QLLTTPESLT  VKTTSLSSTK  QSEQSNIESI1020
GERVYQTQTP  LLLEPRPFSK  TSTRSPTPVV  TESSTRITKV  SDSNYNLRLK  PKLSQTQTEI1080
ISTTTLTTEK  PTPFRTRAPS  RFKLTTASYD  QQATKQANRA  RKRFSTTTEL  YSDNYEEFDL1140
SRTYRPSEIA  DLSSLTAVDF  VALKELTRNS  NSLRQRRPRP  ESTTPRTSSF  KSRRLISNKN1200
EQNVEDQVNS  SSDKTHRIRG  FTRSPPVVST  TTEGTTRHSL  RNRKVVRRLR  PTSSSKLLSQ1260
NSDNKENVVP  FKKRLVRPNT  ETENLIENSS  LNSLFNRRLT  RPTEAPNEEQ  SDDVSAEEGE1320
NIKLSESNIR  ENSNVNNNNN  NILSPDDGQK  VRRKVLKRIK  PKVDDEKIVT  EPNIVIRTRK1380
IVRKLTPTES  TITSTTETTV  PGRKRKIIRR  LRPTTELKEN  STQKTLYIRG  RPFLAHFNNE1440
ESGVDASTIK  PDSSKYSTPN  RGTTEESEVT  EQFIANSENT  DSYKGTTEEA  EAKKQLISNS1500
ENSSQRTTDS  YKGTTEEADS  STERTIDRSK  YSTLNRGTID  STREESFDKE  IITTDRGPSR1560
FRSTTEGTID  RTKYSTLNKG  TTEEPEVREH  FISNSDTSTE  RTIDRSKYST  LNRGTTESTK1620
EEKIDEETIT  TNRGPSRFRN  SNTSTEGTID  RSKYSTLNRG  TTEEAEVKEQ  HISSSDASTE1680
GTIDRSKYST  LNRGTTEEAE  VKEQHISNSD  ASTEGTIDRS  KYSTLNRGTT  ESAKEEKIDE1740
EIISTNRGPS  RFRIYRPTVF  HDDDEEEEED  DSLKTRIVEP  LFTEEITESN  KLSNNATNKT1800
DDLNKEEADE  ENSTIETNEE  NSTEEHKDEE  DNEDIPVTTV  KPYINPILNR  QKNRPAFQRP1860
KLTTQKPLSS  STTSRNRYKT  FGRSTTAPSK  ETNEEITQEK  FVPKNLDRNR  KVSTSTTTTE1920
VAPEIEQTTD  SVQINDTESD  KTTLESIEVT  TLKETEEVVN  ATTESRTILV  ETTTLRTTET1980
TPSHLPRSTS  RTRPKFNVPK  RLTTPESRFS  PKLRTQSTTP  KAPTSLLKDK  FTRKYTTTER2040
NDFVEEEDIP  EEDEVENQSS  TQRTTRPKAR  PSNRPDFRKS  TEAPKPTEDL  KGIDTDAVKN2100
RNKNLFSKKR  KMNTPFAGHP  LNQSILTTTP  TISESVTKPS  TEPFETTEYL  TTLHHIFAET2160
ERVTENSLPT  TTSSKIEKLI  EVNRIVEVHE  MNNTEERDNK  VVDKVGVINR  VTVVKVVDGN2220
FNPEDNEITK  SPKLDDFEIA  TVREIPNRED  RRYEQVAESA  EIIDGRSNIN  IITPRPYYST2280
EASTISLEGL  FQTDTPQKLS  DKFNLNQLKQ  GTNDEELLET  GNSRYVNVRV  LKEDDYITMK2340
AEVVEVTPKI  SKDIKIVPIQ  VEMSRKLIAP  SDFVTKVEQG  VPKVTLQILK  PQN2393

Predicted 3D structure by AlphaFold2 with pLDDT = 40.63 ; Download help

pLDDT is for per-residue accuracy of the structure, which representes the quality of the residue. A higher value indicates better prediction accuracy. More detail please see AlphaFold .

Residues were colored according to plddt ( blue-> high quality; red-> low quality ).

Full Sequence:
CAPSIF:V and CAPSIF:G =99.9;
CAPSIF:V =59.9;
CAPSIF:G =40;
Non-Binding=0;     Download help

MSTDICRWLF  LLFFLTTWTK  YSNSKEIRVV  CYYTNWSVYR  PGTAKFSPQN  INPYLCTHLI60
YAFGGFTKEN  TLKPFDKYQD  IEKGGYAKFT  GLKTYNKNLK  TMLAIGGWNE  GSSRFSPMVA120
NPERRKELIK  NAIKFLRQNH  FDGLDLDWEY  PSFRDGGKSR  DKDNYAQLVQ  ELREEFDRES180
EKTGRPRLLL  TMAVPAGIEY  INKGYDVPKL  TKYLDWMNIL  SYDYHSAFEP  AVNHHAPLYP240
LEEPSEYNYD  TELNIDYTIQ  HYLKKGADPS  KLVLGIPTYG  RSYTLFNPDA  NEIGAPADGP300
GDMGEATREN  GYLAYYEVCE  YIKTQNWEVV  QPNPDAMGPY  AFKDNQWVGY  DDDKIARKKA360
EYVAEKGLGG  IMFWSIDNDD  FRGNCHGKPY  PIIEAAKEAL  ISAYGLTDEN  LVSPPTKPIK420
TKTRNRTQSS  SKSTDENSEK  KKSTSSIVSR  RRNRIKTKSE  ELSNSQSKSH  RKESRRTTEG480
PVYSSLELVT  PSYTTPAPPS  TPDLGGGFKC  EDEGFYPHPK  DCKKYYWCLS  GPGELGIVAH540
LFTCPAGLYF  NKAADSCDYT  RNVLCNKKLS  KATTTTTTTT  TTEASTLKTS  TARVPPKITA600
ATSRTTVFRT  STTTEAYDDE  YEYEDDVEEN  KNSEEDPKVI  KELLDLIKKA  GGIEELEKQL660
KIHEDGSASV  SNSDTTTPSS  ISKSLVERVL  GKGAKVGGKK  NSYSFLTRNS  RGPQNEGLNT720
HEDKETTQDK  GRPKYTTITR  QRSTNNKNED  EEEESSDEAS  KSTKKQPEYV  NIRRARVSTT780
TEEPEENSKS  QLNRNKILGE  EDETEDEQPS  RKKTSGPQYV  NIRRQRPSTT  EETSTSKYTV840
IRRGTTTEPA  EPEEDETTKS  NVVSTSTEKI  DLKSRYSILR  RGSTTEATTT  ESGSISSTSS900
PKRRGTTLPS  VPERKRTRGT  LAPGTTPSSE  DTTTTRYKSI  KRGSTSEAPT  TDKTLPEDST960
LKYSTFTRTP  ASTQAAPAAT  EPETAVTVNV  QLLTTPESLT  VKTTSLSSTK  QSEQSNIESI1020
GERVYQTQTP  LLLEPRPFSK  TSTRSPTPVV  TESSTRITKV  SDSNYNLRLK  PKLSQTQTEI1080
ISTTTLTTEK  PTPFRTRAPS  RFKLTTASYD  QQATKQANRA  RKRFSTTTEL  YSDNYEEFDL1140
SRTYRPSEIA  DLSSLTAVDF  VALKELTRNS  NSLRQRRPRP  ESTTPRTSSF  KSRRLISNKN1200
EQNVEDQVNS  SSDKTHRIRG  FTRSPPVVST  TTEGTTRHSL  RNRKVVRRLR  PTSSSKLLSQ1260
NSDNKENVVP  FKKRLVRPNT  ETENLIENSS  LNSLFNRRLT  RPTEAPNEEQ  SDDVSAEEGE1320
NIKLSESNIR  ENSNVNNNNN  NILSPDDGQK  VRRKVLKRIK  PKVDDEKIVT  EPNIVIRTRK1380
IVRKLTPTES  TITSTTETTV  PGRKRKIIRR  LRPTTELKEN  STQKTLYIRG  RPFLAHFNNE1440
ESGVDASTIK  PDSSKYSTPN  RGTTEESEVT  EQFIANSENT  DSYKGTTEEA  EAKKQLISNS1500
ENSSQRTTDS  YKGTTEEADS  STERTIDRSK  YSTLNRGTID  STREESFDKE  IITTDRGPSR1560
FRSTTEGTID  RTKYSTLNKG  TTEEPEVREH  FISNSDTSTE  RTIDRSKYST  LNRGTTESTK1620
EEKIDEETIT  TNRGPSRFRN  SNTSTEGTID  RSKYSTLNRG  TTEEAEVKEQ  HISSSDASTE1680
GTIDRSKYST  LNRGTTEEAE  VKEQHISNSD  ASTEGTIDRS  KYSTLNRGTT  ESAKEEKIDE1740
EIISTNRGPS  RFRIYRPTVF  HDDDEEEEED  DSLKTRIVEP  LFTEEITESN  KLSNNATNKT1800
DDLNKEEADE  ENSTIETNEE  NSTEEHKDEE  DNEDIPVTTV  KPYINPILNR  QKNRPAFQRP1860
KLTTQKPLSS  STTSRNRYKT  FGRSTTAPSK  ETNEEITQEK  FVPKNLDRNR  KVSTSTTTTE1920
VAPEIEQTTD  SVQINDTESD  KTTLESIEVT  TLKETEEVVN  ATTESRTILV  ETTTLRTTET1980
TPSHLPRSTS  RTRPKFNVPK  RLTTPESRFS  PKLRTQSTTP  KAPTSLLKDK  FTRKYTTTER2040
NDFVEEEDIP  EEDEVENQSS  TQRTTRPKAR  PSNRPDFRKS  TEAPKPTEDL  KGIDTDAVKN2100
RNKNLFSKKR  KMNTPFAGHP  LNQSILTTTP  TISESVTKPS  TEPFETTEYL  TTLHHIFAET2160
ERVTENSLPT  TTSSKIEKLI  EVNRIVEVHE  MNNTEERDNK  VVDKVGVINR  VTVVKVVDGN2220
FNPEDNEITK  SPKLDDFEIA  TVREIPNRED  RRYEQVAESA  EIIDGRSNIN  IITPRPYYST2280
EASTISLEGL  FQTDTPQKLS  DKFNLNQLKQ  GTNDEELLET  GNSRYVNVRV  LKEDDYITMK2340
AEVVEVTPKI  SKDIKIVPIQ  VEMSRKLIAP  SDFVTKVEQG  VPKVTLQILK  PQN2393

Carbohydrate binding residues Predicted by CAPSIF from 3D structure; Download help

Residues were colored according to prediction score:

Nonbinder, CAPSIF:G Predicted Binder, CAPSIF:V Predicted Binder, CAPSIF:V and CAPSIF:G Predicted Binder

CArbohydrate–Protein interaction Site IdentiFier (CAPSIF) that predicts non-covalent carbohydrate-binding sites on proteins: (1) a 3D-UNet voxel-based neural network model (CAPSIF:V) and (2) an equivariant graph neural network model (CAPSIF:G).

Details:
⋆B-Factor = 0.0 : Nonbinder.
⋆B-Factor = 40.0 : CAPSIF:G Predicted Binder.
⋆B-Factor = 59.9 : CAPSIF:V Predicted Binder.
⋆B-Factor = 99.9 : CAPSIF:V and CAPSIF:G Predicted Binder.

For more detail please see CAPSIF.

Full Sequence:
AA;
CE;
PL;
GH;
GT;
CBM;     Download structure help

dbCAN3 predicted domain(s) : GH18(27-384)+CBM14(512-565)

MSTDICRWLF  LLFFLTTWTK  YSNSKEIRVV  CYYTNWSVYR  PGTAKFSPQN  INPYLCTHLI60
YAFGGFTKEN  TLKPFDKYQD  IEKGGYAKFT  GLKTYNKNLK  TMLAIGGWNE  GSSRFSPMVA120
NPERRKELIK  NAIKFLRQNH  FDGLDLDWEY  PSFRDGGKSR  DKDNYAQLVQ  ELREEFDRES180
EKTGRPRLLL  TMAVPAGIEY  INKGYDVPKL  TKYLDWMNIL  SYDYHSAFEP  AVNHHAPLYP240
LEEPSEYNYD  TELNIDYTIQ  HYLKKGADPS  KLVLGIPTYG  RSYTLFNPDA  NEIGAPADGP300
GDMGEATREN  GYLAYYEVCE  YIKTQNWEVV  QPNPDAMGPY  AFKDNQWVGY  DDDKIARKKA360
EYVAEKGLGG  IMFWSIDNDD  FRGNCHGKPY  PIIEAAKEAL  ISAYGLTDEN  LVSPPTKPIK420
TKTRNRTQSS  SKSTDENSEK  KKSTSSIVSR  RRNRIKTKSE  ELSNSQSKSH  RKESRRTTEG480
PVYSSLELVT  PSYTTPAPPS  TPDLGGGFKC  EDEGFYPHPK  DCKKYYWCLS  GPGELGIVAH540
LFTCPAGLYF  NKAADSCDYT  RNVLCNKKLS  KATTTTTTTT  TTEASTLKTS  TARVPPKITA600
ATSRTTVFRT  STTTEAYDDE  YEYEDDVEEN  KNSEEDPKVI  KELLDLIKKA  GGIEELEKQL660
KIHEDGSASV  SNSDTTTPSS  ISKSLVERVL  GKGAKVGGKK  NSYSFLTRNS  RGPQNEGLNT720
HEDKETTQDK  GRPKYTTITR  QRSTNNKNED  EEEESSDEAS  KSTKKQPEYV  NIRRARVSTT780
TEEPEENSKS  QLNRNKILGE  EDETEDEQPS  RKKTSGPQYV  NIRRQRPSTT  EETSTSKYTV840
IRRGTTTEPA  EPEEDETTKS  NVVSTSTEKI  DLKSRYSILR  RGSTTEATTT  ESGSISSTSS900
PKRRGTTLPS  VPERKRTRGT  LAPGTTPSSE  DTTTTRYKSI  KRGSTSEAPT  TDKTLPEDST960
LKYSTFTRTP  ASTQAAPAAT  EPETAVTVNV  QLLTTPESLT  VKTTSLSSTK  QSEQSNIESI1020
GERVYQTQTP  LLLEPRPFSK  TSTRSPTPVV  TESSTRITKV  SDSNYNLRLK  PKLSQTQTEI1080
ISTTTLTTEK  PTPFRTRAPS  RFKLTTASYD  QQATKQANRA  RKRFSTTTEL  YSDNYEEFDL1140
SRTYRPSEIA  DLSSLTAVDF  VALKELTRNS  NSLRQRRPRP  ESTTPRTSSF  KSRRLISNKN1200
EQNVEDQVNS  SSDKTHRIRG  FTRSPPVVST  TTEGTTRHSL  RNRKVVRRLR  PTSSSKLLSQ1260
NSDNKENVVP  FKKRLVRPNT  ETENLIENSS  LNSLFNRRLT  RPTEAPNEEQ  SDDVSAEEGE1320
NIKLSESNIR  ENSNVNNNNN  NILSPDDGQK  VRRKVLKRIK  PKVDDEKIVT  EPNIVIRTRK1380
IVRKLTPTES  TITSTTETTV  PGRKRKIIRR  LRPTTELKEN  STQKTLYIRG  RPFLAHFNNE1440
ESGVDASTIK  PDSSKYSTPN  RGTTEESEVT  EQFIANSENT  DSYKGTTEEA  EAKKQLISNS1500
ENSSQRTTDS  YKGTTEEADS  STERTIDRSK  YSTLNRGTID  STREESFDKE  IITTDRGPSR1560
FRSTTEGTID  RTKYSTLNKG  TTEEPEVREH  FISNSDTSTE  RTIDRSKYST  LNRGTTESTK1620
EEKIDEETIT  TNRGPSRFRN  SNTSTEGTID  RSKYSTLNRG  TTEEAEVKEQ  HISSSDASTE1680
GTIDRSKYST  LNRGTTEEAE  VKEQHISNSD  ASTEGTIDRS  KYSTLNRGTT  ESAKEEKIDE1740
EIISTNRGPS  RFRIYRPTVF  HDDDEEEEED  DSLKTRIVEP  LFTEEITESN  KLSNNATNKT1800
DDLNKEEADE  ENSTIETNEE  NSTEEHKDEE  DNEDIPVTTV  KPYINPILNR  QKNRPAFQRP1860
KLTTQKPLSS  STTSRNRYKT  FGRSTTAPSK  ETNEEITQEK  FVPKNLDRNR  KVSTSTTTTE1920
VAPEIEQTTD  SVQINDTESD  KTTLESIEVT  TLKETEEVVN  ATTESRTILV  ETTTLRTTET1980
TPSHLPRSTS  RTRPKFNVPK  RLTTPESRFS  PKLRTQSTTP  KAPTSLLKDK  FTRKYTTTER2040
NDFVEEEDIP  EEDEVENQSS  TQRTTRPKAR  PSNRPDFRKS  TEAPKPTEDL  KGIDTDAVKN2100
RNKNLFSKKR  KMNTPFAGHP  LNQSILTTTP  TISESVTKPS  TEPFETTEYL  TTLHHIFAET2160
ERVTENSLPT  TTSSKIEKLI  EVNRIVEVHE  MNNTEERDNK  VVDKVGVINR  VTVVKVVDGN2220
FNPEDNEITK  SPKLDDFEIA  TVREIPNRED  RRYEQVAESA  EIIDGRSNIN  IITPRPYYST2280
EASTISLEGL  FQTDTPQKLS  DKFNLNQLKQ  GTNDEELLET  GNSRYVNVRV  LKEDDYITMK2340
AEVVEVTPKI  SKDIKIVPIQ  VEMSRKLIAP  SDFVTKVEQG  VPKVTLQILK  PQN2393

Predicted CAZyme domains from dbCAN; Download help

Domains were colored according to CAZyme classification: (AA), (CE), (PL), (GH), (GT), (CBM), & (Null)

dbCAN3 server is a web server for automated Carbohydrate-active enzyme ANnotation.

Details:
dbCAN3 server integrates three state-of-the-art tools/databases for automated CAZyme annotation:
⋆HMMER search for CAZyme family annotation vs. dbCAN CAZyme domain HMM database
⋆DIAMOND search for BLAST hits in the CAZy database
⋆HMMER search for CAZyme subfamily annotation vs. dbCAN-sub HMM database of CAZyme subfamilies (derived from eCAMI classification of CAZyDB families)

For more details, please see dbCAN3.

Similarites between the same cluster seqeunces from DIAMOND; Download help