基于多模态融合的非遗图片分类研究 - 码农知识堂

基于多模态融合的非遗图片分类研究

摘要

【目的】 针对当前非遗图片分类不足的问题,提出结合非遗图片和文本描述,以多模态融合的方式进行非遗图片分类研究。【方法】 构建基于多模态融合的非遗图片分类模型（Image Classification Model with Multimodal Fusion,ICMMF）,其主要由用于非遗图片视觉语义特征抽取的微调深度预训练模型、对文本特征进行抽取的BERT模型、融合视觉语义特征和文本描述特征的多模态融合层和预测类别输出层组成。【结果】
相关阅读:
位逻辑运算符
 zabbix
用于LLM的Chain-of-Symbol Prompting(符号链提示、CoS)
第九章持续集成---结束/完结
 Java中使用MyBatis框架连接和操作MySQL数据库
 机器学习之支持向量机（SVM）的求解方法
 面试不到10分钟就被赶出来了，问的实在是太变态了...
声明式查询服务，只需定义，无需实现
 记一次victoriaMetrics代理性能优化问题
 Altium Designer实用系列(二)----PCB绘图小技巧
原文地址：https://blog.csdn.net/weixin_70923796/article/details/126026649