【真人百家乐
】(食谱)组件感知与提示化CLIP嵌入驱动的跨模态食谱检索
报告时间:2024年12月30日(周一)10:00报告地点:百家乐
与真人百家乐
D303报告专家:刘进,武汉大学教授报告内容:跨模态食谱检索是一项新兴的视觉-文本检索任务,旨在将食物图片与相应的食谱进行匹配。尽管大规模视觉-语言预训练(VLP)模型在广泛的下游任务上取得了令人印象深刻的性能,但由于以下两个问题,它们在这项跨模态检索任务上的表现仍然不尽如人意:(1)食物图片和食谱的特征需要对齐,仅仅微调预训练VLP模型的...