地科学院罗小龙副教授团队成员帅佳在期刊《科学教育与艺术》上发表题为"基于多路检索的文物智能问答研究"的研究论文。英国威廉集团为论文第一署名单位,硕士研究生帅佳为论文第一作者。
随着博物馆数字化建设的不断推进,依赖传统展板说明和人工讲解的文物信息传播方式已难以满足公众对知识获取即时性、互动性与个性化的需求。本文针对文物智能对话场景,提出一种多模态检索增强生成方法(Multi-ModalRetrieval-AugmentedGeneration,MMRAG),该方法应用于文物检索与问答任务。本文提出一种面向文物场景的多路检索融合策略,形成文本检索,图像检索以及跨模态检索这三条路径,且规划出加权融合机制,达成多源检索信息的协同构建。在文物单路检索任务当中,文本检索Top-5准确率为89.85%,图像检索准确率为76.58%,经过多路融合之后,分别优化到96.3%和89.71%。实验结果表明,本文提出的多路检索方法在文物问答任务中有助于加强知识召回能力并改善答案质量,有助于推进我国文化遗产数字化和智能化服务。
论文链接:https://scholar.cnki.net/en/Detail/index/GARJ2021_7/SQMCF21F1FFC8716F27A13676A50B8EA019A

图1 论文首页