Can We Edit Multimodal Large Language Models?
本文是LLM系列文章,针对《Can We Edit Multimodal Large Language Models?》的翻译。
摘要
本文主要研究多模态大语言模型(Multimodal Large Language Models, mllm)的编辑。与编辑单模态LLM相比,编辑多模态模型更具挑战性,在编辑过程中需要更高水平的审查和仔细考虑。为了促进这一领域的研究,我们构建了一个新的基准,称为MMEdit,用于编辑多模态llm并建立一套创新的评估指标。我们进行了涉及各种模型编辑基线的综合实验,并分析了编辑不同组件对多模态llm的影响。经验上,我们注意到以前的基线在一定程度上可以实现编辑多模态llm,但效果仍然勉强令人满意,表明这项任务的潜在难度。我们希望我们的工作可以为NLP社区提供见解。
1 引言
2 相关工作
3 编辑多模态LLM
4 实验
5 结论
本文介绍了基于MMEdit的多模态模型编辑技术。在经验上,我们分析了各种模型编辑基线的有效性,并探讨了它们对不同组件(例如,视觉和文本)的影响。