Can We Edit Multimodal Large Language Models?

本文是LLM系列文章，针对《Can We Edit Multimodal Large Language Models?》的翻译。

我们可以编辑多模态大型语言模型吗?

摘要
1 引言
2 相关工作
3 编辑多模态LLM
4 实验
5 结论

摘要

本文主要研究多模态大语言模型(Multimodal Large Language Models, mllm)的编辑。与编辑单模态LLM相比，编辑多模态模型更具挑战性，在编辑过程中需要更高水平的审查和仔细考虑。为了促进这一领域的研究，我们构建了一个新的基准，称为MMEdit，用于编辑多模态llm并建立一套创新的评估指标。我们进行了涉及各种模型编辑基线的综合实验，并分析了编辑不同组件对多模态llm的影响。经验上，我们注意到以前的基线在一定程度上可以实现编辑多模态llm，但效果仍然勉强令人满意，表明这项任务的潜在难度。我们希望我们的工作可以为NLP社区提供见解。

1 引言

2 相关工作

3 编辑多模态LLM

4 实验

5 结论

本文介绍了基于MMEdit的多模态模型编辑技术。在经验上，我们分析了各种模型编辑基线的有效性，并探讨了它们对不同组件(例如，视觉和文本)的影响。