Posted in Zurich Weiran Huang – 知乎 June 18, 2026 自多模态大语言模型(MLLM)问世以来,它们在图像描述、视觉问答等任务中展现了惊人的能力。为了进一步提升模型性能,尤其是在复杂的多模态推理任务上,学术界和工业界的主流范式是监督微调(SFT)或强化学习… https://www.zhihu.com/people/huangweiran