大模型之家讯 近日,华中科技大学与金山软件携手推出并开源了一款高性能多模态大模型,命名为“Monkey”。该模型通过提高输入分辨率和引入多级描述生成方法,成功解决了现有模型在复杂场景和视觉细节处理方面的挑战。Monkey可在现有视觉编辑器基础上构建,无需从零开始预训练,将大模型的输入分辨率能力提高至896 x 1344像素。此外,Monkey采用多级描述生成方法,为模型提供丰富的上下文信息,有助于引导模型学习场景和对象之间的关联,提高模型的综合认知和处理能力。这一合作标志着在高校和企业之间共同推动多模态大模型研究的合作,为未来创新性应用奠定了基础。