多模态

其它模型

MiniGPT-4｜图像对话模型

MiniGPT-4使用一个投影层将冻结视觉编码器与冻结的LLM对齐，通过传统预训练和自我生成方式构建高质量图像文本对，再在小型数据集上进行微调训练，该模型在视觉语言任务中表现出了很好的效果。

2023-04-20
00158.2K