MiniGPT-4是一个拥有类似 GPT-4 图像对话能力的AI开源项目,由阿卜杜拉国王科技大学的几位博士牵头开发。基于Python,遵守BSD-3-Clause开源协议。

项目团队成员将一个冻结的视觉编码器与一个冻结的 Vicuna 进行对齐,造出了 MiniGPT-4。 MiniGPT-4 具有许多类似于 GPT-4 的能力,如详细的图像描述生成、从手写草稿创建网站等。 MiniGPT-4 还能根据图像创作故事和诗歌,为图像中显示的问题提供解决方案,教用户如何根据食物照片做饭等等。

源代码:https://github.com/Vision-CAIR/MiniGPT-4