MiniGPT-4 | AI看图聊天

实测：2023.4.21 ? ?

MiniGPT-4 | AI看图聊天在线 Demo：

开源代码：

论文：

参考链接：

比OpenAI更快一步，开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力！

拥有和 GPT-4相似的图片解析功能

该研究团队推出的 MiniGPT-4拥有和 GPT-4相似的功能。譬如:

给它一张图，便能生成详细的图像描述:

MiniGPT-4 | AI看图聊天

也能讲出图片中搞笑、有趣的部分:「星期一通常被认为是一周中最令人恐惧的一天」。

MiniGPT-4 | AI看图聊天

还能在进一步交互中发现不寻常的内容，如:虽然仙人掌有可能在寒冷的气候条件下生长，但很少看到仙人掌生长站在冰冻的湖泊中间。此外，水面上形成的大冰晶也不是常见的现象。

于是，MiniGPT-4给出了自己的见解:这张图片很可能是数字创作或操控的。

MiniGPT-4 | AI看图聊天

当然，和 GPT-4演示的一样，MiniGPT-4也能根据手绘草图生成网站:

MiniGPT-4 | AI看图聊天

识别图像中的问题并提供解决方案:

MiniGPT-4 | AI看图聊天

以及创造诗歌或说唱歌曲的灵感:

MiniGPT-4 | AI看图聊天

此外，也能根据图片续写故事，给产品做广告，对图像展现的画面进行评论、检索与图片有关的事实，以及当给定一张准备好的菜肴照片时，该模型可以输出（可能）与之匹配的食谱或者生成一个适合视障人士的图像描述。

MiniGPT-4 | AI看图聊天

相关导航

AI chatgpt中转站支持GPT-3.5、GPT-4、Claude3等模型，支持多模态，价格实惠

使用Cursor可以毫不费力地重构、理解和编写代码。

跃问介绍：跃问是由阶跃星辰...

“智谱清言” 已具备 “通用问答、多轮对话、创意写作、代码生成以及虚拟对话、多模态” 等丰富能力

天工 AI 由昆仑万维推出，有天工 3.0 大模型。具备文档音视分析、写作等功能，可进行彩页创作。还有宝典广场，能认领或创建宝典。提供AI 搜索，简洁高级，让知识流通，可登录或下载 App 体验。

HuggingFace推出的在线聊天网页，一个开源聊天界面，支持工具、网络搜索、多模态和许多 API 提供商。

暂无评论...