实测:2023.4.21 ? ?
在线 Demo:
开源代码:
https://github.com/Vision-CAIR/MiniGPT-4
论文:
https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf
参考链接:
比OpenAI更快一步,开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力!
https://www.chinaz.com/2023/0419/1516992.shtml
拥有和 GPT-4相似的图片解析功能
该研究团队推出的 MiniGPT-4拥有和 GPT-4相似的功能。譬如:
给它一张图,便能生成详细的图像描述:
也能讲出图片中搞笑、有趣的部分:「星期一通常被认为是一周中最令人恐惧的一天」。
还能在进一步交互中发现不寻常的内容,如:虽然仙人掌有可能在寒冷的气候条件下生长,但很少看到仙人掌生长站在冰冻的湖泊中间。此外,水面上形成的大冰晶也不是常见的现象。
于是,MiniGPT-4给出了自己的见解:这张图片很可能是数字创作或操控的。
当然,和 GPT-4演示的一样,MiniGPT-4也能根据手绘草图生成网站:
识别图像中的问题并提供解决方案:
以及创造诗歌或说唱歌曲的灵感:
此外,也能根据图片续写故事,给产品做广告,对图像展现的画面进行评论、检索与图片有关的事实,以及当给定一张准备好的菜肴照片时,该模型可以输出(可能)与之匹配的食谱或者生成一个适合视障人士的图像描述。
相关导航
暂无评论...