大家好,我是 Jack。一个月前,我发布过一篇文章,讲解了GPT4 的发布会。ChatGPT的对话能力,想必大家也早已体验过了,无论是文本生成能力,还是写代码的能力,甚至是上下文的关联对话能力,无不一次又一次地震撼着我们。你还记不记得发布会上,GPT4 的多模态能力,就是输入不仅是可以是文字,还可以是文本和图片。比如输入:(看图)手套掉下去会怎样?输出:它会掉到木板上,并且球会被弹飞。甚至画个网站的草图,GPT4 就可以立马生成网站的 HTML 代码。然而,已经过去一个多月了!OpenAI至今也没有提供发布会所展示的多模态处理能力!原本以为还要再等几个月的官方更新,才能体验上这个功能,没想到,我看到了这么一个项目。该项目名为 MiniGPT-4,是阿卜杜拉国王科技大学的几位博士做的。最主要的是,完全开源!效果如视频所示:https://cuijiahua.com/wp-content/uploads/2023/04/minigpt4.mp4可以看到,MiniGPT-4 能够支持文本和图片的输入,实现了多模态的输入功能。GitHub:https://github.com/Vision-CAIR/MiniGPT-4在线体验:https://minigpt-4.github.io作者还提供了网页 Demo,可以直接体验:MiniGPT-4 是在一些开源大模型基础上训练得到的,fine t
...
继续阅读
(67)