近期,AI设计工具Lovart引发了广泛关注。它究竟是一个简单的生图工具,还是真正具备设计Agent能力的创新产品?本文通过一系列深度测评,从定制表情包、设计LOGO及VI效果图,到制作海报、创意漫画,甚至生成视频,全方位检验Lovart的理解、规划与执行能力。测评结果显示,Lovart在设计领域的表现令人惊艳,它不仅能够高效完成任务,还展现出强大的记忆与优化能力。本文将带你深入了解Lovart的实战表现,探讨AI设计Agent的未来潜力与挑战。
前两天睡醒了,洗漱完了我开始慢悠悠的刷公众号,进行一天的信息摄取。
发现大家都提及了Lovart产品,我看了看测评觉得蛮有意思的,然后我就去厚着脸皮要了个测试名额,当时体验了一会发现做表情包确实比4o方便不少,省的自己在那想创意了。
但我当时没觉得Lovart有多强,我觉得我还是先把我拖欠的一堆活干完更重要。
然后突然看到群里发,朱啸虎老师对Lovart的评价。
我当时琢磨了一会,Agent达到商业化质量,这句话含量有点深啊。
那我还是去测测吧,我想看看它到底是和之前一样的生图工具还是一个专业设计Agent。
为此我还拉着Gemini搓了一套设计Agent测评标准,然后又拉着O3确认了一下逻辑有无漏洞。
然后我梳理了一下整体的测评思路:通过提示词递减、生成难度递增的策略,来看Lovart的理解能力、规划能力、执行能力、上下文能力是否能够达到一个不错的Agent水平。
为了保证测评的客观性,我会和Gemini2.5一起对每一个案例打分。
接下来让我们一起开始来测评Lovart吧~
1:做一组定制的微信表情包
2.1.1 测评点
第一次测试我们就先热热身,就让它做一次单步任务,我会给它图像和需求让它生成表情包,看看它在批量化场景下的效果怎么样,有没有不错的一致性和创造性。
2.1.2 测试过程及结果展示
我把Lovart这次执行任务的流程拆了出来画成了图,可以见到它有一个清晰的规划到落地的路径,AI会根据自己的判断产出方案、选择模型,然后才是生成图。
2.1.3 测评打分
在Lovart做好了之后,我直接把狗子表情上传了微信表情包,第一波测试我给Lovart打满分!
AI在这一波也给到了93分!它对Lovart的表现评价还不错。
2:做LOGO及VI效果图
2.2.1 测评点
这次测试我们升级了一下难度,把提示词从单步变成了多步。
这次给到Lovart的是多步提示词,我希望看到它在Logo及VI(配色方案)上的思考,同时看看它在上下文一致性和连贯性上的体验怎么样。
我要求它先生成3个logo,然后在我确认后帮我生成VI及效果图。测试过程及结果展示
它在生成了这3个icon后,来让我进行选择:
我选择了第三个,这是它产出的VI及效果图。
Lovart执行本次任务的流程图:
搜寻灵感这个模块蛮有意思的,当用户没有给参考信息时,它会先去自己搜集一下参考,然后再生成。
跟设计师做需求一样了,哈哈哈~
2.2.3 测评打分
这一轮我继续给出满分,我觉得Lovart完整的按照提示词进行了执行,VI和效果图都没有漏掉,我觉得非常不错。
AI在这一波也给到了94分,看起来我们两个又一次达成了一致。
3:做一个线下活动的海报
2.3.1 测评点
这次我们把难度再往上抬一点,我会先给Lovat一个提示词,让它帮我生成海报,看看它对视觉的理解力创造力怎么样,能不能画出一张好看的海报。
然后基于这张海报,我会让它去做多轮调整,看一看在多轮调整中它是否能够每次都高效的完成任务,会不会一会就跑偏。2.3.2 测试过程及结果展示
让它调整一下:
再调整一下:
接下来我又测试了一下中文能力,中文海报目前的稳定性还是模型不好处理的,Lovart因为还是调用已有模型进行生成,所以还是有一些细节不太好。
Lovart执行本次任务的流程图,用户提需求
2.3.3 测评打分
这次海报我们就直接让AI来打分,它给到了86分;它给我的反馈是排版精度可以再往上提升一下,第一稿的视觉冲击力较弱。
整体表现还是不错的,这是一个可以进行交付的效果图。
4:做一组创意漫画
2.4.1 测评点
上边的测评里我都给了Lovart详细的提示词,那这次我们继续往上抬难度。
我们看一看Lovart在低提示词的描述下,能不能做出来不错的创意漫画。2.4.2 提示词及结果展示
我以为Lovart会问我问题,但它下根据自己的理解出了一版故事,我觉得还行,然后我给它提出了修改需求。
它直接在加文字的基础上把6个漫画合成了一张图,这个效果是我没想到的。
我仔细去看了一下它的生成过程,它做了一个布局设计,还是怪聪明的。
于是我决定看看他能不能在一张大图的基础上对第四个、第五个面板进行局部调优,这个事情的难度在于Lovart到底是在大图直接做,还是会在第一次的基础上优化完,然后再合成一张大图。
如果是前者,我觉得可能搞不定;后者的话还有可能。
刚开始Lovart给到我的是这两个图,我看了之后有点失望,我感觉它没有把上下文完整
的接进去。正当我准备问它的时候,我发现它又给了我一张大图。我要的修改点它都加了进去了,表现的还是非常错的。
然后我去深度对比了两张大图,我发现它是完整的又从做了一张大的合成图,这说明它的记忆能力、理解能力、规划能力都是极强的。
模型在接收到调整图4、图5细节的时候会拆成这样的规划:
1. 先从历史内容中找到第一版的图片4、图片5
2. 对其进行用户需求的微调
3. 重复用户添加文字的需求
4. 每个小图增加文字描述
5. 生成一张大图
2.4.3 测评打分
这次漫画我们继续让AI打分,它给出了不错的评价,我也是非常认可。
虽然细节上还有一些瑕疵,但Lovart的记忆能力、规划能力、执行能力都让我感觉很强,接下来该上点难度了。2.5 案例5:生成小狗冒险视频2.5.1 测评点
最后一个测评,我们上个贼难的吧。
看看能不能一句话生成一个好玩的视频,这将是对Agent的终极考验。2.5.2 提示词及结果展示
看完了我都惊呆了!我以为它只能搓个半成品,没想到效果还挺好!
让我们一起看看Lovart执行任务的逻辑:
它这是一次任务完整执行下来的,中间我没有任何的干预。
2.5.3 测评打分
满分!满分!满分!
我的好搭子Gemini保持着它的理性挑了点刺,不过它的问题还是视频的画面细节,不过它不了解目前世界AI视频做到什么地步了,它应该还是用数据库里各种人类的视频去对比的。
从这几个案例测评结果来看,我做为一个人类好像只会从那喊满分!
还是Gemini更加客观公正一些。
我在测评完案例后,我其实知道Lovart是一个不错的Agent设计产品,但我想了半天我该如何给它做一个结论。
我觉得它有很多还可以提升的点,比如生成速度实在是有点慢,做表情包都花了我5分钟时间;漫画的人物一致性可读性都有不少提升空间;视频生成的细节也有待提升,最起码清晰度高一点。
但作为一个AI产品经理,我觉得这些细节也还好,他们都是有看得到的解决方案的。
我想Lovart给我们带来的更多是:AI在设计赛道上有能力和人一样进行作业。
我在敲下这行字的时候我想了半天,真的是这样的吗?
然后我又回去看了看我测试的这些案例,如果我之前想达到这样的效果我该怎么样呢?
去找设计师,然后提出我的需求,然后他给结果后我继续改。
流程是没什么区别的,Lovart的结果我敢用吗?
当然是敢用的,狗子表情包我都传到微信里边了。
那它其实就是设计师了。
我想这是个不可逆的趋势,认可AI或许更容易让我们进入新世界。
DeepseekV2在24年5月份发布,那时候企业低Token成本拥抱AI的种子早已埋下了。
Deepseek用了8个月迭代出来的R1,震惊了世界。
我想或许Lovart、Mauns它们都是那粒种子,它们都在告诉我们:未来已至。
本文由人人都是产品经理作者【云舒】,微信公众号:【云舒的AI实践笔记】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。