首页 热门资讯文章正文

Vidu Q1:打开 AI 生图的下一扇门

热门资讯 2025年09月09日 16:32 1 admin

早在 2 年多之前,第一次感受到 AI 生图的震撼时,我用 Midjourney 做了一个篇幅很短的漫画。在总结做漫画的体会时,我是这么写的:

连贯性很难保证。尤其人脸和动作,想要在连贯画面里保持一致,非常难... ... 在可控性方面,只能用画图再垫图,再画图垫图的笨办法确保想要的内容。

这个一直是 AI 生图的痛点。之前用垫图也就是参考图片的方式,生成的人物差异非常大。比如主角的样子:

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

甚至这已经是我垫图十几次才得到的结果了。只能勉强让人感知到是同一个人。

而 2 年多过去了,这个世界进化到什么阶段了呢?

我近期用的比较多的是 Vidu。第一次注意到是在 4 月份,有新闻称其在 VBench 模型评测上拿了第一。

Vidu Q1:打开 AI 生图的下一扇门

真正试用了一下,的确很是喜欢。作为国产大模型,可以输入中文,比起 Midjourney 来也方便不少。

前几天拿到了 Vidu 的朋友送的 Q1 参考生图的内测资格,这次玩得有点停不下来。跟各位分享一下。这个版本应该在你看到文章的 9.9 就正式发布了。

先感受一下,我用刚刚的这个角色侧脸,让 Vidu Q1 生成一个穿着白色条纹 T 恤向右看的图:

Vidu Q1:打开 AI 生图的下一扇门

忽然穿越到 2 年前的垫图到疯的那个情绪里,现在感动得要哭。

整个看起来就真的很准确。

接下来,就是参考生图更厉害的地方,它可以参考不止一张图。

比如,可以直接让男主站在他的船上。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

船的还原度非常好。对比我之前画的内容就发现,我之前是没办法做这样拼接的生成的,除非手动操作。

也可以绘制男主跟鲨鱼搏斗的场景:

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

我还发现,Vidu 为了让用户更好地完成像这样延续主体的创作,贴心提供了主体库的功能,像画漫画的话,男主就可以存到库里,随时调用。

Vidu Q1:打开 AI 生图的下一扇门

尝试了一些有意思的多图参考。比如让这两个最知名的老鼠抱在一块。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

参考的图片数量可以达到 7 张。比如可以让乔布斯跟他的所有最重要的产品合影。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

不过比例略有点不太对。看来模型还需要更聪明一些。

既然参考生图的效果这么好,那就可以用现成的场景,让我们直接穿越进去。

我今年夏天跟妻子去北极走了一个祝福仪式。本来很像去光之教堂的,可惜多年前就关闭了。

用参考生图就可以解馋体验一下。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

还可以让我出现在喜欢的电影场景里。比如《疯狂的麦克斯 4》里:

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

或者去《权力的游戏》里让小龙女和马王跟我合张影。看得我还是有点发怵。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

再比如,也可以去《血源诅咒》里受苦。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

或者去跟马斯克录播客,看他喷云吐雾。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

那么,Vidu Q1 这样的参考生图功能除了好玩,到底有没有实际用途?首先玩也是实际用途。其次,当然还有别的用途。

由于参考的效果很好,电商场景就可以用来做带货展示图。

比如,让米老鼠坐在这张椅子上。温馨提示,黑白的米老鼠才是没有版权的哦。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

自然也可以让人物坐在这张椅子上:

Vidu Q1:打开 AI 生图的下一扇门

坐椅子看起来并不难,喝饮料也是可以的。注意看蜜雪冰城的 logo 几乎没怎么变样,这点对于品牌商家来说太重要了。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

像这是我之前合伙创业做的茶品牌三五杯,可以让图 1 里的女生捧着它展示。展示角度发生了变化,盒子居然没有什么变形,完美复现。除了文字还是需要简单 p 一下才能用。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

也可以让同一个女生展示我的新书《内容即品牌》。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

换一个随机生成的棒球女生,效果也很不错。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

某些产品未必需要人,可能需要的是场景化的展示。

比如一个竹凳,就可以放到有竹子的潺潺小溪中展示。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

当然,也可以非常混搭,既有人物,又有竹凳。背景再放飞一些,放到外太空,也是可以的。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

电商场景里还有一个至关重要的痛点,就是试衣。说 AI 试衣已经说了很多年了。我也是第一次感知到,AI 试衣真的能帮到我。

比如这两个就是非常糟心辣眼睛的例子。

一个是中国风西装。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

一个是英伦绅士风。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

尝试了一下,衣服的适配度跟颜值还是息息相关的。颜值高的,穿什么都好看一些。颜值像我这样的,需要谨慎筛选、仔细斟酌。

像同一件衣服,用刚刚的女生形象,生成的效果就很棒。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

既然可以试一件衣服,那是不是也能试好几件衣服?

当然也是可以的。选了一件非常暴力美学的衬衫、半拿铁的帽子以及相当宽松的裤子。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

我还挺喜欢这套的,于是也让其他几位朋友试了试。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

以上就是我试用的阶段性体验。

电商和广告是我相对熟悉的,第一时间能想到应用场景的领域。

而生图乃至生视频的一致性、对参考图的精准控制问题解决后,将会影响几乎所有跟图像有关的行业。

比如,漫画转制动画方面,原本的分镜内容就像是关键帧,可以快速生成很多角度和动作的补帧,能自然地把剧情连贯起来。就不需要担心动画画师偷懒,把人物给画毁掉(比如某小学生侦探动画)。

再比如,影视行业里的概念设计,基于已有的人物和场景,就能不断生成大量的风格统一的概念图,作为参考。并且由 AI 产生的各种可能性,也是一种低成本的头脑风暴,大大提升效率。

再比如,品牌的 VI 系统,也可以由基础的元素,快速实现平面设计,包括广告图、海报、帖子配图、包装图等等。

能联想到的还有很多。各位工作中有接触设计工作的朋友,尤其是上次接触 AI 生图还是一两年前的,真心推荐体验一下。

在众多有参考生图的 AI 工具里,我个人还是倾向各位尝试下 Vidu Q1。

有这么几点原因:

1 参考图片数量足够多,达到 7 张。很多元素都可以参加进去。而多数竞品还是只支持 1-3 张参考图片。

2 主体一致性够强,不会出现太多细节走样。就像前面说的,在广告营销领域,是能够成为生产力的。拿来即用,很重要。

3 可控性好。输入的提示词对图片生成的效果会产生非常具体的影响。而且就像前面说的,中文输入的门槛更低。图片是提示词的必选元素,因此图片中内容的关系是指定的、可控的。

最后,用这样一张图作为结尾吧。我要去冥想一会儿了。

Vidu Q1:打开 AI 生图的下一扇门Vidu Q1:打开 AI 生图的下一扇门

点击原文也可以直接跳转到 Vidu 官网申请使用。

*本文中没提到名字的人物形象,均为 AI 生成

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动