首页热门资讯文章正文

Vidu Q1：打开 AI 生图的下一扇门

热门资讯 2025年09月09日 16:32 1 admin

早在 2 年多之前，第一次感受到 AI 生图的震撼时，我用 Midjourney 做了一个篇幅很短的漫画。在总结做漫画的体会时，我是这么写的：

连贯性很难保证。尤其人脸和动作，想要在连贯画面里保持一致，非常难... ... 在可控性方面，只能用画图再垫图，再画图垫图的笨办法确保想要的内容。

这个一直是 AI 生图的痛点。之前用垫图也就是参考图片的方式，生成的人物差异非常大。比如主角的样子：

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

甚至这已经是我垫图十几次才得到的结果了。只能勉强让人感知到是同一个人。

而 2 年多过去了，这个世界进化到什么阶段了呢？

我近期用的比较多的是 Vidu。第一次注意到是在 4 月份，有新闻称其在 VBench 模型评测上拿了第一。

Vidu Q1：打开 AI 生图的下一扇门

真正试用了一下，的确很是喜欢。作为国产大模型，可以输入中文，比起 Midjourney 来也方便不少。

前几天拿到了 Vidu 的朋友送的 Q1 参考生图的内测资格，这次玩得有点停不下来。跟各位分享一下。这个版本应该在你看到文章的 9.9 就正式发布了。

先感受一下，我用刚刚的这个角色侧脸，让 Vidu Q1 生成一个穿着白色条纹 T 恤向右看的图：

Vidu Q1：打开 AI 生图的下一扇门

忽然穿越到 2 年前的垫图到疯的那个情绪里，现在感动得要哭。

整个看起来就真的很准确。

接下来，就是参考生图更厉害的地方，它可以参考不止一张图。

比如，可以直接让男主站在他的船上。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

船的还原度非常好。对比我之前画的内容就发现，我之前是没办法做这样拼接的生成的，除非手动操作。

也可以绘制男主跟鲨鱼搏斗的场景：

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

我还发现，Vidu 为了让用户更好地完成像这样延续主体的创作，贴心提供了主体库的功能，像画漫画的话，男主就可以存到库里，随时调用。

Vidu Q1：打开 AI 生图的下一扇门

尝试了一些有意思的多图参考。比如让这两个最知名的老鼠抱在一块。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

参考的图片数量可以达到 7 张。比如可以让乔布斯跟他的所有最重要的产品合影。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

不过比例略有点不太对。看来模型还需要更聪明一些。

既然参考生图的效果这么好，那就可以用现成的场景，让我们直接穿越进去。

我今年夏天跟妻子去北极走了一个祝福仪式。本来很像去光之教堂的，可惜多年前就关闭了。

用参考生图就可以解馋体验一下。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

还可以让我出现在喜欢的电影场景里。比如《疯狂的麦克斯 4》里：

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

或者去《权力的游戏》里让小龙女和马王跟我合张影。看得我还是有点发怵。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

再比如，也可以去《血源诅咒》里受苦。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

或者去跟马斯克录播客，看他喷云吐雾。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

那么，Vidu Q1 这样的参考生图功能除了好玩，到底有没有实际用途？首先玩也是实际用途。其次，当然还有别的用途。

由于参考的效果很好，电商场景就可以用来做带货展示图。

比如，让米老鼠坐在这张椅子上。温馨提示，黑白的米老鼠才是没有版权的哦。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

自然也可以让人物坐在这张椅子上：

Vidu Q1：打开 AI 生图的下一扇门

坐椅子看起来并不难，喝饮料也是可以的。注意看蜜雪冰城的 logo 几乎没怎么变样，这点对于品牌商家来说太重要了。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

像这是我之前合伙创业做的茶品牌三五杯，可以让图 1 里的女生捧着它展示。展示角度发生了变化，盒子居然没有什么变形，完美复现。除了文字还是需要简单 p 一下才能用。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

也可以让同一个女生展示我的新书《内容即品牌》。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

换一个随机生成的棒球女生，效果也很不错。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

某些产品未必需要人，可能需要的是场景化的展示。

比如一个竹凳，就可以放到有竹子的潺潺小溪中展示。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

当然，也可以非常混搭，既有人物，又有竹凳。背景再放飞一些，放到外太空，也是可以的。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

电商场景里还有一个至关重要的痛点，就是试衣。说 AI 试衣已经说了很多年了。我也是第一次感知到，AI 试衣真的能帮到我。

比如这两个就是非常糟心辣眼睛的例子。

一个是中国风西装。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

一个是英伦绅士风。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

尝试了一下，衣服的适配度跟颜值还是息息相关的。颜值高的，穿什么都好看一些。颜值像我这样的，需要谨慎筛选、仔细斟酌。

像同一件衣服，用刚刚的女生形象，生成的效果就很棒。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

既然可以试一件衣服，那是不是也能试好几件衣服？

当然也是可以的。选了一件非常暴力美学的衬衫、半拿铁的帽子以及相当宽松的裤子。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

我还挺喜欢这套的，于是也让其他几位朋友试了试。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

以上就是我试用的阶段性体验。

电商和广告是我相对熟悉的，第一时间能想到应用场景的领域。

而生图乃至生视频的一致性、对参考图的精准控制问题解决后，将会影响几乎所有跟图像有关的行业。

比如，漫画转制动画方面，原本的分镜内容就像是关键帧，可以快速生成很多角度和动作的补帧，能自然地把剧情连贯起来。就不需要担心动画画师偷懒，把人物给画毁掉（比如某小学生侦探动画）。

再比如，影视行业里的概念设计，基于已有的人物和场景，就能不断生成大量的风格统一的概念图，作为参考。并且由 AI 产生的各种可能性，也是一种低成本的头脑风暴，大大提升效率。

再比如，品牌的 VI 系统，也可以由基础的元素，快速实现平面设计，包括广告图、海报、帖子配图、包装图等等。

能联想到的还有很多。各位工作中有接触设计工作的朋友，尤其是上次接触 AI 生图还是一两年前的，真心推荐体验一下。

在众多有参考生图的 AI 工具里，我个人还是倾向各位尝试下 Vidu Q1。

有这么几点原因：

1 参考图片数量足够多，达到 7 张。很多元素都可以参加进去。而多数竞品还是只支持 1-3 张参考图片。

2 主体一致性够强，不会出现太多细节走样。就像前面说的，在广告营销领域，是能够成为生产力的。拿来即用，很重要。

3 可控性好。输入的提示词对图片生成的效果会产生非常具体的影响。而且就像前面说的，中文输入的门槛更低。图片是提示词的必选元素，因此图片中内容的关系是指定的、可控的。

最后，用这样一张图作为结尾吧。我要去冥想一会儿了。

Vidu Q1：打开 AI 生图的下一扇门

Vidu Q1：打开 AI 生图的下一扇门

点击原文也可以直接跳转到 Vidu 官网申请使用。

*本文中没提到名字的人物形象，均为 AI 生成

晶存旗下妙存科技发布重磅新品 QLC NAND UFS 2.2 存储器

一分钟了解“微信小程序家乡麻将变牌神器”（辅牌器插件购买)

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图备案号：川ICP备66666666号由Z-BlogPHP强力驱动