【无需打开直接搜索微信;-】 操作使用教程: ...
2025-09-10 0
早在 2 年多之前,第一次感受到 AI 生图的震撼时,我用 Midjourney 做了一个篇幅很短的漫画。在总结做漫画的体会时,我是这么写的:
连贯性很难保证。尤其人脸和动作,想要在连贯画面里保持一致,非常难... ... 在可控性方面,只能用画图再垫图,再画图垫图的笨办法确保想要的内容。
这个一直是 AI 生图的痛点。之前用垫图也就是参考图片的方式,生成的人物差异非常大。比如主角的样子:
甚至这已经是我垫图十几次才得到的结果了。只能勉强让人感知到是同一个人。
而 2 年多过去了,这个世界进化到什么阶段了呢?
我近期用的比较多的是 Vidu。第一次注意到是在 4 月份,有新闻称其在 VBench 模型评测上拿了第一。
真正试用了一下,的确很是喜欢。作为国产大模型,可以输入中文,比起 Midjourney 来也方便不少。
前几天拿到了 Vidu 的朋友送的 Q1 参考生图的内测资格,这次玩得有点停不下来。跟各位分享一下。这个版本应该在你看到文章的 9.9 就正式发布了。
先感受一下,我用刚刚的这个角色侧脸,让 Vidu Q1 生成一个穿着白色条纹 T 恤向右看的图:
忽然穿越到 2 年前的垫图到疯的那个情绪里,现在感动得要哭。
整个看起来就真的很准确。
接下来,就是参考生图更厉害的地方,它可以参考不止一张图。
比如,可以直接让男主站在他的船上。
船的还原度非常好。对比我之前画的内容就发现,我之前是没办法做这样拼接的生成的,除非手动操作。
也可以绘制男主跟鲨鱼搏斗的场景:
我还发现,Vidu 为了让用户更好地完成像这样延续主体的创作,贴心提供了主体库的功能,像画漫画的话,男主就可以存到库里,随时调用。
尝试了一些有意思的多图参考。比如让这两个最知名的老鼠抱在一块。
参考的图片数量可以达到 7 张。比如可以让乔布斯跟他的所有最重要的产品合影。
不过比例略有点不太对。看来模型还需要更聪明一些。
既然参考生图的效果这么好,那就可以用现成的场景,让我们直接穿越进去。
我今年夏天跟妻子去北极走了一个祝福仪式。本来很像去光之教堂的,可惜多年前就关闭了。
用参考生图就可以解馋体验一下。
还可以让我出现在喜欢的电影场景里。比如《疯狂的麦克斯 4》里:
或者去《权力的游戏》里让小龙女和马王跟我合张影。看得我还是有点发怵。
再比如,也可以去《血源诅咒》里受苦。
或者去跟马斯克录播客,看他喷云吐雾。
那么,Vidu Q1 这样的参考生图功能除了好玩,到底有没有实际用途?首先玩也是实际用途。其次,当然还有别的用途。
由于参考的效果很好,电商场景就可以用来做带货展示图。
比如,让米老鼠坐在这张椅子上。温馨提示,黑白的米老鼠才是没有版权的哦。
自然也可以让人物坐在这张椅子上:
坐椅子看起来并不难,喝饮料也是可以的。注意看蜜雪冰城的 logo 几乎没怎么变样,这点对于品牌商家来说太重要了。
像这是我之前合伙创业做的茶品牌三五杯,可以让图 1 里的女生捧着它展示。展示角度发生了变化,盒子居然没有什么变形,完美复现。除了文字还是需要简单 p 一下才能用。
也可以让同一个女生展示我的新书《内容即品牌》。
换一个随机生成的棒球女生,效果也很不错。
某些产品未必需要人,可能需要的是场景化的展示。
比如一个竹凳,就可以放到有竹子的潺潺小溪中展示。
当然,也可以非常混搭,既有人物,又有竹凳。背景再放飞一些,放到外太空,也是可以的。
电商场景里还有一个至关重要的痛点,就是试衣。说 AI 试衣已经说了很多年了。我也是第一次感知到,AI 试衣真的能帮到我。
比如这两个就是非常糟心辣眼睛的例子。
一个是中国风西装。
一个是英伦绅士风。
尝试了一下,衣服的适配度跟颜值还是息息相关的。颜值高的,穿什么都好看一些。颜值像我这样的,需要谨慎筛选、仔细斟酌。
像同一件衣服,用刚刚的女生形象,生成的效果就很棒。
既然可以试一件衣服,那是不是也能试好几件衣服?
当然也是可以的。选了一件非常暴力美学的衬衫、半拿铁的帽子以及相当宽松的裤子。
我还挺喜欢这套的,于是也让其他几位朋友试了试。
以上就是我试用的阶段性体验。
电商和广告是我相对熟悉的,第一时间能想到应用场景的领域。
而生图乃至生视频的一致性、对参考图的精准控制问题解决后,将会影响几乎所有跟图像有关的行业。
比如,漫画转制动画方面,原本的分镜内容就像是关键帧,可以快速生成很多角度和动作的补帧,能自然地把剧情连贯起来。就不需要担心动画画师偷懒,把人物给画毁掉(比如某小学生侦探动画)。
再比如,影视行业里的概念设计,基于已有的人物和场景,就能不断生成大量的风格统一的概念图,作为参考。并且由 AI 产生的各种可能性,也是一种低成本的头脑风暴,大大提升效率。
再比如,品牌的 VI 系统,也可以由基础的元素,快速实现平面设计,包括广告图、海报、帖子配图、包装图等等。
能联想到的还有很多。各位工作中有接触设计工作的朋友,尤其是上次接触 AI 生图还是一两年前的,真心推荐体验一下。
在众多有参考生图的 AI 工具里,我个人还是倾向各位尝试下 Vidu Q1。
有这么几点原因:
1 参考图片数量足够多,达到 7 张。很多元素都可以参加进去。而多数竞品还是只支持 1-3 张参考图片。
2 主体一致性够强,不会出现太多细节走样。就像前面说的,在广告营销领域,是能够成为生产力的。拿来即用,很重要。
3 可控性好。输入的提示词对图片生成的效果会产生非常具体的影响。而且就像前面说的,中文输入的门槛更低。图片是提示词的必选元素,因此图片中内容的关系是指定的、可控的。
最后,用这样一张图作为结尾吧。我要去冥想一会儿了。
点击原文也可以直接跳转到 Vidu 官网申请使用。
*本文中没提到名字的人物形象,均为 AI 生成
相关文章
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-09-10 0
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-09-10 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-09-10 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-09-10 0
发表评论