首页 热门资讯文章正文

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

热门资讯 2025年08月27日 17:37 2 admin

又到了打打字就能P图的AI工具推荐环节了。

之前给大家介绍过豆包的SeedEdit 3.0视觉模型,以及阿里千问的Qwen-Image-Edit模型。

昨晚,谷歌的nano banana模型发布了,全名叫gemini-2.5-flash-image-preview,还是很长的谷歌味。

瞬间业内沸腾,这到底是一个有多强大的图像生成与编辑模型,今天老马就给大家演示一下。

nano banana主要的特点是保持人物的一致性上,效果很不错。

一致性的意思就是,你的个人形象照,换个服装、背景、场景,你的人脸都不会有太大改变。

这点很多模型都做不到,比如豆包,你让它把你照片中的服装换一下,结果人脸就变了。

同样的不仅是人物,对于一个物体,或者空间上已有的东西,AI不进行瞎改,也是保持一致性的体现。

剩下就是谷歌的nano banana生成图片的速度快,你看它原名带个Flash就知道了。

目前要体验这款新模型,常规操作是使用魔法上网打开谷歌的aistudio使用,生成的图片带水印。

老马给大家安利的另外一个方式是国内无需魔法也可以使用,且免费无水印。

下面一起来操作看看。

1、使用lmarena

这个网址可用电脑或手机浏览器打开,虽然是英文的,但很多地方都不影响使用,大致翻译一下即可,建议是登录注册一下,可以保存你的对话记录,网址如下:

https://lmarena.ai

打开后,我们能够看到顶部有个Battle的按钮,意思是当前的模式是对战模式,使用多个模型同时处理你的请求,让你看看最终的对比效果。


如果使用该模式,你可能有概率会抽中使用的是nano banana模型,也会抽中比如flux这类模型,所以不可控。


因此,我们需要点击一下Battle按钮,切换到Direct Chat模式,也就是直接聊天模式,然后右边可以选择各种模型,我们直接选择gemini-2.5-flash-image-preview即可。


有可能你第一次使用,是选择不到gemini-2.5-flash-image-preview模型,可能只能选择gemini-2.5-flash,这个也行。


等下你选择完,在下面的对话框里面,点击一下image的图像按钮,你就会发现你刚才选择的模型,变成gemini-2.5-flash-image-preview了,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

这样就搞定了,可以开始打打字各种生图和P图。


2、开始用nano banana各种AI玩图


忘了说一点,你如果在谷歌的aistudio上使用nano banana,是不支持中文提示词的,只能用英文提示词,而在lmarena上则可以用中文。


这大概就是aistudio应用层上没有做支持,中文提示词写法老马是建议一句话就行,你想怎么改图就写什么需求。


老马下面也不再每个演示案例给出具体的提示词,因为提示词都比较简单,一句话的事情,给个样例大家参考即可。


首先我们来看看nano banana的生图效果如何,提示词如下:

青衣男子站在宝剑上,面对着镜头,宝剑剑尖放大朝着镜头,脚下踩着剑在空中飞行,剑身散发着寒气
老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

效果还行哈,由于当前模型太火爆,在lmarena上估计用的人太多,经常会出现报错,我们需要点击右边的重试按钮,多试几次,如果还有报错,就刷新当前网页,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

下面拿老马的个人形象照,给大家演示一下换装、换背景、换场景,看看人物一致性保持的效果,原图如下:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

先把西装换成道袍看看,点对话框中的+号按钮上传上面的原图,然后提示词就写把人物的服装换成道袍即可,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

看到没有,老马还是老马,丝毫没有任何改动,那换个服装+背景看看,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

人脸、动作、表情没有丝毫改动,这个一致性的控制不要太强,再换个场景看看,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

除了笑得有点猥琐,人脸的变动不算太大,场景整体的逼真程度还是可以的,AI味不浓。


再来看看合成图片,把另外一张图片上的内容,融合到当前的图片中,使之毫无违和感,老马准备来一张蜡笔小新的手办玩偶图片,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

这是一个手办摆件,了解的朋友都清楚,摆放在桌面上的,一般是塑料和树脂材质,这个蜡笔小新大概尺寸也就巴掌大,经过合成后如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

它就变成了一个毛绒娃娃玩具,被老马捧在手心上,就问你强不强。


还有一种玩法是多轮编辑,就是你可以一步步地给一张图片加东西,比如一个空空如也的房间,你可以第一步加沙发,第二步加茶几,第三步加衣柜等等。


每一步加上去东西,都不会改动先前的图片内容,老马也准备了一张空房间的素材,原图如下:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

第一步先加个书柜吧,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

第二步加个真皮沙发吧,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

第三步再加个茶几,不能说吧,如图:

老板AI应用课:甩豆包图像生成几条街,谷歌的nano banana有点强

就加到这里吧,你会发现,不该改动的一点没改,该加的都加了,测试到这里,老马觉得像平面设计师,尤其美工,越来越危矣。


普通用户打打字就能随心所欲地用AI对图片进行任何创造、改动,坦白讲,剩下的设计美感、设计创意这些软性经验的东西,AI最终也能够给到。


总而言之,nano banana在一致性控制方面的图像编辑确实很强,已经甩开了豆包跟千问,不足的地方也有,就是文字编辑能力较差。


你要它修改图片上的文字,目前还不大行,也可能是在模型训练上缺乏了这部分的数据和调优。


好了,以上就是今天的分享,有任何问题和需求可以留言,回见!

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动