核心观点:
Nano Banana 模型已在多个平台上线,提供强大的图像生成和编辑功能,尤其在多元素合成、局部修改、风格转换、概念图生成等方面展现出“邪修”般的创意玩法。虽然在尺寸控制和成功率上仍有待提升,但其强大的世界知识和灵活的操作方式,使其成为AI艺术创作的有力工具。
Nano Banana 模型现已全面上线,为AI艺术创作领域注入了新的活力。这款模型不仅登陆了AI Studio、Gemini、Whisk、Opal、OpenRouter等主流平台,还在flowith上支持批量生成,彻底告别了在lmarena上“抽卡”的漫长等待。本文将深入探讨Nano Banana的13种“邪修”玩法,并附上相应的提示语和效果展示,帮助用户充分释放其创意潜能。
多元素融合,打破上传限制
Nano Banana 的一大亮点在于其强大的多元素合成能力。尽管Gemini单次上传限制为10张图片(除去背景,理论上最多指定9个元素),但通过将所有内容整合到一张图片中并添加标签,再在提示词中引用这些标签,便可突破上传数量的限制。这种方法不仅能融合更多元素,还能显著提升人脸光影和颜色的整体一致性。
例如,在“香蕉艺术品”场景中,通过为Mona、Pearl、David、Van Gogh、Leonardo等人物和场景元素添加标签,可以实现复杂的组合生成。即使不使用文字标注,模型也能识别并整合图像中的元素。

局部修改与“红框”魔法
Nano Banana 在修改图像局部细节方面表现出色,包括背景、画风、人物配件、发型、服装乃至人脸。而“红框”功能更是将局部修改推向了极致。通过框选图片中的特定元素,可以实现提取、放大、替换,甚至将元素“抠”出来。
例如,将框选出的人物放大并生成高清单人照片。
“红框”还能精确限定物体替换的区域,有效避免模型在处理不同尺寸图片时对插入物体大小的误解。

将“红框”区域完全涂抹并转化为大面积红色蒙版,则可以实现“无中生有”的创意生成。
“红框”操作同样可以在PPT等工具中完成,而蒙版制作则更为简便,甚至可以使用手机自带的图片编辑功能。
利用模型世界知识,实现概念可视化
Nano Banana 拥有与Gemini媲美的世界知识储备,能够理解并生成基于现实世界信息的图像。例如,可以将照片转换为俯视视角,并标注摄影师的位置。
在此基础上,还可以利用VEo3生成视频空镜素材。

上传现实世界的建筑图片并进行标注,可以实现基于位置的AR体验生成。突出显示兴趣点并添加相关信息注释。
火柴人动作漫画与插画真人化
通过在图片上绘制红线,模拟火柴人的动作,Nano Banana可以生成大幅度的动作漫画。将不同的角色和动作结合,并添加场景交互,可以创作出动态十足的画面。
此外,Nano Banana还能将插画转化为真人照片,并根据场景需求进行调整,例如将插画女孩转化为在Comic Market现场的Cosplay照片。
原创角色设计与概念图生成
对于想要创造原创角色的用户,Nano Banana 提供了全面的支持,可以生成角色设定、比例设定、三视图、表情设定、动作设定以及服装设定等。
此外,Nano Banana 还能生成概念解释图,将抽象概念可视化。例如,解释GPT5是什么,或AI coding与人工coding的区别。
文字保持能力与未来展望
在海报生成方面,Nano Banana 展现了不错的文字保持能力。例如,将现有海报中的产品和广告语替换为iPhone相关内容,并将人物和配色调整为粉色。
然而,Nano Banana 目前在理解图片尺寸限定方面尚不完美,例如对16:9、1:1、4:3等比例的识别能力有待提高。此外,作者提到在Gemini和AI Studio上线后,成功率反而不如Lmarena,平均需要多次尝试才能获得满意结果。
尽管如此,Nano Banana 的强大功能和无限创意潜力使其成为继GPT4o之后,备受瞩目的AI模型。其丰富的“邪修”玩法,为艺术家和创作者提供了前所未有的创作度。
使用链接:
- https://gemini.google.com/app
- https://labs.google/fx/tools/whisk/project
- https://opal.withgoogle.com/?mode=canvas
- https://openrouter.ai/chat?models=google/gemini-2.5-flash-image-preview:free
- https://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-flash-image-preview