建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

导读:厌倦了复制粘贴的AI绘图提示词?本文将深入解析Google Gemini 2.5 Flash Image的官方教程,揭示“描述场景”而非“罗列关键词”的核心原则。通过11个实用案例和进阶技巧,教你如何与AI进行更有效的“对话”,创作出更具灵魂的图像作品。无论是从文本生成图像,还是编辑带文字的图片,都能让你摆脱“自嗨”,真正掌握AI绘图的“道”与“术”。


大家好,我是闪闪!这是我的第 3 篇原创。最近在AI绘图的社群里,我发现许多朋友都面临着一个共同的难题:只会套用现成的提示词,难以原创,每次都只是简单修改几个字。对此,我深入研究了Google官方发布的Gemini 2.5 Flash Image(即近期备受瞩目的nano banana)图像生成教程,原文地址为:《How to prompt Gemini 2.5 Flash Image Generation for the best results》。这份教程不仅揭示了AI绘图的精髓,还提供了11个极具价值的实用案例,涵盖了从文本生成图像的6个场景,以及编辑带文字图片功能的4个应用,并附带一套最佳实践。这篇文章将带你彻底告别“关键词堆砌”,学会如何用更具创意和情感的方式与AI沟通。

扎心:你可能一直在“自嗨”

扪心自问,你平时写提示词是不是这样的?“美女,长发,白裙子,桂花,背景虚化,8K,专业摄影”。如果你的答案是肯定的,那么你很可能已经陷入了第一个误区:将AI视为一个简单的“关键词搜索引擎”。

那么,正确的写法应该是什么样的呢?同样是想描绘一个女孩在樱花树下的场景,不妨试试这样表达:

“春日午后,一位身着素雅白裙的秀丽长发女子,静静伫立于烂漫盛开的樱花树下。微风轻拂,几缕粉色的花瓣悄然飘落,点缀在她肩头。她凝望着远方,眼中流露出一丝淡淡的思念,仿佛在静候一位重要之人。身后的樱花林在柔和的光影下,呈现出自然的虚化效果,整个画面弥漫着“青春里美好而略带伤感”的独特氛围,宛如电影场景般细腻而富有层次。”

感受到了其中的区别吗?前者只是简单地“罗列关键词”,而后者则是在“描绘一个生动的场景”。

 

Google官方教程揭秘:为何要“描述场景”而非“罗列关键词”?

Google的教程明确指出,AI需要的是“情境理解”,而非简单的“元素拼凑”。

原因一:AI需要“情境理解”,而非“元素拼凑”

错误思路是直接告诉AI图片应该包含哪些元素,例如“悲伤的人,公园,长椅,雨天”。而正确的思路是让AI理解你想要表达的情境和感觉,例如“那种下雨天一个人坐在长椅上,想起某个重要的人已经不在身边的情景”。前者是“罗列元素”,后者则是在“描述情境”,AI能够从中自动推导出所需的全部元素,并以更自然的方式进行组合。

原因二:“故事化描述”比“清单式罗列”效果更佳

我们习惯于列出清单式的描述,例如:“•人物:年轻女性 •服装:蓝色牛仔裤 •场景:咖啡厅 •光线:温暖 •风格:日系”。然而,Google建议采用故事化的描述方式,例如:“一个刚刚收到好消息的女孩,坐在最喜欢的咖啡厅里,那种忍不住想要分享喜悦但又想独自品味这份幸福的复杂心情”。这种故事化的描述让AI理解了“为什么”,而不仅仅是“是什么”,从而生成更有“灵魂”的图片。

原因三:善用AI的“联想能力”,而非“执行能力”

nano banana最强大的地方在于它能够“理解抽象概念”并将其转化为具体画面。因此,你可以尝试描述一种感觉,例如:“就像宫崎骏动画里那种淡淡的忧伤感”;引用经典场景,如:“像《她》这部电影的色调和氛围”;或者使用比喻,比如:“有种 iPhone 人像模式的那种背景虚化效果”。这些描述比直接说“景深、虚化、暖色调”要有效得多。

 

实战模板:从“翻车”到“出片”

理论讲了这么多,现在让我们转向实用的部分。我将Google官方教程中的案例按照应用场景进行了分类,并为每个案例提供了详细的提示词结构。这些模板可以直接套用,建议您将本文收藏,以便随时查阅。无论您是从事产品设计、内容创作,还是纯粹想体验AI绘图的乐趣,这些模板都能助您快速上手。

从文本创建图像(6个核心场景)

1. 摄影级真实场景(Photorealistic scenes)

此类场景适用于需要高度真实感的图像,例如产品宣传、人物肖像等。关键在于像摄影师一样思考,详细描述相机角度、镜头类型、光照以及精细的细节。

模板结构:A photorealistic [镜头类型] of [主体], [动作或表情], set in [环境]. The scene is illuminated by [光线描述], creating a [氛围] atmosphere. Captured with a [相机/镜头细节], emphasizing [关键纹理和细节]. The image should be in a [画幅比例] format.

Google原文案例:A photorealistic close-up portrait of an elderly Japanese ceramicist with deep, sun-etched wrinkles and a warm, knowing smile. He is carefully inspecting a freshly glazed tea bowl. The setting is his rustic, sun-drenched workshop. The scene is illuminated by soft, golden hour light streaming through a window, highlighting the fine texture of the clay. Captured with an 85mm portrait lens, resulting in a soft, blurred background (bokeh). The overall mood is serene and masterful. Vertical portrait orientation.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

2. 风格化插图和贴纸(Stylized illustrations & stickers)

这类场景适用于创意表达、儿童读物、品牌IP等。需要明确指定风格类型,如果需要白色背景,务必特别说明。

模板结构:A [风格] sticker of a [主体], featuring [关键特征] and a [色彩搭配]. The design should have [线条风格] and [阴影风格]. The background must be white.

Google原文案例:A kawaii-style sticker of a happy red panda wearing a tiny bamboo hat. It’s munching on a green bamboo leaf. The design features bold, clean outlines, simple cel-shading, and a vibrant color palette. The background must be white.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

3. 图片中的准确文字(Accurate text in images)

Gemini 2.5 Flash Image能够直接在图片中渲染文字。此时,您需要明确具体的文字内容、字体风格以及整体设计。

模板结构:Create a [图像类型] for [品牌/概念] with the text “[要渲染的文字]” in a [字体风格]. The design should be [风格描述], with a [色彩方案].

Google原文案例:Create a modern, minimalist logo for a coffee shop called ‘The Daily Grind’. The text should be in a clean, bold, sans-serif font. The design should feature a simple, stylized icon of a coffee bean seamlessly integrated with the text. The color scheme is black and white.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

4. 产品样机与商业摄影(Product mockups & commercial photography)

此类场景适用于电商产品图、包装设计、产品原型展示等。重点在于描述专业的灯光设置和拍摄角度。

模板结构:A high-resolution, studio-lit product photograph of a [产品描述] on a [背景表面/描述]. The lighting is a [灯光设置] to [灯光目的]. The camera angle is a [角度类型] to showcase [特定功能]. Ultra-realistic, with sharp focus on [关键细节]. [画幅比例].

Google原文案例:A high-resolution, studio-lit product photograph of a minimalist ceramic coffee mug in matte black, presented on a polished concrete surface. The lighting is a three-point softbox setup designed to create soft, diffused highlights and eliminate harsh shadows. The camera angle is a slightly elevated 45-degree shot to showcase its clean lines. Ultra-realistic, with sharp focus on the steam rising from the coffee. Square image.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

5. 极简主义与负空间设计(Minimalist & negative space design)

这类设计适用于创建网站背景、演示文稿或营销材料,尤其适合需要叠加文字的场景。

模板结构:A minimalist composition featuring a single [主体] positioned in the [位置] of the frame. The background is a vast, empty [颜色] canvas, creating significant negative space. Soft, subtle lighting. [画幅比例].

Google原文案例:A minimalist composition featuring a single, delicate red maple leaf positioned in the bottom-right of the frame. The background is a vast, empty off-white canvas, creating significant negative space for text. Soft, diffused lighting from the top left. Square image.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

6. 连环画(Comic panel / storyboard)

这类场景适合创建引人入胜的视觉叙事,可用于开发故事板、漫画条或任何形式的连环画。

模板结构:A single comic book panel in a [艺术风格] style. In the foreground, [角色描述和动作]. In the background, [场景细节]. The panel has a [对话/标题框] with the text “[文字]”. The lighting creates a [氛围] mood. [画幅比例].

Google原文案例:A single comic book panel in a gritty, noir art style with high-contrast black and white inks. In the foreground, a detective in a trench coat stands under a flickering streetlamp, rain soaking his shoulders. In the background, the neon sign of a desolate bar reflects in a puddle. A caption box at the top reads “The city was a tough place to keep secrets.” The lighting is harsh, creating a dramatic, somber mood. Landscape.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

编辑带文字的图片(4个核心功能)

这是Gemini 2.5 Flash Image多模态能力真正发挥优势的地方。您可以提供一张或多张图像,并结合文字提示进行编辑、合成和风格迁移。

1. 图像编辑:添加和移除元素(Image editing: Adding & removing elements)

提供一张图像,然后简单描述您想要进行的修改。模型会分析原始图像的风格、光照和透视,确保编辑效果自然,并保持角色的一致性。

模板结构:Using the provided image of [主体], please [add/remove/modify] [元素] to/from the scene. Ensure the change is [变化如何融合的描述].

Google原文案例:Using the provided image of my cat, please add a small, knitted wizard hat on its head. Make it look like it’s sitting comfortably and matches the soft lighting of the photo.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

2. 局部编辑(Inpainting: editing a specific area)

您可以与Gemini 2.5 Flash Image进行对话式交互,指示其仅编辑图像的特定部分,而保持其余部分完全不变。

模板结构:Using the provided image, change only the [特定元素] to [新元素/描述]. Keep everything else in the image exactly the same, preserving the original style, lighting, and composition.

Google原文案例:Using the provided image of a living room, change only the blue sofa to be a vintage, brown leather chesterfield sofa. Keep the rest of the room, including the pillows on the sofa and the lighting, unchanged.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

3. 风格迁移(Style transfer)

提供一张照片,要求模型以特定的风格或艺术流派重新创作其内容。

模板结构:Transform the provided photograph of [主体] into the artistic style of [艺术家/艺术风格]. Preserve the original composition but render it with [风格元素描述].

Google原文案例:Transform the provided photograph of a modern city street at night into the artistic style of Vincent van Gogh’s ‘Starry Night’. Preserve the original composition of buildings and cars, but render all elements with swirling, impasto brushstrokes and a dramatic palette of deep blues and bright yellows.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

4. 高级合成:多图像组合(Advanced composition: Combining multiple images)

提供多张图像作为上下文,以创建全新的合成场景。这对于产品样机或创意拼贴尤为适用。

模板结构:Create a new image by combining the elements from the provided images. Take the [图像1中的元素] and place it with/on the [图像2中的元素]. The final image should be a [最终场景描述].

Google原文案例:Create a professional e-commerce fashion photo. Take the blue floral dress from the first image and let the woman from the second image wear it. Generate a realistic, full-body shot of the woman wearing the dress, with the lighting and shadows adjusted to match an outdoor environment.

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

每个类别的核心技巧总结

通过以上模板,您是否发现了一些规律?

从文本创建图像的6个场景:

  • 摄影级真实场景:聚焦于光线、材质、情感氛围的细致描绘,如同摄影师般进行构思。
  • 风格化插图和贴纸:强调色彩搭配、线条风格以及整体感觉,别忘了指定背景色。
  • 图片中的准确文字:注重功能性、品牌调性与视觉层次,务必明确字体风格。
  • 产品样机与商业摄影:突出产品特性、使用场景及专业感,详细描述灯光设置。
  • 极简主义与负空间设计:创造留白空间,特别适合需要叠加文字的背景设计。
  • 连环画:侧重叙事性、角色动作和场景氛围,非常适合故事板创作。

编辑带文字的图片的4个功能:

  • 添加和移除元素:保持原图风格,使新元素自然融入。
  • 局部编辑:精确修改特定区域,同时保持其他部分不变。
  • 风格迁移:保留构图,改变艺术风格。
  • 多图像组合:进行创意合成,适用于产品样机和拼贴。

每种类型的提示词都有其独特的“语言”,掌握了这些,您就能与AI进行更精准、更有效的“对话”。

 

最佳实践:Google官方建议

在实际应用中,Google还提供了一些核心建议,以助您进一步提升AI绘图效果:

  1. 超级具体化描述:不要只说“幻想盔甲”,而要描绘“精美的精灵板甲,银叶图案蚀刻,高领设计,肩甲形似猎鹰翅膀”。细节越丰富,控制力越强。
  2. 提供背景和意图:说明图像的用途。例如,“为高端极简护肤品牌创建logo”比单纯说“创建logo”效果更佳。
  3. 迭代优化思维:不要期望一次就完美。利用对话的优势进行小幅调整,例如“很棒,但能让光线更温暖一些吗?”或“保持其他不变,让角色表情更严肃一点”。
  4. 使用“语义负面提示”:避免直接说“没有汽车”,而是积极描述“空旷荒凉的街道,没有任何交通迹象”。
  5. 控制镜头语言:运用摄影和电影术语来控制构图,如“广角镜头”、“微距拍摄”、“低角度视角”、“85mm人像镜头”、“荷兰角度”等,以精确控制最终图像。
  6. 保持角色一致性:如果在多次编辑后发现角色特征开始偏移,可以重新开始对话,并提供详细描述来维持一致性。
  7. 纵横比控制:在编辑时,Gemini通常会保持输入图像的纵横比。如果需要特定比例,请在提示中明确说明,例如:“更新输入图像……不要改变输入的纵横比”。

进阶技巧:让AI“读懂”你的审美

除了基础的提示词技巧,还有几个进阶玩法可以帮助您更好地表达自己的审美:

  1. 建立“风格词典”:与其每次都重新描述风格,不如建立自己的“风格词典”。例如:
    • “电影感”= 构图有张力,光影对比强烈,有故事性
    • “日系清新”= 色调偏暖,构图简洁,有生活气息
    • “赛博朋克”= 霓虹色彩,未来感建筑,科技与人文的对比
  2. 用“参考系”而非“技术词”:与其说“景深效果,虚化背景”,不如说“像 iPhone 人像模式那种背景虚化”。与其说“电影级调色”,不如说“像《她》这部电影的色调”。
  3. 善用“对比”和“冲突”:AI特别擅长处理具有张力的画面,例如:
    • “现代都市里的古典美人”
    • “废墟中盛开的花朵”
    • “科技感十足的咖啡厅里,一个人在手写信件”

 

国产AI绘图工具的提示词指南

除了Google的nano banana,字节跳动的即梦和豆包也相继推出了各自的提示词使用指南。这两家公司还发布了相关的操作手册:

  • 《即梦图片 4.0 模型 提示词手册》:原文地址:https://bytedance.larkoffice.com/docx/L4vCdah1DoDg7axVdYGcoplSn9f
  • 《豆包 Seedream 4.0 使用指南》:原文地址:https://bytedance.larkoffice.com/docx/XwngdqdhIowfF8xhEA4cwpS2nLb

建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!
建议收藏!Google+即梦+豆包三大官方AI绘图提示词手册,终于有人整理全了!

写在最后:AI绘图的“道”与“术”

说了这么多技巧,但我觉得最重要的还是要理解AI绘图的本质:把它当成创作伙伴,别当成执行工具。就像我们和朋友时,你不会说“请你理解我现在的心情是悲伤,程度为7分,持续时间3小时”,而是会说“唉,今天有点不开心,想找个人聊聊”。和AI对话也是一样,与其给它一堆“技术指标”,不如和它分享你想要表达的“感觉”。

 

阅读原文
© 版权声明
蝉镜AI数字人

相关文章

蝉镜AI数字人

暂无评论

暂无评论...