如何正确使用提示词让AI生成自己想要的图片

爱玩的蛋哥 2024-11-13 10:51:19
一、认识提示词在 AI 绘画中的重要性

在 AI 绘画的领域中,提示词扮演着至关重要的角色。它就像是一把神奇的钥匙,能够开启无限的创意之门,决定着最终生成图像的内容、风格以及质量。

提示词不仅是简单的文字描述,更是与 AI 进行深度交流的桥梁。通过精准的提示词,我们可以明确地向 AI 传达我们内心所期望的图像特征。例如,当我们输入 “高质量、写实风格、夕阳下的海边” 这样的提示词时,AI 会根据这些关键词去理解我们的需求,并努力生成一幅符合描述的美丽海景图。

据相关数据显示,一个精心构建的提示词能够使生成的图像符合预期的概率提高至 70% 以上。这充分说明了正确使用提示词的重要性。如果提示词模糊不清或者不准确,那么生成的图像可能会与我们的期望相差甚远。

提示词的作用不仅仅局限于决定图像的内容和风格,它还可以控制图像的细节。比如,我们可以通过添加 “细腻的纹理”“明亮的色彩” 等提示词,让 AI 生成更加生动、逼真的图像。同时,提示词还可以排除不希望出现的元素,例如 “不含卡通元素”“避免模糊” 等负向提示词,可以确保生成的图像更加符合我们的特定要求。

二、提示词的构成与语法

(一)基本格式介绍

在使用 Stable Diffusion 和其他 AI 绘图工具时,提示词通常遵循特定格式。提示词可以是具体的描述词、数量说明、形容词或特定元素的指示。高质量 [关键词 1] AND [关键词 2] AND...。

正向提示词用来指定希望在图像中出现的内容,格式示例为高质量人物 AND 背景复杂 AND 详细描绘。负向提示词则用来排除不希望在图像中出现的内容,格式示例为无成人内容 AND 避免模糊 AND 非卡通风格。

(二)正向提示词实例

目标是生成一个背景为夕阳、身着古装的女性人物图像。提示词示例可以是:高质量夕阳 AND 古装女士 AND 细节丰富。这里的 “高质量夕阳” 明确了夕阳的画质要求,可能呈现出绚丽的色彩、清晰的轮廓等。“古装女士” 确定了图像的主体,古装可以有多种风格,如汉服的飘逸、唐装的华丽等。“细节丰富” 则进一步要求图像在人物的服饰、发型、配饰以及背景的景物等方面都有精细的刻画。

(三)负向提示词实例

以生成清晰、高分辨率的静物图像为例,提示词示例可以是:清晰 AND 高分辨率 AND 非卡通风格 AND 无模糊。“清晰” 和 “高分辨率” 确保了图像的质量,使静物的每一个细节都能清晰可见。“非卡通风格” 排除了可能出现的卡通化处理,让图像更具真实感。“无模糊” 则再次强调了图像的清晰度,避免出现模糊不清的情况。

当我们希望生成一个花瓶的静物图像时,如果不使用负向提示词,可能会出现模糊、卡通风格或者有其他不希望出现的元素。但通过明确的负向提示词,AI 能够更好地理解我们的需求,生成符合要求的图像。

三、实战应用提示词生成具体图像

(一)基本原则与模板

首先,我们来了解一下提示词的基本原则。原则一:prompt 不是越长越好,精准表达意图才是关键,长度最好保持在 75 个单词(或约 60 个字)以内。例如,想要生成一只可爱的猫咪图片,“可爱猫咪,大眼睛,毛茸茸” 这样简洁的描述可能比冗长的描述更有效。

原则二:越重要的词放在靠前的位置。比如生成一幅森林中的小屋图像,应把 “小屋”“森林” 等关键元素放在前面,如 “小屋,森林,宁静氛围”。

原则三:善用符号。使用逗号分隔不同的意图,如 “高山,绿树,清泉”。使用括号调整权重,例如 “(hight building: 1.2 )” 意味着高楼的权重变高,小于 1 的权重数则使该词与生成的图更不相关。

一般 prompt 会包含以下基本模板内容:Subject(主体),因为主体是最重要的,所以一般会放在首位。比如生成一幅海边日落的图像,“日落海景” 可以作为主体。Environment(环境),包含主体周围的环境、光照和天气等。如 “在金色的夕阳下,海浪轻轻拍打着沙滩”。Medium(媒介),可以是图片的拍摄媒介或承载的媒介,如 “油画风格的海景画”。Style(风格),可以用 4W 记忆,即 When(什么年代的风格)、Who(想要谁的风格)、What(什么艺术类型或运动的风格)、Where(什么国家的风格)。

(二)学习方法与知识

在实际应用中,我们可以采用 “先模仿后超越” 的学习方法。先去借鉴别人的提示词,然后根据自己的需求进行修改,并通过控制变量的方式多尝试,一次只改一个词,这样就能了解每个词对生成图片的影响。

这里推荐几个不错的学习网站:Civitai ,这是目前全球最大的 AI 图片社区,可以下载模型,看别人生成的图片作品,能学到非常多东西。Learning Prompt ,里面的场景案例对于学习 Stable Diffusion 依然有参考意义。

当我们把上面的原则模板方法理解后,继续了解一些必须知道的知识。正向提示词是我们要在图像里呈现的内容,比如 “美丽的花朵,鲜艳的色彩”。反向提示词是我们不要在图像里呈现的内容,如 “无模糊,不暗淡”。提示词与提示词之间要用英文逗号分隔,且可以换行,但换行时也要在结尾加上逗号来进行区分。每个提示词自身权重默认值都是 1,越靠前的提示词权重越高,同时要控制在 75 个单词以内。小括号 () 代表增加权重,1 层 1.1 倍;中括号 [] 代表减少权重,1 层 0.9 倍;大括号 {} 代表增加权重,1 层 1.05 倍。[提示词:0 - 1]: 整体画面采样到图像生成进程百分比的某个阶段开始计算提示词的采样;[提示词::0 - 1]: 提示词的采样从一开始就计算直到数值的百分比结束;[提示词 1:提示词 2:0 - 1 数值]:数值的百分比前计算提示词 1 采样,数值的百分比后计算提示词 2 采样。

基础词汇分为通用的词语和主体词、细节词等。通用的词语主要对画质进行提示,也称起手式,常用的有 “最好的质量,超细节,杰作,精细的细节,高分辨率,8k 壁纸” 等。主体词对图像的主题进行描述,比如 “美丽的花园,可爱的小狗”。细节词则对主体更加细节的描述,如 “花园里的红色花朵,小狗的棕色毛发”。

四、优化图像风格的方法

(一)加载不同模型

在 AI 绘画中,加载不同的 Checkpoint 模型是一种简单而有效的影响生成图片效果的方法。不同的 Checkpoint 模型擅长生成不同事物或者风格的图片。例如,有的模型可能更擅长生成写实风格的图像,而有的模型则在动漫风格的表现上更为出色。

据了解,目前在一些常用的绘画平台上,可供选择的 Checkpoint 模型数量众多。用户可以根据自己的需求和喜好,在不同的模型中进行尝试。比如,当我们想要生成一幅具有梦幻色彩的风景图时,可以尝试加载一个专门针对奇幻风格进行训练的 Checkpoint 模型。这样,AI 在生成图像时会更倾向于呈现出奇幻的元素,如绚丽的色彩、奇特的地貌等。

通过加载不同的 Checkpoint 模型,我们可以快速地切换不同的风格,满足各种不同的创作需求。无论是想要复古风格的画像,还是未来感十足的科幻场景,都可以通过选择合适的 Checkpoint 模型来实现。

(二)使用 LoRA

LoRA(Low-Rank Adaptation)在优化图像风格方面也起着重要的作用。LoRA 可以理解为 Stable-Diffusion 中的一个插件,仅需要少量的数据就可以进行训练。在生成图片时,LoRA 模型会与大模型结合使用,从而实现对输出图片结果的调整。

当我们想要生成具有特定风格的图像时,如中国水墨画风格或者赛博朋克风格,可以使用相应的 LoRA 模型。通过在提示词中插入 LoRA 模型的名称和权重,如 “<lora: 水墨风格 LoRA:0.7>”,AI 会根据这个 LoRA 模型的特点对生成的图像进行调整。

下载 LoRA 模型也比较方便。主流 LoRA 模型一般都在特定的网站上能找到,比如 civitai。但需要注意的是,访问这个网站可能需要梯子。在这个网站上,汇集了国内外各式各样的 LoRA 模型。进入网站后,依次点击主菜单栏模型 (Models)—> 右上角的过滤 (Filters)—> 点击 “Lora” 就能显示所有 LoRA 模型了。当然,如果知道一些 LoRA 的名字,也可以直接在顶部的搜索框中输入 LoRA 的名字,通常只要输入开通几个字符就会自动匹配上类似的 LoRA 供选择。

下载下来的 LoRA 有固定的存放路径,一般是找到 SD 的主文件夹下的 models 目录,将下载的所有模型都放在 Lora 目录下即可。如果想对 LoRA 进行分类,还可以新建不同类型的文件夹,将 LoRA 放到对应文件夹。

为了更好地管理和使用 LoRA,可以安装一个叫 C 站助手的插件。安装好之后,重启 WebUI,即可在菜单栏看到 C 站助手。点击扫描 (Scan),就会自动帮把所有从 C 站下载的 LoRA 自动打上标记,同时还能下载 LoRA 对应的封面图,方便进一步区分。扫描完之后的 LoRA,每个上面都会多出来 4 个图标,分别可以进行替换封面、直达 C 站网址、自动添加触发词以及自动将例图的完整提示词添加到正向和反向提示词中等操作。有了这个插件会更加方便大家管理和使用 LoRA。

五、提升图像质量的技巧

(一)添加光照效果

在 AI 绘画中,不同的光照效果能为图像带来截然不同的视觉感受。例如,“bloom” 效果能使原始照明更亮,让图像中主体的头顶和肩膀顶部产生更耀眼的光亮效果,就像被聚光灯聚焦一般,增强了画面的立体感和层次感。“soft lighting” 则带来更柔和的光源,光线轻柔地洒在脸上和背部,营造出温馨、浪漫的氛围,特别适合绘制人物肖像或柔和的场景。“hard lighting” 直接照亮主体,使得脸部轮廓更加突出,适合表现人物的坚毅或物体的硬朗质感。“backlight” 从后面照亮主体,使图像看起来更暗,肩膀和头发上的光线从后面投射过来,营造出神秘、深邃的氛围,常用于夜景或神秘主题的绘画。“god rays” 作为另一种类型的背光,光线从较高的位置向下照射,导致头顶特别明亮,给人一种神圣、庄严的感觉,可用于宗教或奇幻主题的图像创作。“volumetric lighting” 整体更暗,类似柔和版本的背光,让人想起生化危机那种紧张、压抑的场景,适合营造恐怖或悬疑氛围。“sun light” 带来更自然的阳光,背景中的树木似乎也在阳光下熠熠生辉,为图像增添了真实感和生机。“studio light” 在脸两侧设置光源,营造出强烈的立体感,如同广告照片一样,能突出主体的精致和高贵。“bioluminescent light” 让主体发出光,就像夜晚的萤火虫一样,充满奇幻色彩,适合创作科幻或梦幻主题的图像。

(二)添加阴影和光线追踪

“detailed shadows” 能在肩膀和衣服上出现一些阴影,让图像更加真实。通过精确地计算阴影的位置和形状,可以使人物或物体看起来更加立体,仿佛真实地存在于三维空间中。“intricate tree shadows” 则创造出复杂而交织的树影,使其看起来更逼真,为户外场景增添了自然的氛围和深度。“ray tracing” 即光线追踪,能够带来来自环境的更多光反射,使图像中的光线更加真实自然,增强了画面的质感和真实感。例如,在一个室内场景中,光线追踪可以准确地模拟光线在不同物体表面的反射和折射,使得画面更加细腻、逼真。

(三)添加照片效果

“boken” 和 “depth of field” 可以添加一些散景和景深效果,使图像看起来像是用大光圈镜头拍摄的。通过模糊背景,突出主体,营造出专业摄影的效果。“film photography” 和 “film grain” 添加胶片颗粒以创建复古电影外观,为图像增添一份怀旧的氛围。不过,如果图像中没有太多细节,这种效果可能不是很明显。“glare” 添加了一点镜头光晕效果,但不是很突出,可以在特定的光照条件下为图像增添一些亮点,增强画面的艺术感。

(四)添加美丽形容词和更多提示词

添加 “beautiful girl” 这样的形容词可以明确生成一个漂亮的女孩图像,让主体更加吸引人。“ultra-detailed eyes” 能创造出令人难以置信的细节眼睛,使人物更加生动、传神。“detailed hair” 描绘出错综复杂的头发,增加了图像的真实感和细腻度。“beautiful face” 赋予主体一张华丽的脸,提升了整体的美感。“(hyperdetailed:1.15)” 表示超详细,重量为 1.15,进一步增强图像的细节表现。“outdoors” 添加一些户外元素,丰富了图像的背景和环境。这些形容词和提示词的组合使用,可以让图像更加丰富多彩,满足不同的创作需求。

(五)添加负向提示词

添加负向提示词可以避免不想要的图像特征。例如,“(worst quality:2.00)” 明确表示不想要最差的质量,重量为 2.0。“(low quality:2.00)” 和 “(normal quality:2.00)” 分别排除低质量和普通质量的样本。“low-res” 表示不想要低分辨率的样本。通过这些负向提示词,AI 能够更好地理解我们对图像质量的要求,避免生成不符合期望的图像。同时,合理使用负向提示词可以提高生成图像的准确性和满意度,让我们更轻松地获得想要的高质量图像。

0 阅读:6