paint-brush
AI 文本提示简单指南:准确告诉 AI 你想看什么经过@claidai
23,435 讀數
23,435 讀數

AI 文本提示简单指南:准确告诉 AI 你想看什么

经过 Sofiia Shvets6m2023/02/06
Read on Terminal Reader

太長; 讀書

AI 图像生成的提示是文本或视觉命令,它们指示 AI 平台创建的图像。您会发现两种不同的图像生成提示类型:文本和图像。你今天在市场上找到的大多数人工智能图像生成器都是基于文本的,带有一些图像提示选项。
featured image - AI 文本提示简单指南:准确告诉 AI 你想看什么
Sofiia Shvets HackerNoon profile picture

本指南将涵盖使用文本提示的基础知识,以及如何有效地利用它们来呈现您设想的图像。

外卖

  • AI 图像生成器的提示可以是基于文本和基于图像的,在某些情况下,可以是两者的混合


  • AI 图像生成器的文本提示的一般结构全面相似,描述符的字数和顺序也是如此。


  • 文本提示的不同元素对渲染有独特的影响,并增加了图像的复杂性。

什么是提示?

AI 图像生成的提示是文本或视觉命令,它们指示 AI 平台创建的图像。通常,您会发现两种不同的图像生成提示类型:文本和图像。

文字提示

要告诉 AI 渲染什么样的图像,您应该首先描述该图像。这是通过文本提示完成的,它是一个单词列表,有时甚至是一个语法正确的句子,描述了 AI 应该呈现的内容。

Let's Enhance Image Generator 使用文本提示来渲染图像


突出显示的文本框是一个示例文本提示,用于使用 Let's Enhance Image Generator 使用 AI 渲染图像.根据您使用的渲染平台,相同的文本提示会产生不同的结果。

图片提示

在某些情况下,当文本不够时,您可以将图像上传到 AI 图像生成器,并将其用作创建其他图像的参考。根据您使用的 AI 平台类型和您需要的结果类型,使用图像提示可能比文本更有效。

原作:约翰内斯·维米尔 (Johannes Vermeer) 的《戴珍珠耳环的少女》作画:奥古斯特·坎普 (August Kamp)


例如,DALL.E 的 Outpainting AI 可以获取现有图像并渲染其延续。上图展示了 AI 认为是著名的约翰内斯·维米尔 (Johannes Vermeer) 画作《戴珍珠耳环的少女》的延续。


这幅画的原始图像在广场内,周围的一切都是由 DALL.E 渲染的。

两者的混合

虽然您今天在市场上找到的大多数 AI 图像生成器都是基于文本的,并带有一些图像提示选项,但有一些方法可以混合使用这两种提示来渲染所需的图像。

编写图像生成提示

您必须牢记的一个非常重要的细节是了解特定 AI 图像生成器的专长以及如何有效地使用它。一些 AI 图像生成器,例如 Dall-E 系列,非常擅长渲染模仿照片写实的图像。


另一方面,有 Midjourney,它以在数字艺术或插图格式中非常有效而闻名。


我们自己的 Let's Enhance Image Generator 非常擅长模拟产品图像的视觉美感,此外还可以渲染逼真的图像、插图和 3D 模型。


字数统计:至少使用 3-7 个字

虽然大多数 AI 图像生成器对文本提示都有字符数限制,但没有字数限制。这意味着您可以自由地以任何您想要的方式构建文本提示。


然而,目前的共识似乎是,您需要 3-7 个单词才能编写成功的文本提示,以便 AI 渲染。


使用 Let's Enhance Image Generator 渲染

这是上面示例中文本提示的渲染图像。 “广角镜头”提示显着影响了左栏中的图像。


您不必严格遵守此规则,可以使用少于 3 个或多于 7 个单词。但正如您将在下面的示例中看到的那样,重要的不是单词的数量,而是您使用的单词。

主题:谁和什么

任何 AI 图像渲染都需要某种主题。这应该是您在文本提示中写的第一件事(在大多数情况下)。可以只在文本提示中留下一个主题,让 AI 生成更通用的内容。


但是,在大多数情况下,您将需要更具描述性的文本提示来生成与您要呈现的内容尽可能接近的图像。


主题通常是名词,因此无论您使用的是哪种 AI,从文本提示开始的最佳位置都是从一个开始。

描述:他们在做什么、在哪里以及如何做

要为您的渲染图像添加更多细微差别并帮助 AI 缩小要用作参考的图像范围,您需要使用描述。这些是你的形容词,就像你在任何普通句子中使用它们一样,它们描述了主题。


在 AI 图像生成中使用形容词的诀窍在于,您可以组合其中的几个来为图像增加更多深度和复杂性。


除了描述主题的形容词外,描述的另一个元素是回答问题的细节,例如:


  • 怎么了?
  • 主题在做什么?
  • 主题如何做到这一点?
  • 围绕这个主题发生了什么?


最后一个问题非常重要,因为背景在有效描述中起着关键作用。下面是两个相似的文本提示产生截然不同的结果的示例。左边图片的文字提示是Raccoon reading


然而,正确图像的文本提示稍微更详细一些;因此,为什么图像变得更清晰、更复杂:浣熊在图书馆看书的特写照片。

使用 Let's Enhance Image Generator 渲染


正如您从结果中看到的那样,我们回答了几个问题,并且 AI 能够缩小我们正在寻找的范围,并呈现出尽可能接近我们正在寻找的内容。人工智能能够生成具有更多细节和更少异常的图像。


这是另一个很好的例子,说明 AI 图像生成器如何更好地处理更详细的图像提示。


使用稳定扩散渲染

这张生成的雀科图像展示了 AI 如何在没有额外描述符的情况下渲染出通用但非常准确的图像。


但是,右侧的渲染演示了 AI 图像生成器(在本例中为 Stable Diffusion)如何处理更多元素以渲染更复杂的视觉效果。

审美与风格:外观

要完成文本提示,您还必须添加一些文本提示,这将对渲染图像进行画龙点睛。请注意,在上面的文本提示的末尾,我们如何使用“照片”和“关闭”等词。


提示中的最后一句话将决定图像的整体美感和风格。


你可以用“油画”、“壁画”或“3D 渲染”代替“照片”。要决定图像的风格,您还可以使用印象派、哥特式、蒸汽朋克等艺术运动。


此外,如果您想复制一位著名艺术家的作品,您甚至可以在文本提示中输入一个或多个著名的名字。人工智能将结合各种著名艺术家的影响,创造出融合了所有艺术家元素的东西。


最后,您还可以指定图像的框架。诸如“特写”或“中景”之类的提示,就像您在摄影中的做法一样,可以帮助 AI 了解您希望从什么角度以及从什么距离呈现图像。


使用 Lexica 渲染

下面是 Lexica 为手持计算机设备生成的两个图像的示例。左侧的提示虽然简单,但能够生成甚至复制老式 LCD 显示屏的老式设备。


然而,由于“蒸汽波美学”和“产品摄影”等提示,右侧的渲染具有更明确的视觉美学和风格,正如您可以通过霓虹灯颜色看出的那样。

经验是最好的老师

没有多少提示和技巧比经验更能教您如何编写有效的 AI 提示。 AI 图像生成器最好的部分是它们非常易于访问。您所需要的只是互联网连接,您可以从许多可用的免费平台中进行选择。


因此,走出去尝试 AI 图像提示,看看您可以在新兴的图像生成领域中发现哪些新奇有趣的东西。