paint-brush
Eine einfache Anleitung zu KI-Textaufforderungen: Sagen Sie der KI genau, was Sie sehen möchtenvon@claidai
23,435 Lesungen
23,435 Lesungen

Eine einfache Anleitung zu KI-Textaufforderungen: Sagen Sie der KI genau, was Sie sehen möchten

von Sofiia Shvets6m2023/02/06
Read on Terminal Reader
Read this story w/o Javascript

Zu lang; Lesen

Eingabeaufforderungen für die KI-Bildgenerierung sind Befehle, entweder in Textform oder visuell, die vorgeben, welches Bild die KI-Plattform erstellt. Es gibt zwei verschiedene Eingabeaufforderungstypen für die Bildgenerierung: Text und Bild. Die meisten KI-Bildgeneratoren, die Sie heute auf dem Markt finden, basieren auf Text und bieten einige Optionen für Bildaufforderungen.
featured image - Eine einfache Anleitung zu KI-Textaufforderungen: Sagen Sie der KI genau, was Sie sehen möchten
Sofiia Shvets HackerNoon profile picture

Dieser Leitfaden behandelt die Grundlagen der Arbeit mit Textaufforderungen und wie Sie diese effektiv nutzen können, um die Bilder darzustellen, die Sie sich vorgestellt haben.

Imbissbuden

  • Eingabeaufforderungen für KI-Bildgeneratoren können sowohl text- als auch bildbasiert sein und in einigen Fällen eine Mischung aus beidem


  • Die allgemeine Struktur von Textaufforderungen für KI-Bildgeneratoren ist durchweg ähnlich, ebenso wie die Wortanzahl und die Reihenfolge der Deskriptoren.


  • Verschiedene Elemente einer Textaufforderung haben einzigartige Auswirkungen auf die Darstellung und erhöhen die Komplexität des Bildes.

Was sind Eingabeaufforderungen?

Eingabeaufforderungen für die KI-Bildgenerierung sind Befehle, entweder in Textform oder visuell, die vorgeben, welches Bild die KI-Plattform erstellt. Typischerweise finden Sie zwei verschiedene Eingabeaufforderungstypen für die Bildgenerierung: Text und Bild.

Textaufforderungen

Um der KI mitzuteilen, welche Art von Bild gerendert werden soll, sollten Sie dieses Bild zunächst beschreiben. Dies geschieht mit einer Textaufforderung, bei der es sich um eine Liste von Wörtern, manchmal sogar um einen grammatikalisch korrekten Satz, handelt, die beschreibt, was die KI rendern soll.

Der Let’s Enhance Image Generator verwendet Textaufforderungen zum Rendern von Bildern


Das hervorgehobene Textfeld ist ein Beispiel für eine Textaufforderung Rendern Sie Bilder mit KI mithilfe des Let's Enhance Image Generator . Abhängig von der von Ihnen verwendeten Rendering-Plattform führen identische Textaufforderungen zu unterschiedlichen Ergebnissen.

Bildaufforderung

In manchen Fällen, wenn der Text nicht ausreicht, können Sie Bilder auf einen KI-Bildgenerator hochladen und ihn als Referenz für die Erstellung anderer Bilder verwenden. Abhängig von der Art der KI-Plattform, die Sie verwenden, und der Art der Ergebnisse, die Sie benötigen, kann die Verwendung von Bildaufforderungen sogar noch effektiver sein als die Verwendung von Text.

Original: Mädchen mit Perlenohrring von Johannes Vermeer, Außengemälde von August Kamp


Beispielsweise kann die Outpainting-KI von DALL.E ein vorhandenes Bild aufnehmen und dessen Fortsetzung rendern. Das Bild oben zeigt, was die KI für die Fortsetzung des berühmten Johannes Vermeer-Gemäldes „Mädchen mit dem Perlenohrring“ hält.


Das Originalbild des Gemäldes befindet sich innerhalb des Platzes und alles, was ihn umgibt, wurde von DALL.E gerendert.

Eine Mischung aus beidem

Während die meisten KI-Bildgeneratoren, die Sie heute auf dem Markt finden, textbasiert sind und einige Optionen für Bildaufforderungen bieten, gibt es Möglichkeiten, eine Mischung aus beiden Aufforderungen zu verwenden, um gewünschte Bilder zu rendern.

Schreiben einer Bildgenerierungsaufforderung

Ein sehr wichtiges Detail, das Sie beachten müssen, ist zu verstehen, worauf ein bestimmter KI-Bildgenerator spezialisiert ist und wie Sie ihn effektiv nutzen können. Einige KI-Bildgeneratoren wie die Dall-E-Serie sind sehr gut darin, Bilder zu rendern, die den Fotorealismus imitieren.


Auf der anderen Seite gibt es Midjourney, das dafür bekannt ist, in digitalen Kunst- oder Illustrationsformaten sehr effektiv zu sein.


Unser eigener Let's Enhance Image Generator eignet sich hervorragend zum Simulieren der visuellen Ästhetik von Produktbildern und zum Rendern fotorealistischer Bilder, Illustrationen und 3D-Modelle.


Wortanzahl: Verwenden Sie mindestens 3-7 Wörter

Während die meisten KI-Bildgeneratoren eine Zeichenbeschränkung für die Textaufforderungen haben, gibt es keine Wortbeschränkung. Das bedeutet, dass Sie die Freiheit haben, Ihre Textaufforderung nach Ihren Wünschen zu strukturieren.


Derzeit besteht jedoch Einigkeit darüber, dass Sie drei bis sieben Wörter benötigen, um eine erfolgreiche Textaufforderung zu schreiben, die von der KI gerendert werden soll.


Gerendert mit Let’s Enhance Image Generator

Hier sind die gerenderten Bilder der Textaufforderung im obigen Beispiel. Die Eingabeaufforderung „Weitwinkelaufnahme“ hatte erhebliche Auswirkungen auf die Bilder in der linken Spalte.


Sie müssen sich nicht strikt an diese Regel halten und dürfen weniger als 3 oder mehr als 7 Wörter verwenden. Aber wie Sie in den folgenden Beispielen sehen werden, kommt es nicht so sehr auf die Anzahl der Wörter an, sondern darauf, welche Wörter Sie verwenden.

Betreff: Wer und Was

Für jedes KI-Bildrendering ist ein bestimmtes Motiv erforderlich. Dies sollte (in den meisten Fällen) das Erste sein, was Sie in die Textaufforderung schreiben. Es ist möglich, einfach einen einzelnen Betreff in der Textaufforderung zu belassen und die KI etwas Allgemeineres generieren zu lassen.


In den meisten Fällen benötigen Sie jedoch eine aussagekräftigere Textaufforderung, um ein Bild zu generieren, das dem, was Sie rendern wollten, möglichst nahe kommt.


Subjekte sind in der Regel Substantive. Daher ist es am besten, mit einer Textaufforderung zu beginnen, unabhängig davon, welche KI Sie verwenden.

Beschreibung: Was sie tun, wo und wie

Um Ihrem gerenderten Bild etwas mehr Nuancen zu verleihen und der KI dabei zu helfen, einzugrenzen, welche Bilder als Referenz verwendet werden sollen, müssen Sie Beschreibungen verwenden. Dies sind Ihre Adjektive, und ähnlich wie Sie sie in jedem gewöhnlichen Satz verwenden würden, beschreiben sie das Thema.


Der Trick bei der Verwendung von Adjektiven bei der KI-Bildgenerierung besteht darin, dass Sie mehrere davon kombinieren können, um dem Bild mehr Tiefe und Komplexität zu verleihen.


Neben Adjektiven, die das Thema beschreiben, sind Details, die Fragen beantworten, ein weiteres Element der Beschreibung:


  • Was passiert?
  • Was macht das Subjekt?
  • Wie macht das Subjekt das?
  • Was passiert rund um das Thema?


Diese letzte Frage ist ziemlich wichtig, da Hintergründe eine Schlüsselrolle für wirkungsvolle Beschreibungen spielen. Hier ist ein Beispiel für zwei ähnliche Textaufforderungen, die zu völlig unterschiedlichen Ergebnissen führen. Die Textaufforderung für das Bild links war Raccoon reading .


Die Textaufforderung für das richtige Bild war jedoch etwas detaillierter; Daher wirkte das Bild klarer und komplexer: Waschbär liest ein Buch in einer Bibliotheksfoto-Nahaufnahme.

Gerendert mit Let’s Enhance Image Generator


Wie Sie an den Ergebnissen sehen können, haben wir mehrere Fragen beantwortet, und die KI konnte eingrenzen, wonach wir suchten, und etwas so nah wie möglich an das rendern, was wir suchten. Die KI konnte ein Bild mit mehr Details und weniger Anomalien erzeugen.


Hier ist ein weiteres großartiges Beispiel dafür, wie KI-Bildgeneratoren mit detaillierteren Bildaufforderungen besser funktionieren.


Mit Stable Diffusion gerendert

Dieses generierte Bild eines Finkens zeigt, wie KI auch ohne zusätzliche Deskriptoren ein generisches, aber sehr genaues Bild rendern kann.


Das Rendering auf der rechten Seite zeigt jedoch, wie KI-Bildgeneratoren, in diesem Fall Stable Diffusion, mit mehr Elementen arbeiten können, um ein deutlich komplexeres Bild zu rendern.

Ästhetik und Stil: Wie es aussieht

Um die Textaufforderung zu vervollständigen, müssen Sie noch einige weitere Textaufforderungen hinzufügen, die Ihrem gerenderten Bild den letzten Schliff geben. Beachten Sie, dass wir am Ende der Textaufforderung oben Wörter wie „Foto“ und „Nahaufnahme“ hatten.


Die letzten Worte in Ihrer Eingabeaufforderung bestimmen die Gesamtästhetik und den Stil Ihres Bildes.


Anstelle von „Foto“ hätten Sie auch „Ölgemälde“, „Fresko“ oder „3D-Rendering“ verwenden können. Um den Stil Ihres Bildes zu bestimmen, können Sie auch Kunstrichtungen wie Impressionismus, Gothic, Steampunk usw. verwenden.


Wenn Sie außerdem die Werke eines berühmten Künstlers nachbilden möchten, können Sie auch einen oder mehrere berühmte Namen in die Textaufforderung eingeben. Die KI wird Einflüsse verschiedener berühmter Künstler kombinieren, um etwas zu schaffen, das Elemente von allen vereint.


Schließlich können Sie auch den Bildausschnitt bestimmen. Eingabeaufforderungen wie „Nahaufnahme“ oder „mittlere Aufnahme“, ähnlich wie in der Fotografie, können der KI dabei helfen, zu verstehen, aus welchem Winkel und aus welcher Entfernung das Bild präsentiert werden soll.


Mit Lexica gerendert

Hier ist ein Beispiel für zwei von Lexica generierte Bilder eines Handheld-Computers. Die Eingabeaufforderung auf der linken Seite war zwar einfach, konnte jedoch ein Vintage-Gerät generieren, das sogar das LCD-Display der alten Schule nachbildet.


Allerdings hat die Darstellung auf der rechten Seite dank Eingabeaufforderungen wie „Vaporwave-Ästhetik“ und „Produktfotografie“ eine ausgeprägtere visuelle Ästhetik und einen klareren Stil, wie Sie an den Neonfarben erkennen können.

Erfahrung ist der beste Lehrer

Es gibt keine Tipps und Tricks, die Ihnen besser lehren, wie man effektive KI-Eingabeaufforderungen schreibt, als Erfahrung. Das Beste an KI-Bildgeneratoren ist, dass sie sehr zugänglich sind. Sie benötigen lediglich eine Internetverbindung und können aus den vielen verfügbaren kostenlosen Plattformen wählen.


Gehen Sie also raus und experimentieren Sie mit KI-Bildaufforderungen, um zu sehen, welche neuen und faszinierenden Dinge Sie im aufstrebenden Bereich der Bilderzeugung entdecken können.