Dall-E 2  – Bilder auf Knopfdruck in wenigen Sekunden

Prof. Dr. Gerald Lembke – 22.05.2022 – 06:13 Uhr

Die künstliche Intelligenz Dall-E 2 braucht nur ein bisschen Text, um daraus in wenigen Sekunden quadratische Bilder zu produzieren. Die Werke sehen aus wie Fotografien oder realitätsnahe Zeichnungen..

Was ist Dall-E 2?

DALL-E 2 ist ein neues KI-System, das aus einer Beschreibung in natürlicher Sprache realistische Bilder und Kunstwerke erstellen kann. Es kann Konzepte, Attribute und Stile kombinieren. DALL-E 2 kann aus einer natürlichsprachlichen Bildunterschrift realistische Bearbeitungen an bestehenden Bildern vornehmen.

Wie funktioniert Dall-E?

Es verwendet ein Verfahren namens „Diffusion“, das mit einem Muster aus zufälligen Punkten beginnt und dieses Muster allmählich in Richtung eines Bildes verändert, wenn es bestimmte Aspekte dieses Bildes erkennt. Im Januar 2021 stellte OpenAI DALL-E vor. Ein Jahr später erzeugt unser neuestes System, DALL-E 2, noch realistischere und genauere Bilder mit einer viermal höheren Auflösung.

Beispiel für die Erstellung von Ladenschildern

DALL-E bietet mit unterschiedlichem Zuverlässigkeitsgrad Zugang zu einer Teilmenge der Fähigkeiten einer 3D-Rendering-Engine über natürliche Sprache. Es kann die Attribute einer kleinen Anzahl von Objekten unabhängig steuern, und in begrenztem Umfang auch, wie viele es sind und wie sie zueinander angeordnet sind. Sie kann auch den Ort und den Winkel steuern, aus dem eine Szene gerendert wird, und sie kann bekannte Objekte in Übereinstimmung mit genauen Spezifikationen für Winkel und Lichtverhältnisse erzeugen.

Bedeutung für das Marketing

Diese Technologien bezieht die Aufmerksamkeit zwischen Text- und Bildmerkmalen mit ein und schlägt einen kontrastiven Verlust für die Übereinstimmung von Text und Bildmerkmalen als Hilfsziel vor. Dies kann für Brandingkampagnen genutzt werden, um zeitfressende Kreativitätsprozesse abzukürzen oder sie zu bereichern.

Das obige Bildbeispiel zeigt, wie mit wenig Text Außenwerbung für einen Laden erstellt werden kann. Es fehlen noch einfach anwendbare Apps für diesen Bereich. Es ist allerdings nur noch eine Frage der Zeit, bis diese Technologie in einfach anwendbare KI-Tools Eingang finden. Damit könnte das Marketing – im Besondere in den Kreativitätsprozessen – auf ein neues Level gehoben werden. Wir halten Sie auf dem Laufenden.

Google setzt noch einen drauf 

Google hat jüngst Imagen vorgestellt, ein KI-System, das Wortbeschreibungen in fotorealistische Bilder umwandelt. Der Text-Bild-Generator soll Bilder erzeugen, die realistischer und lebensechter wirken als OpenAIs DALL-E 2. Wie dieses KI-Modell hat Google es nicht der Öffentlichkeit zugänglich gemacht. Es soll nach Medienberichten noch zuverlässiger funktionieren als die bisher bekannten Beispiele.


Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert