MENÜ MENÜ

Das neue AI DALL-E 2 erstellt Bilder aus Texteingabeaufforderungen

Ein neues KI-System kann aus Beschreibungen in natürlicher Sprache eine Vielzahl realistischer und surrealer Bilder erstellen. Es hat das Potenzial, das Spiel zu verändern, aber nicht ohne Bedenken.

Algorithmen und KI schlagen weiterhin Wellen in der Kunstindustrie.

Der neueste Durchbruch kommt von einem Forschungsteam namens OpenAI, das gerade eine neue Version seines DALL-E-Programms vorgestellt hat. Diese Software ist ein Text-zu-Bild-Generierungstool, das Kunstwerke basierend auf einer vom Benutzer eingegebenen Beschreibung erstellt.

 

Sieh diesen Beitrag auf Instagram

 

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Diese neue KI mit dem treffenden Namen DALL-E 2 wird der Öffentlichkeit nicht zugänglich sein, aber Forscher können sich anmelden, um eine Vorschau ihrer Fähigkeiten zu erhalten. OpenAI plant, seine Software irgendwann für die Verwendung in Apps von Drittanbietern verfügbar zu machen – obwohl kein Wort darüber bekannt ist, wann dies geschehen wird.

Vorerst wird das Programm von geprüften Partnern getestet.

Benutzer dürfen keine generierten Bilder hochladen, die „Schäden anrichten“ könnten, und müssen offenlegen, wofür sie die KI verwenden.


Wie funktioniert DALL-E 2?

Ich bin zwar kein Programmierexperte, aber ich kann Bestätigen Sie, dass DALL-E 2 mit einer vorgefertigten Bildbibliothek arbeitet. Der Algorithmus erhält eine Fülle von markierten Bildern und erstellt dann basierend auf dem, was er bereits weiß, neue Kunstwerke.

Angenommen, Sie wollten ein Bild von einem Tiger auf einem Kanu erstellen. Verrückt oder? Aber DALL-E 2 wird seine Dateien durchsuchen, um herauszufinden, wie ein „Kanu“ und ein „Tiger“ aussehen, und ein einziges Stück schaffen, das beide überzeugend kombiniert.

 

Sieh diesen Beitrag auf Instagram

 

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

DALL-E 2 baut auf dem CLIP der ersten Iteration auf, einem Computer-Vision-System. OpenAI sagt, dass diese neue Software Bilder durch „Diffusion“ erzeugt, wobei ein Stück mit ein paar Punkten beginnt und allmählich mit Details gefüllt wird.

Dieser Prozess erfolgt über ein zweistufiges Modell. CLIP gleicht Ihren Text zunächst mit anderen vorhandenen Fotos und Bildern ab, dann generiert ein „Decoder“ das Bild selbst.

Das obige Video zeigt kurz, was möglich ist, und zeigt KI-generierte Katzen, realistisch bearbeitete Versionen bereits vorhandener Bilder und ein komplexes System der Objektkennzeichnung, mit dem DALL-E 2 Ihre Eingabeaufforderungen verstehen kann. Es ist wirklich beeindruckendes Zeug.

Interessanterweise betont OpenAI, dass es immer noch Fehler und Probleme gibt, die ausgebügelt werden müssen.

 

Sieh diesen Beitrag auf Instagram

 

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Falsch beschriftete Objekte können dazu führen, dass der Algorithmus falsche Bilder erzeugt, die nicht mit der bereitgestellten Textbeschreibung übereinstimmen. Wenn in seiner Codierung beispielsweise ein bereits vorhandenes Foto eines Autos mit der Aufschrift „Flugzeug“ vorhanden ist, kann dies den Generator völlig vom Kurs abbringen und einen BMW statt einer Boeing zurückschicken.

Außerdem sind sehr spezifische Eingabeaufforderungen erst möglich, wenn die KI die relevanten Objekte gekennzeichnet und gelernt hat.

Die Frage nach einer Stadt oder einer seltenen Tierart kann zu wackeligen, falschen Bildern führen, bis der Algorithmus verbessert wurde. Denken Sie daran, dass dies erst die zweite Iteration von DALL-E ist, daher werden wir in Zukunft zweifellos noch mehr umwerfende Demos sehen.


Warum könnte dies Künstlern Probleme bereiten?

Nachdem Sie die von DALL-E 2 erstellten Kunstwerke gelesen haben, ist es schwer, nicht von den Möglichkeiten der Technologie begeistert zu sein.

Wir sollten jedoch auf mögliche Fallstricke achten. Künstler haben es im Internetzeitalter bereits sehr schwer, Geld für ihre Arbeit zu verdienen – daher der ursprüngliche Grund für NFTs – und ein neues algorithmusbasiertes Bildtool könnte viele kleine digitale Illustratoren aus dem Geschäft drängen.

 

Sieh diesen Beitrag auf Instagram

 

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Es wird auch viel schwieriger, die Echtheit eines Bildes oder Gemäldes online zu überprüfen, und kann die Arbeit echter Menschen entwerten. Instant Image Minting könnte eine Möglichkeit werden und einen noch ausbeuterischeren NFT-Markt schaffen.

Wenn jeder alles sofort machen kann, verlieren dann Illustrationen und Gemälde ihren kommerziellen Wert? Wird die Kunst selbst einfach zu einer weiteren Anwendung oder einem Werkzeug, das jeder benutzen kann?

 

Sieh diesen Beitrag auf Instagram

 

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Es gibt große, existenzielle Fragen zu den Auswirkungen einer solchen wirklich bahnbrechenden Software, auf die wir auf viele keine Antworten haben.

Offenbar zur Ehre von OpenAI der Gefahren sehr bewusst. Darin heißt es, dass DALL-E 2 der Öffentlichkeit niemals vollständig zur Verfügung stehen wird und nur langsam auf der Grundlage von Feedback an vertrauenswürdige Forscher und Partner ausgerollt wird. Benutzer müssen angeben, warum sie die Software verwenden, und dürfen keine obszönen oder schädlichen Bilder erstellen.

Sie will sicherstellen, dass Fehlinformationen oder Deep-Fake-Bilder nicht dazu führen, dass unsere politischen Systeme und auch der Online-Diskurs weiter verwüstet werden.

 

Sieh diesen Beitrag auf Instagram

 

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Diese Absichten mögen vernünftig genug sein, aber wer sagt, dass andere, weniger wohlmeinende Programmierer nicht einfach die Arbeit von OpenAI kopieren werden? Wir haben bereits letztes Jahr eine Anwendung namens Wombo's Dream gesehen, die eindeutig auf diesem Konzept basiert.

Sie können darauf zugreifen jetzt sofort – obwohl es weitaus weniger anspruchsvoll ist als DALL-E 2.

Letztendlich haben wir keine Ahnung, wie sich diese Technologie auf die Kunstwelt auswirken könnte. Was wir do wissen ist, dass es unheimlich beeindruckend wird, vielleicht sogar ein kleines unheimliches Tal. Im Moment scheint OpenAI seine Produkte verantwortungsbewusst auf den Markt zu bringen – und das ist das Beste, worauf wir in diesem frühen Stadium hoffen können.

Zugänglichkeit