Das neue AI DALL-E 2 erstellt Bilder aus Texteingabeaufforderungen

KULTUR
Design
Veröffentlicht am 14. April 2022

Bildnachweis: OpenAI

By Charlie Coombs

London, Vereinigtes Königreich

2 Energie + Energie hinzufügen

0 Kommentare

Ein neues KI-System kann aus Beschreibungen in natürlicher Sprache eine Vielzahl realistischer und surrealer Bilder erstellen. Es hat das Potenzial, das Spiel zu verändern, aber nicht ohne Bedenken.

Algorithmen und KI schlagen weiterhin Wellen in der Kunstindustrie.

Der neueste Durchbruch kommt von einem Forschungsteam namens OpenAI, das gerade eine neue Version seines DALL-E-Programms vorgestellt hat. Diese Software ist ein Text-zu-Bild-Generierungstool, das Kunstwerke basierend auf einer vom Benutzer eingegebenen Beschreibung erstellt.

Sieh diesen Beitrag auf Instagram

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Diese neue KI mit dem treffenden Namen DALL-E 2 wird der Öffentlichkeit nicht zugänglich sein, aber Forscher können sich anmelden, um eine Vorschau ihrer Fähigkeiten zu erhalten. OpenAI plant, seine Software irgendwann für die Verwendung in Apps von Drittanbietern verfügbar zu machen – obwohl kein Wort darüber bekannt ist, wann dies geschehen wird.

Vorerst wird das Programm von geprüften Partnern getestet.

Benutzer dürfen keine generierten Bilder hochladen, die „Schäden anrichten“ könnten, und müssen offenlegen, wofür sie die KI verwenden.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

Wie funktioniert DALL-E 2?

Ich bin zwar kein Programmierexperte, aber ich kann Bestätigen Sie, dass DALL-E 2 mit einer vorgefertigten Bildbibliothek arbeitet. Der Algorithmus erhält eine Fülle von markierten Bildern und erstellt dann basierend auf dem, was er bereits weiß, neue Kunstwerke.

Angenommen, Sie wollten ein Bild von einem Tiger auf einem Kanu erstellen. Verrückt oder? Aber DALL-E 2 wird seine Dateien durchsuchen, um herauszufinden, wie ein „Kanu“ und ein „Tiger“ aussehen, und ein einziges Stück schaffen, das beide überzeugend kombiniert.

Sieh diesen Beitrag auf Instagram

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

DALL-E 2 baut auf dem CLIP der ersten Iteration auf, einem Computer-Vision-System. OpenAI sagt, dass diese neue Software Bilder durch „Diffusion“ erzeugt, wobei ein Stück mit ein paar Punkten beginnt und allmählich mit Details gefüllt wird.

Dieser Prozess erfolgt über ein zweistufiges Modell. CLIP gleicht Ihren Text zunächst mit anderen vorhandenen Fotos und Bildern ab, dann generiert ein „Decoder“ das Bild selbst.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

Das obige Video zeigt kurz, was möglich ist, und zeigt KI-generierte Katzen, realistisch bearbeitete Versionen bereits vorhandener Bilder und ein komplexes System der Objektkennzeichnung, mit dem DALL-E 2 Ihre Eingabeaufforderungen verstehen kann. Es ist wirklich beeindruckendes Zeug.

Interessanterweise betont OpenAI, dass es immer noch Fehler und Probleme gibt, die ausgebügelt werden müssen.

Sieh diesen Beitrag auf Instagram

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Falsch beschriftete Objekte können dazu führen, dass der Algorithmus falsche Bilder erzeugt, die nicht mit der bereitgestellten Textbeschreibung übereinstimmen. Wenn in seiner Codierung beispielsweise ein bereits vorhandenes Foto eines Autos mit der Aufschrift „Flugzeug“ vorhanden ist, kann dies den Generator völlig vom Kurs abbringen und einen BMW statt einer Boeing zurückschicken.

Außerdem sind sehr spezifische Eingabeaufforderungen erst möglich, wenn die KI die relevanten Objekte gekennzeichnet und gelernt hat.

Die Frage nach einer Stadt oder einer seltenen Tierart kann zu wackeligen, falschen Bildern führen, bis der Algorithmus verbessert wurde. Denken Sie daran, dass dies erst die zweite Iteration von DALL-E ist, daher werden wir in Zukunft zweifellos noch mehr umwerfende Demos sehen.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

How does DALL·E 2 work? (OpenAI text-to-image model explained) (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

Warum könnte dies Künstlern Probleme bereiten?

Nachdem Sie die von DALL-E 2 erstellten Kunstwerke gelesen haben, ist es schwer, nicht von den Möglichkeiten der Technologie begeistert zu sein.

Wir sollten jedoch auf mögliche Fallstricke achten. Künstler haben es im Internetzeitalter bereits sehr schwer, Geld für ihre Arbeit zu verdienen – daher der ursprüngliche Grund für NFTs – und ein neues algorithmusbasiertes Bildtool könnte viele kleine digitale Illustratoren aus dem Geschäft drängen.

Sieh diesen Beitrag auf Instagram

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Es wird auch viel schwieriger, die Echtheit eines Bildes oder Gemäldes online zu überprüfen, und kann die Arbeit echter Menschen entwerten. Instant Image Minting könnte eine Möglichkeit werden und einen noch ausbeuterischeren NFT-Markt schaffen.

Wenn jeder alles sofort machen kann, verlieren dann Illustrationen und Gemälde ihren kommerziellen Wert? Wird die Kunst selbst einfach zu einer weiteren Anwendung oder einem Werkzeug, das jeder benutzen kann?

Sieh diesen Beitrag auf Instagram

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Es gibt große, existenzielle Fragen zu den Auswirkungen einer solchen wirklich bahnbrechenden Software, auf die wir auf viele keine Antworten haben.

Offenbar zur Ehre von OpenAI der Gefahren sehr bewusst. Darin heißt es, dass DALL-E 2 der Öffentlichkeit niemals vollständig zur Verfügung stehen wird und nur langsam auf der Grundlage von Feedback an vertrauenswürdige Forscher und Partner ausgerollt wird. Benutzer müssen angeben, warum sie die Software verwenden, und dürfen keine obszönen oder schädlichen Bilder erstellen.

Sie will sicherstellen, dass Fehlinformationen oder Deep-Fake-Bilder nicht dazu führen, dass unsere politischen Systeme und auch der Online-Diskurs weiter verwüstet werden.

Sieh diesen Beitrag auf Instagram

Ein von DALL·E von OpenAI geteilter Beitrag (@openaidalle)

Diese Absichten mögen vernünftig genug sein, aber wer sagt, dass andere, weniger wohlmeinende Programmierer nicht einfach die Arbeit von OpenAI kopieren werden? Wir haben bereits letztes Jahr eine Anwendung namens Wombo's Dream gesehen, die eindeutig auf diesem Konzept basiert.

Sie können darauf zugreifen jetzt sofort – obwohl es weitaus weniger anspruchsvoll ist als DALL-E 2.

Letztendlich haben wir keine Ahnung, wie sich diese Technologie auf die Kunstwelt auswirken könnte. Was wir do wissen ist, dass es unheimlich beeindruckend wird, vielleicht sogar ein kleines unheimliches Tal. Im Moment scheint OpenAI seine Produkte verantwortungsbewusst auf den Markt zu bringen – und das ist das Beste, worauf wir in diesem frühen Stadium hoffen können.

Charlie Coombs

Chefredakteur London, Vereinigtes Königreich

Ich bin Charlie (Er/Er), der Chefredakteur bei Thred. Ich habe Anglistik an der University of Birmingham studiert und bin als Musik- und Gaming-Enthusiast ein Nerd für Popkultur. Sie finden mich beim Kuratieren von Playlists, dem Entwerfen von Artikeltitelbildern und dem Schlürfen von Cider an einem Donnerstag. Folge mir auf Twitter, LinkedIn und schick mir ein paar Ideen/Feedback via E-Mail.

Mehr von thred.

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

Kredit: Thred

unkonventionell

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

Der italienische Forscher Graziano Ranocchia hat möglicherweise endlich das Rätsel um Platons letzte Ruhestätte gelöst. Ein KI-gestütztes „bionisches Auge“ scannte eine 2,000 Jahre alte verkohlte Schriftrolle, die um 348 v. Chr. geschrieben wurde und einen bestimmten Ort in Athen identifizierte. Das Rätsel, wo einer der größten Philosophen der Welt ruht, wurde möglicherweise gerade erst gelöst – ironischerweise durch eine Maschine. Das Begräbnis von Platon, dem wohl am meisten verehrten Grunddenker der griechischen Philosophie ...

By Jamie Watt London, Vereinigtes Königreich

Die Natur ist offiziell zum Musiker geworden

Bildnachweis: Pexels

Medien

Die Natur ist offiziell zum Musiker geworden

Im Rahmen einer neuen Kampagne wurde Nature auf großen Streaming-Plattformen, darunter Spotify, als Künstler ausgezeichnet. Die Lizenzgebühren fließen in die Unterstützung von Klimaschutzinitiativen auf der ganzen Welt. Die Temperaturen steigen, Lebensräume schrumpfen und die Gletscher schmelzen in beispiellosem Tempo. Während sich das Klima verändert, erreicht das Leid der Erde immer neue Ausmaße und die Realität, dass uns die Zeit davonläuft, etwas dagegen zu unternehmen, wird ...

By Sofia Phillips London, Vereinigtes Königreich

Was ist die „Dead-Internet-Theorie“ und ist sie real?

Kredit: Thred

unkonventionell

Was ist die „Dead-Internet-Theorie“ und ist sie real?

Mit dem unaufhörlichen Wachstum der KI seit 2022 sind die Verschwörungen rund um die sogenannte „Dead Internet Theory“ immer stärker geworden. Aber das Wichtigste zuerst: Was zum Teufel ist das und ist es glaubwürdig? Ist das ein Online-Kaninchenbau, in dem es sich zu verlieren lohnt? Ist es purer Sturm in einer Teetasse? Hat dieser Artikel überhaupt ein Mensch geschrieben? So viele Fragen. Wenn Sie längere Zeit auf Twitter verbringen (X) ...

By Jamie Watt London, Vereinigtes Königreich

Was sind „Adult Gap Years“ und warum nehmen sie zu?

Gutschrift: Unsplash

unkonventionell

Was sind „Adult Gap Years“ und warum nehmen sie zu?

Am häufigsten handelt es sich bei Teenagern und Menschen in ihren frühen Zwanzigern um einen Übergangsritus vor der Uni. Alles auf Eis zu legen, um die Welt zu bereisen, wird bei älteren Generationen, die eine Pause von der unerbittlichen Natur des Erwachsenenlebens suchen, schnell zum Trend. Ein Gap Year wird normalerweise mit der Schwelle zum Erwachsensein in Verbindung gebracht und ist eine Entwicklungsphase für diejenigen, die Zeit und Ressourcen haben, um zu reisen, sich ehrenamtlich zu engagieren usw.

By Sofia Phillips London, Vereinigtes Königreich

Ein neues KI-System kann aus Beschreibungen in natürlicher Sprache eine Vielzahl realistischer und surrealer Bilder erstellen. Es hat das Potenzial, das Spiel zu verändern, aber nicht ohne Bedenken.

Wie funktioniert DALL-E 2?

In Verbindung stehende Artikel

Wie kann Schlaf uns glücklicher machen?

BeReal ermutigt uns, damit aufzuhören, uns selbst online zu kuratieren

Warum könnte dies Künstlern Probleme bereiten?

Beliebt

Was ist die „Dead-Internet-Theorie“ und ist sie real?

Wird die Popmusik wirklich mit jedem neuen Jahrzehnt schlechter?

Russ Cook schließt seine Mission ab, ganz Afrika zu durchqueren

Bleiben Sie auf dem Laufenden, indem Sie sich für unseren planet-positiven Newsletter anmelden!

Mehr von thred.

„Bionisches Auge“ lüftet Rätsel um Platons letzte Ruhestätte

Die Natur ist offiziell zum Musiker geworden

Was ist die „Dead-Internet-Theorie“ und ist sie real?

Was sind „Adult Gap Years“ und warum nehmen sie zu?