新しいAIDALL-E2は、テキストプロンプトから画像を作成します

文化
設計
14年2022月XNUMX日に投稿

クレジット：OpenAI

By チャーリー・クームズ

ロンドン、イギリス

2 エネルギー + エネルギーを追加する

0コメント

新しいAIシステムは、自然言語の記述からリアルとシュールの両方のさまざまな画像を作成できます。それはゲームを変える可能性がありますが、いくつかの懸念がないわけではありません。

アルゴリズムとAIは、アート業界全体に波を起こし続けています。

最新のブレークスルーは、OpenAIと呼ばれる研究チームからのものです。OpenAIは、DALL-Eプログラムの新しいバージョンを発表したばかりです。このソフトウェアは、ユーザーが入力した説明に基づいてアートワークを生成するテキストから画像への生成ツールです。

この記事をInstagramで見る

OpenAI（@openaidalle）によるDALL・Eによって共有された投稿

適切にDALL-E2と呼ばれるこの新しいAIは一般に公開されませんが、研究者はその機能をプレビューするためにサインアップできます。 OpenAIは、ソフトウェアを最終的にサードパーティのアプリで使用できるようにする予定であると述べていますが、これがいつ行われるかについては何も発表されていません。

今のところ、プログラムは精査されたパートナーによってテストされます。

ユーザーは、「害を及ぼす」可能性のある生成された画像をアップロードすることは許可されておらず、AIの使用目的を開示する必要があります。

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

DALL-E 2はどのように機能しますか？

私は決してコーディングの専門家ではありませんが、 できる DALL-E2がビルド済みのイメージライブラリを使用して動作することを確認します。アルゴリズムにはタグ付けされた豊富な画像が与えられ、それがすでに知っていることに基づいて新しいアートワークを作成します。

カヌーに乗った虎の画像を作成したいとします。変だよね？しかし、DALL-E 2はファイルを検索して、「カヌー」と「トラ」の両方がどのように見えるかを見つけ、両方を納得のいくように組み合わせた単一のピースを作成します。

この記事をInstagramで見る

OpenAI（@openaidalle）によるDALL・Eによって共有された投稿

DALL-E 2は、コンピュータービジョンシステムである最初のイテレーションのCLIPに基づいて構築されています。 OpenAIによると、この新しいソフトウェアは「拡散」を使用して画像を生成します。これにより、ピースは数ドットで始まり、徐々に詳細が入力されます。

このプロセスは、XNUMX段階のモデルを介して行われます。 CLIPは最初にテキストを他の既存の写真や画像と照合し、次に「デコーダー」が画像自体を生成します。

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

上記のビデオでは、AIで生成された猫、既存の画像のリアルに編集されたバージョン、DALL-E 2がプロンプトを理解できるようにするオブジェクトラベリングの複雑なシステムを紹介し、可能なことを簡単に説明しています。それは本当に印象的なものです。

興味深いことに、OpenAIは、解決すべきエラーや問題がまだあることを強調しています。

この記事をInstagramで見る

OpenAI（@openaidalle）によるDALL・Eによって共有された投稿

誤ったラベルが付けられたオブジェクトは、アルゴリズムが提供されたテキストの説明と一致しない誤った画像を生成する原因となる可能性があります。たとえば、コーディング内に「飛行機」というラベルの付いた車の既存の写真がある場合、これにより発電機が完全にコースから外れ、ボーイングの代わりにBMWが返送される可能性があります。

さらに、AIがラベルを付けて、関連するオブジェクトが何であるかを学習するまで、非常に具体的なプロンプトを表示することはできません。

町や希少種の動物を求めると、アルゴリズムが改善されるまで、画像が不安定で不正確になる可能性があります。これはDALL-EのXNUMX回目の反復にすぎないことを覚えておいてください。したがって、今後さらに多くの心を曲げるデモが見られることは間違いありません。

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

How does DALL·E 2 work? (OpenAI text-to-image model explained) (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

なぜこれがアーティストに問題を引き起こす可能性がありますか？

DALL-E 2で作成されたアートワークを熟読した後、テクノロジーの可能性に興奮するのは難しいことです。

ただし、潜在的な落とし穴に注意する必要があります。アーティストは、インターネット時代の仕事でお金を稼ぐのにすでに非常に苦労しています。したがって、NFTの最初の理由です。新しいアルゴリズムベースの画像ツールは、多くの短時間のデジタルイラストレーターを廃業させる可能性があります。

この記事をInstagramで見る

OpenAI（@openaidalle）によるDALL・Eによって共有された投稿

また、オンラインで画像や絵画の信憑性を確認することは非常に困難になり、本物の人間の仕事を切り下げる可能性があります。インスタント画像ミンティングが可能になり、さらに搾取的なNFT市場が生まれる可能性があります。

誰もがすぐに何かを作れるとしたら、イラストや絵画は商業的価値をすべて失ってしまうのでしょうか？アート自体は、誰もが使用できる単なる別のアプリケーションまたはツールになりますか？

この記事をInstagramで見る

OpenAI（@openaidalle）によるDALL・Eによって共有された投稿

そのような真に画期的なソフトウェアの意味については、実存的な大きな疑問がありますが、その多くには答えがありません。

OpenAIの功績によると、危険をよく知っている。 DALL-E 2が完全に一般に公開されることはなく、フィードバックに基づいて信頼できる研究者やパートナーにゆっくりと展開されるだけであると書かれています。ユーザーは、ソフトウェアを使用している理由を説明する必要があり、わいせつまたは有害な画像を作成することはできません。

誤った情報や偽造された画像が、私たちの政治システムやオンラインの言説にさらなる混乱を引き起こさないようにしたいのです。

この記事をInstagramで見る

OpenAI（@openaidalle）によるDALL・Eによって共有された投稿

これらの意図は十分に聞こえるかもしれませんが、他のあまり意味のないコーダーがOpenAIの作業を単純にコピーしないと誰が言うのでしょうか。明らかにこの概念に基づいた、昨年のWombo'sDreamのリリースと呼ばれるXNUMXつのアプリケーションをすでに見ました。

あなたはそれにアクセスすることができますたった今 –ただし、DALL-E2よりもはるかに洗練されていません。

最終的に、このテクノロジーがアートの世界にどのような影響を与えるかはわかりません。私たちが何をしたかo 物事が恐ろしく印象的になっていることを知っています、おそらく少し不気味の谷ですら。今のところ、OpenAIは責任を持って製品を展開しているようです。これは、この初期段階で期待できる最善の方法です。

チャーリー・クームズ

編集長ロンドン、イギリス

私は、Thred の編集長である Charlie (He/Him) です。私はバーミンガム大学で英語を学び、音楽とゲームの愛好家であり、ポップカルチャーのオタクです。木曜日にプレイリストをキュレーションしたり、記事の見出し画像をデザインしたり、サイダーをすすったりしています。私に従ってください Twitter, LinkedIn いくつかのアイデア/フィードバックを介して私にドロップします email.

より多くのthredから。

クレジット：Thred

オフビート

「バイオニック・アイ」がプラトンの永眠場所の謎を解く

イタリアの研究者グラツィアーノ・ラノッキアは、プラトンの終焉の地の謎をついに解明したかもしれない。 AIを活用した「バイオニック・アイ」は、紀元前2,000年頃に書かれた348年前の炭化した巻物をスキャンし、アテネの特定の場所を特定した。世界最高の哲学者の一人が眠る謎が、皮肉にも機械によって解明されたのかもしれない。おそらくギリシャ哲学の基礎的な思想家の中で最も尊敬されているプラトンの埋葬...

By ジェイミー・ワッツロンドン、イギリス

クレジット：Pexels

メディア

ネイチャーは正式にミュージシャンになった

新しいキャンペーンの一環として、nature は Spotify を含む主要なストリーミングプラットフォームでアーティストとして認められました。ロイヤルティは、世界中の気候変動対策の取り組みを支援するために使われます。気温は上昇し、生息地は減少し、氷河は前例のない速度で溶けています。気候が変化するにつれて、地球の苦しみは新たなレベルに達し続けており、それに対して何かをする時間がなくなってきているという現実が見えてきます...

By ソフィアフィリップスロンドン、イギリス

クレジット：Thred

オフビート

「死んだインターネット理論」とは何ですか? それは本当ですか?

2022 年以降の AI の絶え間ない成長に伴い、いわゆる「死んだインターネット理論」を巡る陰謀が強まっています。まず第一に、それは一体何なのか、そして信憑性はあるのでしょうか？これは、迷う価値のあるオンラインのウサギの穴ですか?ティーカップの中の純粋な嵐ですか？この記事も人間が書いたのでしょうか？非常に多くの質問。 Twitter (X) にかなりの時間を費やした場合...

By ジェイミー・ワッツロンドン、イギリス

クレジット：Unsplash

オフビート

「成人ギャップイヤー」とは何ですか?なぜ増加しているのでしょうか?

最も一般的には、20 代や XNUMX 代前半の人にとって、すべてを保留して世界を旅するという大学入学前の通過儀礼が、大人になってからの容赦ない生活からの脱却を求める古い世代の間で急速にトレンドになりつつあります。通常、ギャップイヤーは成人の瀬戸際と関連付けられており、旅行やボランティア活動などを行う時間とリソースがある人にとっては成長の期間です。

By ソフィアフィリップスロンドン、イギリス