新しいAIシステムは、自然言語の記述からリアルとシュールの両方のさまざまな画像を作成できます。 それはゲームを変える可能性がありますが、いくつかの懸念がないわけではありません。
アルゴリズムとAIは、アート業界全体に波を起こし続けています。
最新のブレークスルーは、OpenAIと呼ばれる研究チームからのものです。OpenAIは、DALL-Eプログラムの新しいバージョンを発表したばかりです。 このソフトウェアは、ユーザーが入力した説明に基づいてアートワークを生成するテキストから画像への生成ツールです。
この記事をInstagramで見る
適切にDALL-E2と呼ばれるこの新しいAIは一般に公開されませんが、研究者はその機能をプレビューするためにサインアップできます。 OpenAIは、ソフトウェアを最終的にサードパーティのアプリで使用できるようにする予定であると述べていますが、これがいつ行われるかについては何も発表されていません。
今のところ、プログラムは精査されたパートナーによってテストされます。
ユーザーは、「害を及ぼす」可能性のある生成された画像をアップロードすることは許可されておらず、AIの使用目的を開示する必要があります。
DALL-E 2はどのように機能しますか?
私は決してコーディングの専門家ではありませんが、 できる DALL-E2がビルド済みのイメージライブラリを使用して動作することを確認します。 アルゴリズムにはタグ付けされた豊富な画像が与えられ、それがすでに知っていることに基づいて新しいアートワークを作成します。
カヌーに乗った虎の画像を作成したいとします。 変だよね? しかし、DALL-E 2はファイルを検索して、「カヌー」と「トラ」の両方がどのように見えるかを見つけ、両方を納得のいくように組み合わせた単一のピースを作成します。
この記事をInstagramで見る
DALL-E 2は、コンピュータービジョンシステムである最初のイテレーションのCLIPに基づいて構築されています。 OpenAIによると、この新しいソフトウェアは「拡散」を使用して画像を生成します。これにより、ピースは数ドットで始まり、徐々に詳細が入力されます。
このプロセスは、XNUMX段階のモデルを介して行われます。 CLIPは最初にテキストを他の既存の写真や画像と照合し、次に「デコーダー」が画像自体を生成します。
上記のビデオでは、AIで生成された猫、既存の画像のリアルに編集されたバージョン、DALL-E 2がプロンプトを理解できるようにするオブジェクトラベリングの複雑なシステムを紹介し、可能なことを簡単に説明しています。 それは本当に印象的なものです。
興味深いことに、OpenAIは、解決すべきエラーや問題がまだあることを強調しています。
この記事をInstagramで見る
誤ったラベルが付けられたオブジェクトは、アルゴリズムが提供されたテキストの説明と一致しない誤った画像を生成する原因となる可能性があります。 たとえば、コーディング内に「飛行機」というラベルの付いた車の既存の写真がある場合、これにより発電機が完全にコースから外れ、ボーイングの代わりにBMWが返送される可能性があります。
さらに、AIがラベルを付けて、関連するオブジェクトが何であるかを学習するまで、非常に具体的なプロンプトを表示することはできません。
町や希少種の動物を求めると、アルゴリズムが改善されるまで、画像が不安定で不正確になる可能性があります。 これはDALL-EのXNUMX回目の反復にすぎないことを覚えておいてください。したがって、今後さらに多くの心を曲げるデモが見られることは間違いありません。