menu menu

AI DALL-E 2 baru membuat gambar dari petunjuk teks

Sistem AI baru dapat membuat berbagai gambar baik realistis maupun surealis dari deskripsi bahasa alami. Ini memiliki potensi untuk mengubah permainan, tetapi bukan tanpa beberapa kekhawatiran.

Algoritma dan AI terus membuat gelombang di industri seni.

Terobosan terbaru datang dari tim peneliti bernama OpenAI, yang baru saja meluncurkan versi baru dari program DALL-E-nya. Perangkat lunak ini adalah alat pembuat teks-ke-gambar yang menghasilkan karya seni berdasarkan deskripsi yang dimasukkan pengguna.

 

Lihat posting ini di Instagram

 

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Disebut DALL-E 2, AI baru ini tidak akan tersedia untuk umum, tetapi para peneliti dapat mendaftar untuk melihat kemampuannya. OpenAI mengatakan pihaknya berencana untuk membuat perangkat lunaknya tersedia untuk digunakan di aplikasi pihak ketiga pada akhirnya – meskipun tidak ada kabar kapan ini akan terjadi.

Untuk saat ini, program tersebut akan diuji oleh mitra terverifikasi.

Pengguna tidak diizinkan untuk mengunggah gambar yang dihasilkan yang dapat 'menyebabkan bahaya', dan harus mengungkapkan untuk apa mereka menggunakan AI.


Bagaimana cara kerja DALL-E 2?

Meskipun saya sama sekali bukan ahli pengkodean, saya bisa konfirmasikan bahwa DALL-E 2 beroperasi menggunakan perpustakaan gambar yang dibuat sebelumnya. Algoritme diberikan banyak gambar yang ditandai dan kemudian membuat karya seni baru berdasarkan apa yang sudah diketahuinya.

Katakanlah Anda ingin membuat gambar harimau di atas sampan. Aneh, kan? Namun DALL-E 2 akan mencari file-nya untuk menemukan seperti apa 'kano' dan 'harimau', dan membuat satu bagian yang menggabungkan keduanya secara meyakinkan.

 

Lihat posting ini di Instagram

 

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

DALL-E 2 dibangun di atas CLIP iterasi pertama, sistem visi komputer. OpenAI mengatakan bahwa perangkat lunak baru ini menghasilkan gambar menggunakan 'difusi', di mana sepotong dimulai sebagai beberapa titik dan secara bertahap diisi dengan detail.

Proses ini terjadi melalui model dua tahap. CLIP pertama-tama mencocokkan teks Anda dengan foto dan gambar lain yang ada, kemudian 'decoder' menghasilkan gambar itu sendiri.

Video di atas memberikan demonstrasi singkat tentang apa yang mungkin, memamerkan kucing yang dihasilkan AI, versi gambar yang sudah ada sebelumnya yang diedit secara realistis, dan sistem pelabelan objek yang kompleks yang memungkinkan DALL-E 2 untuk memahami perintah Anda. Ini benar-benar hal yang mengesankan.

Menariknya, OpenAI menekankan bahwa masih ada kesalahan dan masalah yang harus diselesaikan.

 

Lihat posting ini di Instagram

 

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Objek yang salah label dapat menyebabkan algoritme menghasilkan gambar yang salah yang tidak sesuai dengan deskripsi teks yang diberikan. Jika dalam pengkodeannya memiliki foto mobil yang sudah ada sebelumnya yang diberi label sebagai 'pesawat', misalnya, maka ini dapat menyebabkan generator benar-benar keluar jalur, mengirim kembali BMW alih-alih Boeing.

Selain itu, permintaan yang sangat spesifik tidak mungkin dilakukan sampai AI memberi label dan mempelajari objek yang relevan.

Meminta kota atau spesies hewan langka dapat menghasilkan gambar yang miring dan salah hingga algoritme diperbaiki. Perlu diingat ini hanya iterasi kedua dari DALL-E, jadi kami pasti akan melihat lebih banyak demo yang membingungkan di masa mendatang.


Mengapa ini bisa menyebabkan masalah bagi seniman?

Setelah membaca dengan teliti karya seni yang dibuat oleh DALL-E 2, sulit untuk tidak merasa senang dengan kemungkinan teknologi tersebut.

Namun, kita harus memperhatikan potensi jebakan. Seniman sudah sangat sulit mendapatkan uang untuk pekerjaan mereka di era internet – oleh karena itu alasan awal untuk NFT – dan alat gambar berbasis algoritme baru dapat membuat banyak ilustrator digital kecil-kecilan gulung tikar.

 

Lihat posting ini di Instagram

 

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Ini juga akan menjadi jauh lebih sulit untuk memverifikasi keaslian gambar atau lukisan secara online, dan dapat merendahkan karya manusia asli. Pencetakan gambar instan bisa menjadi kemungkinan, menciptakan pasar NFT yang lebih eksploitatif.

Jika setiap orang dapat membuat sesuatu secara instan, apakah ilustrasi dan lukisan kehilangan semua nilai komersialnya? Apakah seni itu sendiri hanya menjadi aplikasi atau alat lain untuk digunakan siapa saja?

 

Lihat posting ini di Instagram

 

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Ada pertanyaan besar dan eksistensial mengenai implikasi dari perangkat lunak yang benar-benar inovatif, banyak di antaranya tidak kami temukan jawabannya.

Untuk kredit OpenAI, sepertinya sangat sadar akan bahayanya. Dikatakan bahwa DALL-E 2 tidak akan pernah sepenuhnya tersedia untuk umum, dan hanya akan diluncurkan secara perlahan kepada peneliti dan mitra tepercaya berdasarkan umpan balik. Pengguna perlu mengatakan mengapa mereka menggunakan perangkat lunak dan tidak boleh membuat gambar yang cabul atau berbahaya.

Ia ingin memastikan bahwa informasi yang salah atau gambar yang dipalsukan tidak berakhir menyebabkan kekacauan lebih lanjut pada sistem politik dan wacana online kita juga.

 

Lihat posting ini di Instagram

 

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Niat ini mungkin cukup masuk akal, tetapi siapa yang mengatakan bahwa pembuat kode lain yang kurang bermaksud baik tidak akan hanya menyalin pekerjaan OpenAI? Kami telah melihat satu aplikasi bernama Wombo's Dream diluncurkan tahun lalu, jelas berdasarkan konsep ini.

Anda dapat mengaksesnya sekarang – meskipun jauh lebih canggih daripada DALL-E 2.

Pada akhirnya, kami tidak tahu bagaimana teknologi ini dapat berdampak pada dunia seni. Apa yang kita lakukano ketahuilah bahwa segala sesuatunya menjadi sangat mengesankan, bahkan mungkin lembah kecil yang aneh. Untuk saat ini, OpenAI tampaknya meluncurkan produknya secara bertanggung jawab – dan itulah yang terbaik yang dapat kami harapkan pada tahap awal ini.

Aksesibilitas