AI DALL-E 2 baru membuat gambar dari petunjuk teks

budaya
Mendesain
Diposting 14 April 2022

Kredit: OpenAI

By Charlie Coombs

London, UK

2 energi - Hapus Energi

komentar 0

Sistem AI baru dapat membuat berbagai gambar baik realistis maupun surealis dari deskripsi bahasa alami. Ini memiliki potensi untuk mengubah permainan, tetapi bukan tanpa beberapa kekhawatiran.

Algoritma dan AI terus membuat gelombang di industri seni.

Terobosan terbaru datang dari tim peneliti bernama OpenAI, yang baru saja meluncurkan versi baru dari program DALL-E-nya. Perangkat lunak ini adalah alat pembuat teks-ke-gambar yang menghasilkan karya seni berdasarkan deskripsi yang dimasukkan pengguna.

Lihat posting ini di Instagram

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Disebut DALL-E 2, AI baru ini tidak akan tersedia untuk umum, tetapi para peneliti dapat mendaftar untuk melihat kemampuannya. OpenAI mengatakan pihaknya berencana untuk membuat perangkat lunaknya tersedia untuk digunakan di aplikasi pihak ketiga pada akhirnya – meskipun tidak ada kabar kapan ini akan terjadi.

Untuk saat ini, program tersebut akan diuji oleh mitra terverifikasi.

Pengguna tidak diizinkan untuk mengunggah gambar yang dihasilkan yang dapat 'menyebabkan bahaya', dan harus mengungkapkan untuk apa mereka menggunakan AI.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

Bagaimana cara kerja DALL-E 2?

Meskipun saya sama sekali bukan ahli pengkodean, saya bisa konfirmasikan bahwa DALL-E 2 beroperasi menggunakan perpustakaan gambar yang dibuat sebelumnya. Algoritme diberikan banyak gambar yang ditandai dan kemudian membuat karya seni baru berdasarkan apa yang sudah diketahuinya.

Katakanlah Anda ingin membuat gambar harimau di atas sampan. Aneh, kan? Namun DALL-E 2 akan mencari file-nya untuk menemukan seperti apa 'kano' dan 'harimau', dan membuat satu bagian yang menggabungkan keduanya secara meyakinkan.

Lihat posting ini di Instagram

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

DALL-E 2 dibangun di atas CLIP iterasi pertama, sistem visi komputer. OpenAI mengatakan bahwa perangkat lunak baru ini menghasilkan gambar menggunakan 'difusi', di mana sepotong dimulai sebagai beberapa titik dan secara bertahap diisi dengan detail.

Proses ini terjadi melalui model dua tahap. CLIP pertama-tama mencocokkan teks Anda dengan foto dan gambar lain yang ada, kemudian 'decoder' menghasilkan gambar itu sendiri.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

Video di atas memberikan demonstrasi singkat tentang apa yang mungkin, memamerkan kucing yang dihasilkan AI, versi gambar yang sudah ada sebelumnya yang diedit secara realistis, dan sistem pelabelan objek yang kompleks yang memungkinkan DALL-E 2 untuk memahami perintah Anda. Ini benar-benar hal yang mengesankan.

Menariknya, OpenAI menekankan bahwa masih ada kesalahan dan masalah yang harus diselesaikan.

Lihat posting ini di Instagram

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Objek yang salah label dapat menyebabkan algoritme menghasilkan gambar yang salah yang tidak sesuai dengan deskripsi teks yang diberikan. Jika dalam pengkodeannya memiliki foto mobil yang sudah ada sebelumnya yang diberi label sebagai 'pesawat', misalnya, maka ini dapat menyebabkan generator benar-benar keluar jalur, mengirim kembali BMW alih-alih Boeing.

Selain itu, permintaan yang sangat spesifik tidak mungkin dilakukan sampai AI memberi label dan mempelajari objek yang relevan.

Meminta kota atau spesies hewan langka dapat menghasilkan gambar yang miring dan salah hingga algoritme diperbaiki. Perlu diingat ini hanya iterasi kedua dari DALL-E, jadi kami pasti akan melihat lebih banyak demo yang membingungkan di masa mendatang.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

OpenAI's new model DALL·E 2 is amazing! (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

Mengapa ini bisa menyebabkan masalah bagi seniman?

Setelah membaca dengan teliti karya seni yang dibuat oleh DALL-E 2, sulit untuk tidak merasa senang dengan kemungkinan teknologi tersebut.

Namun, kita harus memperhatikan potensi jebakan. Seniman sudah sangat sulit mendapatkan uang untuk pekerjaan mereka di era internet – oleh karena itu alasan awal untuk NFT – dan alat gambar berbasis algoritme baru dapat membuat banyak ilustrator digital kecil-kecilan gulung tikar.

Lihat posting ini di Instagram

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Ini juga akan menjadi jauh lebih sulit untuk memverifikasi keaslian gambar atau lukisan secara online, dan dapat merendahkan karya manusia asli. Pencetakan gambar instan bisa menjadi kemungkinan, menciptakan pasar NFT yang lebih eksploitatif.

Jika setiap orang dapat membuat sesuatu secara instan, apakah ilustrasi dan lukisan kehilangan semua nilai komersialnya? Apakah seni itu sendiri hanya menjadi aplikasi atau alat lain untuk digunakan siapa saja?

Lihat posting ini di Instagram

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Ada pertanyaan besar dan eksistensial mengenai implikasi dari perangkat lunak yang benar-benar inovatif, banyak di antaranya tidak kami temukan jawabannya.

Untuk kredit OpenAI, sepertinya sangat sadar akan bahayanya. Dikatakan bahwa DALL-E 2 tidak akan pernah sepenuhnya tersedia untuk umum, dan hanya akan diluncurkan secara perlahan kepada peneliti dan mitra tepercaya berdasarkan umpan balik. Pengguna perlu mengatakan mengapa mereka menggunakan perangkat lunak dan tidak boleh membuat gambar yang cabul atau berbahaya.

Ia ingin memastikan bahwa informasi yang salah atau gambar yang dipalsukan tidak berakhir menyebabkan kekacauan lebih lanjut pada sistem politik dan wacana online kita juga.

Lihat posting ini di Instagram

Pos yang dibagikan oleh DALL·E oleh OpenAI (@openaidalle)

Niat ini mungkin cukup masuk akal, tetapi siapa yang mengatakan bahwa pembuat kode lain yang kurang bermaksud baik tidak akan hanya menyalin pekerjaan OpenAI? Kami telah melihat satu aplikasi bernama Wombo's Dream diluncurkan tahun lalu, jelas berdasarkan konsep ini.

Anda dapat mengaksesnya sekarang – meskipun jauh lebih canggih daripada DALL-E 2.

Pada akhirnya, kami tidak tahu bagaimana teknologi ini dapat berdampak pada dunia seni. Apa yang kita lakukano ketahuilah bahwa segala sesuatunya menjadi sangat mengesankan, bahkan mungkin lembah kecil yang aneh. Untuk saat ini, OpenAI tampaknya meluncurkan produknya secara bertanggung jawab – dan itulah yang terbaik yang dapat kami harapkan pada tahap awal ini.

Charlie Coombs

Pemimpin Redaksi London, UK

Saya Charlie (Dia/Dia), Pemimpin Redaksi di Thred. Saya belajar bahasa Inggris di University of Birmingham dan sebagai penggemar musik dan game, saya seorang kutu buku untuk budaya pop. Anda dapat menemukan saya membuat daftar putar, merancang gambar judul artikel, dan menyeruput sari apel pada hari Kamis. Ikuti saya di Twitter, LinkedIn dan berikan saya beberapa ide/umpan balik melalui e-mail.

Lebih banyak dari utas.

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato

Kredit: Benang

offbeat

'Mata Bionik' memecahkan misteri tempat peristirahatan terakhir Plato

Peneliti Italia, Graziano Ranocchia, mungkin akhirnya berhasil memecahkan misteri tempat peristirahatan terakhir Plato. 'Mata bionik' bertenaga AI memindai gulungan berkarbon berusia 2,000 tahun yang ditulis sekitar tahun 348 SM yang menunjukkan dengan tepat lokasi tertentu di Athena. Misteri di mana salah satu filsuf terhebat di dunia bersemayam mungkin baru saja terpecahkan – ironisnya, oleh sebuah mesin. Pemakaman Plato, bisa dibilang pemikir dasar filsafat Yunani yang paling dihormati...

By Jamie Watts London, UK

Kredit: Pexels

Media

Alam telah resmi menjadi musisi

Sebagai bagian dari kampanye baru, Nature telah diakui sebagai artis di platform streaming besar, termasuk Spotify. Royalti akan digunakan untuk mendukung inisiatif aksi iklim di seluruh dunia. Suhu meningkat, habitat berkurang, dan gletser mencair dengan kecepatan yang belum pernah terjadi sebelumnya. Seiring dengan perubahan iklim, penderitaan bumi terus mencapai tingkat yang lebih tinggi, dan kenyataan bahwa kita kehabisan waktu untuk melakukan sesuatu menjadi...

By Sofia Philips London, UK

Apa yang dimaksud dengan 'masa jeda orang dewasa' dan mengapa angka tersebut meningkat?

Kredit: Unsplash

offbeat

Apa yang dimaksud dengan 'masa jeda orang dewasa' dan mengapa angka tersebut meningkat?

Umumnya merupakan ritual pra-universitas bagi remaja dan orang-orang berusia awal 20-an, menunda segala sesuatunya untuk berkeliling dunia dengan cepat menjadi tren di kalangan generasi tua yang mencari istirahat dari sifat kehidupan yang tiada henti sebagai orang dewasa. Biasanya dikaitkan dengan ambang kedewasaan, gap year adalah periode perkembangan bagi mereka yang memiliki waktu dan sumber daya untuk bepergian, menjadi sukarelawan,...

By Sofia Philips London, UK

Apa itu 'Teori Internet Mati' dan apakah itu nyata?

Kredit: Benang

offbeat

Apa itu 'Teori Internet Mati' dan apakah itu nyata?

Dengan pertumbuhan AI yang tiada henti sejak tahun 2022, konspirasi seputar apa yang disebut 'Teori Internet Mati' semakin kuat. Namun, hal pertama yang perlu diperhatikan adalah apa itu dan apakah ada kredibilitasnya? Apakah ini lubang kelinci online yang layak untuk dijelajahi? Apakah ini murni badai dalam cangkir teh? Apakah ada manusia yang menulis artikel ini? Begitu banyak pertanyaan. Jika Anda menghabiskan banyak waktu di Twitter (X)...

By Jamie Watts London, UK