تقوم تقنية AI DALL-E 2 الجديدة بإنشاء صور من المطالبات النصية

ثقافة
تصميم
تم النشر في 14 أبريل 2022

الائتمان: OpenAI

By تشارلي كومبس

لندن، المملكة المتحدة

1 طاقة + أضف الطاقة

تعليقات

يمكن لنظام الذكاء الاصطناعي الجديد إنشاء مجموعة متنوعة من الصور الواقعية والسريالية من أوصاف اللغة الطبيعية. من المحتمل أن تغير قواعد اللعبة ، ولكن ليس بدون بعض المخاوف.

تستمر الخوارزميات والذكاء الاصطناعي في إحداث موجات عبر صناعة الفن.

يأتي أحدث إنجاز من فريق بحث يسمى OpenAI ، والذي كشف للتو عن نسخة جديدة من برنامج DALL-E. هذا البرنامج عبارة عن أداة لتوليد النص إلى صورة تنتج عملًا فنيًا بناءً على وصف يدخله المستخدم.

عرض هذه المشاركة على Instagram

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

لن يكون هذا الذكاء الاصطناعي الجديد ، الذي يُطلق عليه اسم DALL-E 2 ، متاحًا للجمهور ، ولكن يمكن للباحثين الاشتراك لمعاينة إمكاناته. تقول شركة OpenAI إنها تخطط لإتاحة برنامجها للاستخدام في تطبيقات الطرف الثالث في نهاية المطاف - على الرغم من عدم وجود معلومات حول موعد حدوث ذلك.

في الوقت الحالي ، سيتم اختبار البرنامج من قبل شركاء تم فحصهم.

لا يُسمح للمستخدمين بتحميل الصور التي تم إنشاؤها والتي قد "تسبب ضررًا" ، ويجب عليهم الكشف عن الغرض الذي يستخدمون الذكاء الاصطناعي من أجله.

https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship

DALL-E is coming… World-changing AI image generator (https://www.youtube.com/watch?v=alJdw4JDJ4o&ab_channel=Fireship)

كيف يعمل DALL-E 2؟

بينما أنا لست خبيرًا في الترميز بأي حال من الأحوال ، فأنا يمكن تأكد من أن DALL-E 2 يعمل باستخدام مكتبة صور مسبقة الصنع. يتم إعطاء الخوارزمية ثروة من الصور ذات العلامات ثم تقوم بإنشاء عمل فني جديد بناءً على ما تعرفه بالفعل.

لنفترض أنك تريد إنشاء صورة لنمر على زورق. الحق غريب؟ لكن DALL-E 2 سيبحث في ملفاته للعثور على شكل كل من "الزورق" و "النمر" ، وإنشاء قطعة واحدة تجمع بينهما بشكل مقنع.

عرض هذه المشاركة على Instagram

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

يعتمد DALL-E 2 على CLIP الخاص بالتكرار الأول ، وهو نظام رؤية الكمبيوتر. يقول OpenAI أن هذا البرنامج الجديد يولد الصور باستخدام "الانتشار" ، حيث تبدأ القطعة على شكل بضع نقاط ويتم ملؤها تدريجياً بالتفاصيل.

تحدث هذه العملية عبر نموذج من مرحلتين. يقوم CLIP أولاً بمطابقة النص الخاص بك مع الصور الفوتوغرافية والصور الأخرى الموجودة ، ثم يقوم "وحدة فك ترميز" بإنشاء الصورة نفسها.

https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI

DALL·E 2 Explained (https://www.youtube.com/watch?v=qTgPSKKjfVg&ab_channel=OpenAI)

يقدم الفيديو أعلاه عرضًا موجزًا لما هو ممكن ، حيث يُظهر القطط التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، والإصدارات التي تم تعديلها بشكل واقعي من الصور الموجودة مسبقًا ، ونظام معقد لتسمية الكائنات يسمح لـ DALL-E 2 بفهم مطالباتك. إنها أشياء رائعة حقًا.

ومن المثير للاهتمام ، أن شركة OpenAI تؤكد أنه لا تزال هناك أخطاء ومشكلات يجب حلها.

عرض هذه المشاركة على Instagram

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

قد تتسبب الكائنات التي تم تصنيفها بشكل خاطئ في أن تنتج الخوارزمية صورًا غير صحيحة لا تتماشى مع وصف النص المقدم. إذا كان ضمن تشفيرها صورة موجودة مسبقًا لسيارة مُصنَّفة على أنها "طائرة" ، على سبيل المثال ، فقد يؤدي ذلك إلى انحراف المولد تمامًا عن مساره ، وإرسال سيارة BMW بدلاً من Boeing.

بالإضافة إلى ذلك ، لا يمكن تقديم مطالبات محددة جدًا حتى يقوم الذكاء الاصطناعي بتسمية الكائنات ذات الصلة وتعلمها.

قد يؤدي طلب بلدة أو نوع نادر من الحيوانات إلى ظهور صور غير صحيحة وغير صحيحة حتى يتم تحسين الخوارزمية. ضع في اعتبارك أن هذا ليس سوى التكرار الثاني لـ DALL-E ، لذلك سنرى بلا شك المزيد من العروض التوضيحية المذهلة في المستقبل.

https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI

OpenAI's new model DALL·E 2 is amazing! (https://www.youtube.com/watch?v=rdGVbPI42sA&ab_channel=What%27sAI)

لماذا قد يسبب هذا مشاكل للفنانين؟

بعد الاطلاع على العمل الفني الذي تم إنشاؤه بواسطة DALL-E 2 ، من الصعب ألا تشعر بالإثارة من إمكانيات التكنولوجيا.

ومع ذلك ، يجب أن نكون على دراية بالمزالق المحتملة. يواجه الفنانون بالفعل وقتًا صعبًا للغاية في كسب المال مقابل عملهم في عصر الإنترنت - ومن هنا كان السبب الأولي لـ NFTs - ويمكن لأداة الصور الجديدة القائمة على الخوارزمية أن تخرج العديد من الرسامين الرقميين الصغار من العمل.

عرض هذه المشاركة على Instagram

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

كما سيصبح التحقق من صحة صورة أو لوحة على الإنترنت أكثر صعوبة ، وقد يقلل من قيمة عمل البشر الحقيقيين. يمكن أن يصبح صك الصورة الفوري أمرًا ممكنًا ، مما يؤدي إلى إنشاء سوق NFT أكثر استغلالًا.

إذا كان بإمكان الجميع صنع أي شيء على الفور ، فهل تفقد الرسوم التوضيحية واللوحات كل قيمتها التجارية؟ هل أصبح الفن نفسه مجرد تطبيق أو أداة أخرى ليستخدمها أي شخص؟

عرض هذه المشاركة على Instagram

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

هناك أسئلة وجودية كبيرة حول الآثار المترتبة على مثل هذه البرامج الرائدة حقًا ، وكثير منها ليس لدينا إجابات عليها.

إلى رصيد OpenAI ، على ما يبدو مدركين جدا للمخاطر. تنص على أن DALL-E 2 لن يكون متاحًا بشكل كامل للجمهور مطلقًا ، وسيتم نشره ببطء فقط للباحثين والشركاء الموثوق بهم بناءً على التعليقات. سيحتاج المستخدمون إلى توضيح سبب استخدامهم للبرنامج ولا يمكنهم عمل أي صور بذيئة أو ضارة.

إنها تريد التأكد من أن المعلومات المضللة أو الصور المزيفة لا تنتهي بالتسبب في مزيد من الخراب لأنظمتنا السياسية وخطابنا عبر الإنترنت أيضًا.

عرض هذه المشاركة على Instagram

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

قد تكون هذه النوايا سليمة بما فيه الكفاية ، ولكن من الذي سيقول إن المبرمجين الآخرين الأقل نية لن يقوموا ببساطة بنسخ عمل OpenAI؟ لقد رأينا بالفعل تطبيقًا واحدًا يسمى إطلاق Wombo's Dream العام الماضي ، ومن الواضح أنه يعتمد على هذا المفهوم.

يمكنك الوصول إليه الآن - على الرغم من أنه أقل تعقيدًا بكثير من DALL-E 2.

في النهاية ، ليس لدينا أي فكرة عن كيفية تأثير هذه التكنولوجيا على عالم الفن. ما احنا دo أعلم أن الأمور أصبحت مثيرة للإعجاب بشكل مخيف ، وربما حتى وادي غريب قليلاً. في الوقت الحالي ، يبدو أن شركة OpenAI تطرح منتجاتها بمسؤولية - وهذا أفضل ما يمكن أن نأمله في هذه المرحلة المبكرة.

تشارلي كومبس

رئيس تحرير لندن، المملكة المتحدة

أنا تشارلي (هو / هو) ، رئيس التحرير في Thred. درست اللغة الإنجليزية في جامعة برمنغهام ، وبصفتي متحمسًا للموسيقى والألعاب ، فأنا من المهووسين بثقافة البوب. يمكنك أن تجد لي تنسيقًا لقوائم التشغيل ، وتصميم صور لعناوين المقالات ، وأحتسي عصير التفاح يوم الخميس. اتبعني تويتر, لينكدين: وأرسل لي بعض الأفكار / التعليقات عبر البريد الإلكتروني.

المزيد من thred.

ما هي "سنوات الفجوة بين البالغين" ولماذا هي في ارتفاع؟

الائتمان: Unsplash

متفرقات

ما هي "سنوات الفجوة بين البالغين" ولماذا هي في ارتفاع؟

الأكثر شيوعًا هو طقوس ما قبل الجامعة للمراهقين والأشخاص في أوائل العشرينات من العمر، حيث أصبح تأجيل كل شيء للسفر حول العالم سريعًا اتجاهًا بين الأجيال الأكبر سناً التي تبحث عن استراحة من طبيعة الحياة القاسية كشخص بالغ. ترتبط سنة الفجوة عادةً بحافة البلوغ، وهي فترة تطور لأولئك الذين لديهم الوقت والموارد اللازمة للسفر والتطوع...

By صوفيا فيليبس لندن، المملكة المتحدة

ما هي "نظرية الإنترنت الميت" وهل هي حقيقية؟

الائتمان: Thred

متفرقات

ما هي "نظرية الإنترنت الميت" وهل هي حقيقية؟

مع النمو المستمر للذكاء الاصطناعي منذ عام 2022، أصبحت المؤامرات المحيطة بما يسمى بـ "نظرية الإنترنت الميتة" أقوى. أول شيء أولاً، ما هو هذا بحق الجحيم وهل يتمتع بأي مصداقية؟ هل هذا حفرة أرنب على الإنترنت تستحق أن تضيع فيها؟ هل هي عاصفة نقية في فنجان؟ هل قام إنسان حتى بكتابة هذا المقال؟ الكثير من الأسئلة. إذا كنت تقضي قدرًا كبيرًا من الوقت على Twitter (X)...

By جيمي واتس لندن، المملكة المتحدة

هل الموسيقى الشعبية تزداد سوءًا مع كل عقد جديد؟

الائتمان: Thred

الوسائط

هل الموسيقى الشعبية تزداد سوءًا مع كل عقد جديد؟

في حين أن الفن أمر ذاتي للغاية، تشير دراسة جديدة إلى أن الموسيقى الشعبية أصبحت أبسط وأكثر تكرارًا خلال العقود القليلة الماضية. إحدى الطرق المؤكدة لإخبار شخص ما بأنه أصبح "كبيرًا في السن" هي أن ينطق الجملة المألوفة تمامًا: "الموسيقى هذه الأيام قمامة". على الرغم من أن هذا قد يبدو وكأنه مسألة رأي (خاصة عندما تكون الشخص الذي يمتلك جهاز aux)، إلا أن الناس يميلون بالفعل إلى القول بأن الموسيقى...

By جيسيكا بيرن لندن، المملكة المتحدة

الائتمان: @hardestgeezer/Thred

الوسائط

يكمل روس كوك مهمة الجري على طول أفريقيا

قصة مليئة بالعقبات التي لا يمكن التغلب عليها تقريبًا، تعد رحلة كوك انعكاسًا رائعًا للروح الإنسانية. لكنها تعاني بالفعل من الانتقادات بعد مرور 24 ساعة على خط النهاية. إذا كنت تمارس رياضة الجري بانتظام، فأنت جزء من 20% فقط من السكان (17% للنساء). إذا شاركت في ماراثون، فإن هذه الإحصائية تنخفض إلى 0.17%. لكن روس كوك، المعروف باسم "أصعب رجل غريب" لمتابعيه البالغ عددهم مليونًا على Instagram، أكمل للتو...