یووی نت

فراتر از تخیل! از هوش مصنوعی DALL-E چه میدانیم؟

هوش مصنوعی چیست؟

خلاصه مطلب اینکه هوش مصنوعی شاخه ایی از علم کامپیوتر است که به شبیه سازی , طراحی و ساخت و تقلید از کارکرد مغز انسان میپردازد. که امروزه در بسیاری از برنامه ها و نرم افزار های دنیا استفاده میشود و کمک شایانی به کسب و کار ها و زندگی بشر کرده است. این علم همچنان در حال پیشرفت است و خیلی از هدفش که در ابتدا صحبت شد دور است. (حتما یک مقاله از هوش مصنوعی آپلود میکنم )

این شما و این هم DALL-E !

DALL-E یک هوش مصنوعی است که به وسیله شرکت Open-AI توسعه پیدا کرده است, و برگرفته از ترکیب سر واژه های انیمیشن WALL-E و هنرمند معروف اسپانیایی سالوادور دالی میباشد. و این قابلیت را دارد تا با نوشته ها تصاویر حیرت انگیزی بسازد! برای مثال متن “تصویری از یک فضانورد که بر روی ماه اسب سواری میکند” را به او میدهید و بومممم او تصویر حیرت انگیز زیر را به شما میدهد!

تصویر ساخته شده به وسیله DALL-E 2

چگونه این اتفاق می افتد؟

DALL-E به منبع بزرگی از تصاویر دسته بندی شده کلان داده هایی مثل اینستاگرام و خیلی از برنامه های دیگه ایی که مردم در اون اقدام به انتشار تصاویر میکنند وصل است و میتواند الگو های مختلف را از آن بیابد . وقتی ما در متن “تبلیغات یک گربه در ظاهر ناپلون با یک پنیر در دست ” را مینویسیم , این هوش مصنوعی ابتدا هر یک از کلمات رو به تصاویر بانک اطلاعاتی خود وصل میکند و طی یکسری فرایند ها سعی میکند این تصاویر رو با هم ترکیب کرده و خروجی کار تصویر جذاب زیر میشود:

Dalle 2 Text zu Bild Generator Napoleon Katze min
تصویر یک گربه در قالب ناپلون, ساخته شده به وسیله DALL-E

از GPT تا DALL-E

از کامل کردن متن تا تولید تصاویر جدید و حیرت انگیز

در ابتدا هدف ساخت تصاویر جدید به وسیله متن نبود. قرار بر این بود که دنباله متن ها کامل شود و یک متن از یک زبان به زبان دیگر ترجمه شود . و آنجا بود که Open AI هوش مصنوعی خود را موسوم به GPT معرفی کرد. GPT ورژن یک تنها قابلیت ترجمه هوشمند جملات را داشت . و در نسخه دوم موسوم به GPT-2 پا را فراتر گذاشته و تصمیم به تکمیل هوشمند و خودکار متون کردند. به زبان دیگر , کاربر متنی را به عامل میدهد و عامل سعی میکند طبق الگویی که از متن نوشته شده میگیرد ادامه آن را حدس بزند.

GPT 2 AutoCopleteTExt min
تکمیل متن به وسیله GPT-2

GPT-2 تکامل میابد

بعد از آزمایش و موفقیتی که GPT-2 برای مهندسین داشت . یک روز یکی از مهندسین با خودش فکر کرد حالا که میتوانیم متن را کامل کنیم , چرا سعی نکنیم عکس را کامل کنیم؟ این ایده را با بقیه تیم در جریان گذاشت و GPT-3 خلق شد. عاملی که میتوانست بقیه یک عکس را از یک عکس دو نیم شده حدس بزند و آن را به طور اتومات پر کند. در زیر یک نمونه از تصویر کامل شده به وصیله این عامل را مشاهده میکنید:

Screen Shot 2020 06 17 at 5.22.36 PM min
Screen Shot 2020 07 29 at 12.41.08 PM min
کامل کردن عکس ها به وسیله GPT-3

DALL-E متولد میشود

بعد از موفقیت ها و استقبال بی نظیر از GPT-3 تیم توسعه تصمیم به یک کار جسورانه گرفت, خلق تصاویر حیرت انگیز با استفاده از کلمات ! در ابتدا DALL_E 1 معرفی شد که میتوانست تصاویر گنگ ولی حیرت انگیزی بسازد و باعث حیرت مردم و حتی خود توسعه دهنده ها شود. این عامل با استفاده از پیدا کردن روابط بین متن و تصاویر خود که شامل یک ابر داده از انواع تصاویر برچسب خورده و نخورده اینستا و خیلی از شبکه های اجتماعی میشود و با استفاده از قدرت Deep Learning یا یادگیری عمیق دست به خلق آثار هنری و تصاویری منحصر به فرد میکند . که شاید از یک انسان وقت و منابع زیادی را بگیرد. شما میتوانید در زیر شاهد چند تا از آثار این عامل هوشمند باشید:

همانطور که مشاهده میکنید , کیفیت تصاویر خروجی چنگی به دل نمیزند , ولی یک قدم خیلی بزرگ در زمینه هوش مصنوعی میباشد. شما حتی میتوانید عنواع تصاویر را با متن های مختلف با هم ترکیب کنید و خروجی های مختلفی بگیرید.

این شما و این هم DALL-E 2

بعد از DALL-E 1 تیم آپدیت جدید و بزرگی از این عامل تحت عنوان DALL-E 2 داد که میتواند آثاری به شدت واقع گرایانه و هنری ایجاد کند به حدی که کیفیت طرح با نمونه یک نقاش برابری کند! شما تقریبا هر کاری میتوانید با تصوری خروجی انجام دهید! DALL-E2 انواع سبک آثار هنری را میداند و میتوانید با نوشتن مثلا “به سبک قرون وسطی” خروجی تصویر را به آن سبک بگیرید! متاستفانه DALL-E 2 برای استفاده عموم و حتی قشر برنامه نویس در دسترس قرار نگرفته و به دلایل امنیتی مثل , تقلب در آثار هنری, ساخت جعل عمیق و غیره… نخواهد گرفت. اما نگران نباشید شما میتونید از نسخه ضعیف تر آن یعنی DALL-E mini استفاده کنید . که با وجود ضعیف بودن خروجی آن میتواند جذاب باشد.

با DALL-E mini آشنا شوید!

DALL-E mini برای استفاده علاقه مندان و عموم مردم طراحی شده است و شما میتوانید خروجی های جذابی از آن بگیرید . مثلا من این جمله رو سرچ کردم”———-” و اینم نتیجش:

360 F 210497744 u1buctOnicj42ubjaeABezH5BASnUvoE

شما میتوانید از طریق لینک زیر این عامل را به صورت آنلاین تجربه :

https://huggingface.co/spaces/dalle-mini/dalle-mini

اگر توسعه دهنده هستید , حتی میتوانید آن را در محیط لوکال سیستمتون اجرا کنید!

شما میتونید از لینک گیت هاب زیر به سورس دسترسی داشته باشید:

https://github.com/borisdayma/dalle-minihttps://github.com/borisdayma/dalle-mini

از DALL-E 3 چه خبر؟

در زمان نگارش این مقاله آخرین نسخه موجود از این عامل هوشمند DALL-E 2 میباشد. شاید تیم توسعه در آینده فکر بهتری برای این هوش مصنوعی منحصر بفرد پیدا کند. و مطمن باشید اگر چنین شد حتما مقاله جدایی از آن قرار میدهیم

تا مقالات بعدی بدرود

فهرست مطالب

مطالب بیشتر
دیگر مطالب این دسته بندی
مقاله مشابه در برچسب مورد نظر پیدا نشد
مشترک شدن
اطلاعیه
guest
0 نظرات
بازخورد داخلی
دیدن همه نظرات
لطفا بعد از کلیک روی لینک فعال سازی ارسال شده وارد شوید

منو