هوش مصنوعی چیست؟
خلاصه مطلب اینکه هوش مصنوعی شاخه ایی از علم کامپیوتر است که به شبیه سازی , طراحی و ساخت و تقلید از کارکرد مغز انسان میپردازد. که امروزه در بسیاری از برنامه ها و نرم افزار های دنیا استفاده میشود و کمک شایانی به کسب و کار ها و زندگی بشر کرده است. این علم همچنان در حال پیشرفت است و خیلی از هدفش که در ابتدا صحبت شد دور است. (حتما یک مقاله از هوش مصنوعی آپلود میکنم )
این شما و این هم DALL-E !
DALL-E یک هوش مصنوعی است که به وسیله شرکت Open-AI توسعه پیدا کرده است, و برگرفته از ترکیب سر واژه های انیمیشن WALL-E و هنرمند معروف اسپانیایی سالوادور دالی میباشد. و این قابلیت را دارد تا با نوشته ها تصاویر حیرت انگیزی بسازد! برای مثال متن “تصویری از یک فضانورد که بر روی ماه اسب سواری میکند” را به او میدهید و بومممم او تصویر حیرت انگیز زیر را به شما میدهد!
چگونه این اتفاق می افتد؟
DALL-E به منبع بزرگی از تصاویر دسته بندی شده کلان داده هایی مثل اینستاگرام و خیلی از برنامه های دیگه ایی که مردم در اون اقدام به انتشار تصاویر میکنند وصل است و میتواند الگو های مختلف را از آن بیابد . وقتی ما در متن “تبلیغات یک گربه در ظاهر ناپلون با یک پنیر در دست ” را مینویسیم , این هوش مصنوعی ابتدا هر یک از کلمات رو به تصاویر بانک اطلاعاتی خود وصل میکند و طی یکسری فرایند ها سعی میکند این تصاویر رو با هم ترکیب کرده و خروجی کار تصویر جذاب زیر میشود:
از GPT تا DALL-E
از کامل کردن متن تا تولید تصاویر جدید و حیرت انگیز
در ابتدا هدف ساخت تصاویر جدید به وسیله متن نبود. قرار بر این بود که دنباله متن ها کامل شود و یک متن از یک زبان به زبان دیگر ترجمه شود . و آنجا بود که Open AI هوش مصنوعی خود را موسوم به GPT معرفی کرد. GPT ورژن یک تنها قابلیت ترجمه هوشمند جملات را داشت . و در نسخه دوم موسوم به GPT-2 پا را فراتر گذاشته و تصمیم به تکمیل هوشمند و خودکار متون کردند. به زبان دیگر , کاربر متنی را به عامل میدهد و عامل سعی میکند طبق الگویی که از متن نوشته شده میگیرد ادامه آن را حدس بزند.
GPT-2 تکامل میابد
بعد از آزمایش و موفقیتی که GPT-2 برای مهندسین داشت . یک روز یکی از مهندسین با خودش فکر کرد حالا که میتوانیم متن را کامل کنیم , چرا سعی نکنیم عکس را کامل کنیم؟ این ایده را با بقیه تیم در جریان گذاشت و GPT-3 خلق شد. عاملی که میتوانست بقیه یک عکس را از یک عکس دو نیم شده حدس بزند و آن را به طور اتومات پر کند. در زیر یک نمونه از تصویر کامل شده به وصیله این عامل را مشاهده میکنید:
DALL-E متولد میشود
بعد از موفقیت ها و استقبال بی نظیر از GPT-3 تیم توسعه تصمیم به یک کار جسورانه گرفت, خلق تصاویر حیرت انگیز با استفاده از کلمات ! در ابتدا DALL_E 1 معرفی شد که میتوانست تصاویر گنگ ولی حیرت انگیزی بسازد و باعث حیرت مردم و حتی خود توسعه دهنده ها شود. این عامل با استفاده از پیدا کردن روابط بین متن و تصاویر خود که شامل یک ابر داده از انواع تصاویر برچسب خورده و نخورده اینستا و خیلی از شبکه های اجتماعی میشود و با استفاده از قدرت Deep Learning یا یادگیری عمیق دست به خلق آثار هنری و تصاویری منحصر به فرد میکند . که شاید از یک انسان وقت و منابع زیادی را بگیرد. شما میتوانید در زیر شاهد چند تا از آثار این عامل هوشمند باشید:
همانطور که مشاهده میکنید , کیفیت تصاویر خروجی چنگی به دل نمیزند , ولی یک قدم خیلی بزرگ در زمینه هوش مصنوعی میباشد. شما حتی میتوانید عنواع تصاویر را با متن های مختلف با هم ترکیب کنید و خروجی های مختلفی بگیرید.
این شما و این هم DALL-E 2
بعد از DALL-E 1 تیم آپدیت جدید و بزرگی از این عامل تحت عنوان DALL-E 2 داد که میتواند آثاری به شدت واقع گرایانه و هنری ایجاد کند به حدی که کیفیت طرح با نمونه یک نقاش برابری کند! شما تقریبا هر کاری میتوانید با تصوری خروجی انجام دهید! DALL-E2 انواع سبک آثار هنری را میداند و میتوانید با نوشتن مثلا “به سبک قرون وسطی” خروجی تصویر را به آن سبک بگیرید! متاستفانه DALL-E 2 برای استفاده عموم و حتی قشر برنامه نویس در دسترس قرار نگرفته و به دلایل امنیتی مثل , تقلب در آثار هنری, ساخت جعل عمیق و غیره… نخواهد گرفت. اما نگران نباشید شما میتونید از نسخه ضعیف تر آن یعنی DALL-E mini استفاده کنید . که با وجود ضعیف بودن خروجی آن میتواند جذاب باشد.
با DALL-E mini آشنا شوید!
DALL-E mini برای استفاده علاقه مندان و عموم مردم طراحی شده است و شما میتوانید خروجی های جذابی از آن بگیرید . مثلا من این جمله رو سرچ کردم”———-” و اینم نتیجش:
شما میتوانید از طریق لینک زیر این عامل را به صورت آنلاین تجربه :
https://huggingface.co/spaces/dalle-mini/dalle-mini
اگر توسعه دهنده هستید , حتی میتوانید آن را در محیط لوکال سیستمتون اجرا کنید!
شما میتونید از لینک گیت هاب زیر به سورس دسترسی داشته باشید:
https://github.com/borisdayma/dalle-minihttps://github.com/borisdayma/dalle-mini
از DALL-E 3 چه خبر؟
در زمان نگارش این مقاله آخرین نسخه موجود از این عامل هوشمند DALL-E 2 میباشد. شاید تیم توسعه در آینده فکر بهتری برای این هوش مصنوعی منحصر بفرد پیدا کند. و مطمن باشید اگر چنین شد حتما مقاله جدایی از آن قرار میدهیم