آموزش BigDL: تصاویر خود را از متن با Stable Diffusion | ایجاد کنید توسط اینتل | فناوری اینتل | مارس، 2023

توسط منیژه مریدی

آوریل 12, 2024

صفحه اصلی اخبار محصولات اینتل

حالا نوبت شماست. ما در اینجا شما را از طریق مراحل راهنمایی می کنیم یا می توانید پیاده سازی را در GitHub* دنبال کنید.

برای اجرای اسکریپت نصب، پوشه ای را که در آن فایل ها را دانلود کرده اید باز کنید:

می توانید از معماری توضیح داده شده در بالا استفاده کنید و تصویر خود را دریافت کنید، اما آیا متوجه شده اید که فرآیند چقدر طول می کشد – گاهی اوقات چند دقیقه؟

مجموعه آموزشی

تصاویر تولید شده

3. رمزگشای تصویر (رمزگذار VAE): تصویر تولید شده توسط سازنده تصویر را دریافت کرده و تصویر نهایی را به فرمت مورد نظر تبدیل می کند.

تصویر از (هو و همکاران، 2020)

بینایی کامپیوتر یک مثال بارز است. علیرغم نیازهای محاسباتی سنگین، دستاوردهای بزرگی در سنتز تصویر حاصل شده است (هوانگ و همکاران، 2018)، فرآیند تولید مصنوعی تصاویر حاوی محتوای خاص. این کار با چارچوب یادگیری ماشینی معروف به شبکه‌های متخاصم مولد (GAN) شروع شد تا به مدل‌های انتشار امروزی برسد. این تکامل مدل‌هایی را به دانشمندان داده ارائه می‌کند که آموزش آن‌ها آسان است و سریع همگرا می‌شوند و می‌توانند به طور قابل اعتماد تصاویر با کیفیت بالا تولید کنند.

دفتر خانه (عکس اصلی از unsplash); دفتر خانه با ماسک صلیبی روپوش تولید شده

نقاشی بیرونی: در اینجا نقاشی در مناطق خارج از تصویر اصلی رخ می دهد. مدل به طور مصنوعی تصویر را به اندازه دلخواه "پر" می کند. در مثال زیر، از مدل خواستیم تا تصویر «ماشین در خیابان» را ایجاد کند و از نقاشی بیرونی بخواهد که قسمت پایین سمت چپ تصویر را پر کند.