در بینایی کامپیوتری، یادگیری انتقال برای تنظیم دقیق معماریهای شبکه عصبی کانولوشنال (CNN) از پیش آموزش دیده مانند VGGNet (Simonyan & Zisserman, 2014)، ResNet (He et al., 2015)، نسخه اخیراً راهاندازی شده YOLO(v8) یا ماژول آغازین* Google برای وظایف طبقهبندی تصویر با دقت بهبود یافته نسبت به معماریهای اصلی CNN که از ابتدا ساخته شدهاند.
Simonyan، K.، & Zisserman، A. (2014). شبکه های کانولوشنال بسیار عمیق برای تشخیص تصویر در مقیاس بزرگ. https://doi.org/10.48550/ARXIV.1409.1556
این فناوریها با هم به کسبوکارها این امکان را دادهاند تا اپلیکیشنهای پیچیدهتری را با سرعتهای بالاتر از همیشه ایجاد کنند. با استفاده از کتابخانههای منبع باز (مانند scikit-learn*، OpenVINO™ و غیره) و چارچوبها (مانند Pytorch* یا TensorFlow*)، توسعهدهندگان میتوانند به مدلها و الگوریتمهای از پیش ساخته شده دسترسی داشته باشند که زمان توسعه را به شدت کاهش میدهند. یادگیری انتقالی این را یک گام جلوتر میبرد و ماشینها را قادر میسازد تا دادههای جدید را بر اساس آنچه قبلاً از مجموعه دادههای قبلی آموختهاند تفسیر کنند. این به معنای دقت بالاتر هنگام شناسایی الگوها یا پیشبینی نتایج در سناریوهای دنیای واقعی است – کاری که هیچ توسعهدهندهای به تنهایی نمیتواند انجام دهد.
He, K., Zhang, X., Ren, S., & Sun, J. (2015). یادگیری عمیق باقیمانده برای تشخیص تصویر. https://doi.org/10.48550/ARXIV.1512.03385
یادگیری انتقالی در چند سال اخیر تأثیر زیادی در هوش مصنوعی گذاشته است، نه فقط برای پردازش زبان طبیعی (NLP)، بلکه برای بینایی رایانه، مراقبت های بهداشتی و موارد دیگر. نرم افزار منبع باز این روزها تقریباً در همه جا وجود دارد، از گوشی های هوشمند گرفته تا اتومبیل ها.
عکس ناتاسیا چن در Unsplash
بیایید شرایط خود را تعریف کنیم: نرم افزار منبع باز کدی است که برای اجرا، مطالعه، اصلاح و توزیع مجدد در دسترس عموم قرار گرفته است و به لطف مشارکت های توسعه دهندگان تکامل می یابد.
یادگیری انتقالی شرکت ها را قادر می سازد راه حل های نوآورانه ای برای مشکلات دنیای واقعی ایجاد کنند. مراقبت های بهداشتی یک مثال عالی است. شرکتهایی مانند Intel و GE Healthcare با مؤسسات پزشکی در این مدلهای منبع باز همکاری میکنند تا با استفاده از مجموعه دادههای پزشکی موجود همراه با مدلهای هوش مصنوعی که به طور خاص در مورد آن بیماری یا شرایط خاص آموزش دیدهاند، به پزشکان کمک کنند تا بیماریهایی مانند سرطان سینه را سریعتر و دقیقتر تشخیص دهند. نتایج باعث کاهش شدید زمان خواندن برای اسکن، شناسایی صحیح ضایعات کوچکتر و بیوپسی کمتر روی توده های خوش خیم می شود.
· Pytorch
چالش دیگر یادگیری انتقالی در محدودیتهای بالقوه آن در مواجهه با وظایف یا محیطهای کاملاً جدیدی است که قبلاً توسط یک مدل یادگیری ماشینی انجام نشده بود. در چنین مواردی، حتی اگر انطباق مدلهای موجود میتواند گاهی اوقات نتایج عملکرد خوبی ارائه دهد، ممکن است قبل از دستیابی به نتایج رضایتبخش، به تلاش و سرمایهگذاری زمان قابل توجهی در مهندسی ویژگی و انتخاب پارامتر نیاز داشته باشد.
· صورت در آغوش گرفته*
یادگیری انتقالی یک تکنیک قدرتمند در یادگیری ماشین (ML) است که دانشمندان داده را قادر میسازد تا از مدلهای موجود و دانش مرتبط با آنها در مجموعه دادههای جدید استفاده مجدد کنند. این بر اساس ایده انتقال اطلاعات از یک دامنه، کار، یا تجربه قبلی به دیگری است. یادگیری انتقالی با استفاده مجدد از مدل های موجود در زمان و هزینه صرفه جویی می کند. با استفاده از مدل های از پیش آموزش دیده، دانشمندان داده می توانند تلاش ها را بر روی استفاده از تکنیک های تنظیم دقیق مناسب به جای آموزش یک مدل کامل از ابتدا متمرکز کنند.
با جفت کردن نرم افزار منبع باز و انتقال، شرکت های یادگیری در حال تغییر رویکرد خود به طراحی و توسعه اپلیکیشن و همچنین وظایف تجزیه و تحلیل داده ها هستند.
منبع باز از کجا وارد می شود؟ تعدادی از پیاده سازی های یادگیری انتقال منبع باز وجود دارد که در اینجا برخی از رایج ترین آنها وجود دارد:
در این پست، بررسی خواهیم کرد که چگونه این دو مفهوم انقلابی در رویکرد برنامه های کاربردی دنیای واقعی ایجاد می کنند. ما به مثالهایی نگاه خواهیم کرد که چگونه منبع باز میتواند به ایجاد راهحلهای مؤثر کمک کند، در حالی که استفاده از یادگیری انتقال، تفسیر و دقت دادهها را بهینه میکند. ما همچنین به مفاهیم اصلی خواهیم پرداخت تا نحوه به کارگیری آنها را بهتر درک کنیم.
علیرغم مزایای واضح، چالشهایی با یادگیری انتقالی وجود دارد، که از نحوه تصمیمگیری برای استفاده از کدام مدل از پیش آموزشدیده شروع میشود. استفاده از مدل های موجود تنها در صورتی کار می کند که مدل مناسب را انتخاب کنید. انتخاب نامناسب می تواند به نتایج نابهینه به دلیل عدم تطابق بین توزیع داده های منبع و هدف منجر شود. علاوه بر این، ممکن است هنگام استفاده مجدد از برخی از مدلهای در دسترس عموم (مثلاً مدلهایی که در مجموعه دادههایی با اطلاعات حساس آموزش دیدهاند) مسائلی در رابطه با حریم خصوصی یا محدودیتهای قانونی وجود داشته باشد. علاوه بر این، بسته به اینکه چه مقدار داده برای آموزش و تنظیم دقیق در دسترس است، کاربران ممکن است در یافتن معماری های مناسبی که به اندازه کافی قوی هستند برای تعمیم نمونه های دیده نشده از مجموعه داده هدف خود با مشکل مواجه شوند.
· نوت بوک های آموزشی انتقال اینتل
تصویر نمونه ای از یادگیری انتقال را برای یک شبکه ResNet 50 از پیش آموزش دیده را نشان می دهد که می تواند اشیاء موجود در یک تصویر را شناسایی کند. با استفاده از هزاران تصویر آموزش داده شده است، بیش از 23 میلیون پارامتر قابل آموزش و 1000 کلاس دارد (به این معنی که می تواند 1000 شی مانند حیوانات، افراد یا چیزهای دیگر را طبقه بندی کند). با این حال، هنوز هم نمی تواند همه چیز را تشخیص دهد!
ازکیل لانزا یک مبشر متن باز در تیم اکوسیستم باز اینتل است که مشتاق کمک به مردم برای کشف دنیای هیجان انگیز هوش مصنوعی است. او همچنین یک مجری مکرر کنفرانس هوش مصنوعی و خالق موارد استفاده، آموزش و راهنماهایی است که به توسعه دهندگان کمک می کند تا ابزارهای AI منبع باز مانند TensorFlow* و Hugging Face* را بکار گیرند. او را در توییتر در @ پیدا کنیدeze_lanza
عدد برجسته شده 4098 پارامتر برای آموزش در مقابل کل پارامترها (~23M) را نشان می دهد. تصویر: ازکیل لانزا
نویسنده: ازکیل لانزا
یادگیری انتقالی به طور گسترده در (NLP) و وظایف بینایی کامپیوتری اعمال شده است، زیرا این مدلها به صدها هزار نمونه برای آموزش مدلهایی با میلیونها پارامتر نیاز دارند – برای هر شرکت یا توسعهدهندهای پرهزینه. در NLP، به طور کلی برای استفاده از مدل های از پیش آموزش دیده با جاسازی کلمه (نمایش برداری کلمات) مانند GloVe یا Word2Vec استفاده می شود. اینها به ساخت شبکههای عصبی عمیقی کمک میکنند که بتوانند دادههای متنی را بهتر از روشهای سنتی قبلی درک کنند، زیرا زمینه را برای کمک به ماشینها برای درک معنای یک عبارت فراهم میکنند.
در نهایت، از آنجایی که اکثر چارچوبهای یادگیری عمیق عمدتاً برای وظایف یادگیری نظارت شده طراحی شدهاند که در آن مجموعه دادههای برچسبگذاری شده در دسترس هستند، اغلب میتوانند با وظایف بدون نظارت یا تقویتی که به تکنیکهای انطباق اضافی مانند رویکردهای فرا یادگیری برای غلبه بر این مسئله به طور مؤثر نیاز دارند، دست و پنجه نرم کنند.