نویسندگان: اولگا پرپلکینا، ازکیل لانزا
یادگیری فدرال نوعی یادگیری ماشینی است که به کاربران امکان می دهد مدل های پیش بینی را با داده های ذخیره شده در دستگاه های مختلف یا در مکان های مختلف ایجاد کنند. این رویکرد توزیعشده سازمانها را قادر میسازد تا از تحلیلهای قدرتمند بدون ارسال دادههای حساس از طریق اینترنت استفاده کنند. در عوض، پارامترهای مدل بین دو یا چند طرف ارسال میشوند در حالی که دادههای واقعی در هر دستگاه باقی میمانند. این کار ساخت و استقرار مدلها را در چندین ماشین و شبکه برای شرکتها آسانتر میکند و در عین حال دادهها را ایمن نگه میدارد.
مثال دیگر زمانی است که شرکت ها از چندین سرویس مبتنی بر ابر استفاده می کنند که ادغام آنها در یک پلت فرم منسجم اغلب دشوار است (Juan-Verdejo & Surajbali، 2016). بدون ادغام مناسب در میان پلتفرمها، دسترسی مؤثر به دادههای مشتری ذخیره شده در سرویسهای مختلف و استفاده از آنها برای کسبوکارها دشوار میشود.
یادگیری فدرال مزایای بی شماری را برای سازمان ها از نظر حفاظت و امنیت داده ها ارائه می دهد. با اجازه دادن به مدلها برای ساخت دستگاههای جداگانه، خطر افشای اطلاعات محرمانه یا حساس کاربر از طریق اینترنت در حین انتقال بین طرفهای مختلف را از بین میبرد. علاوه بر این، این رویکرد همچنین تضمین میکند که هیچ نهاد واحدی هرگز به تمام دادهها دسترسی نخواهد داشت که سطح حریم خصوصی کاربران و اطلاعات شخصی آنها را بیشتر میکند.
اولگا پرپلکینا، مدیر محصول هوش مصنوعی در اینتل
او دارای مدرک دکترا در علوم اعصاب و مدرک فوق لیسانس در یادگیری ماشین/علوم داده است. او همچنین مشاور صنعتی در دانشکده آموزش دکتری در دانشگاه گلاسکو است. او را در لینکدین پیدا کنید.
برای محتوای متن باز بیشتر از اینتل، بررسی کنید open.intel
مشکل سیلو داده زمانی اتفاق میافتد که سازمانها مقادیر زیادی از دادههای با ارزش را در اختیار دارند، اما راههایی برای دسترسی و ادغام آنها در بینشهای معنادار ندارند. (چنگ و همکاران، 2020).
آیا می خواهید با یادگیری فدرال شروع کنید؟ با امتحان کردن یک چارچوب متن باز مانند Open Federated Learning (OpenFL) می توانید ببینید که چگونه کار می کند. این یک کتابخانه Python* 3 برای یادگیری فدرال است که سازمانها را قادر میسازد تا به طور مشترک یک مدل را بدون اشتراکگذاری اطلاعات حساس آموزش دهند. مخزن GitHub* را بررسی کنید و از اسناد اینجا بیشتر بیاموزید.
ازکیل لانزا یک مبشر متن باز در تیم اکوسیستم باز اینتل است که مشتاق کمک به مردم برای کشف دنیای هیجان انگیز هوش مصنوعی است. او همچنین یک مجری مکرر کنفرانس هوش مصنوعی و خالق موارد استفاده، آموزش و راهنماهایی است که به توسعه دهندگان کمک می کند تا ابزارهای AI منبع باز مانند TensorFlow* و Hugging Face* را بکار گیرند. او را در توییتر در @ پیدا کنیدeze_lanza
در اینجا سه راه حل رایج برای مشکل وجود دارد:
- ادغام دستی داده ها
جمع آوری و ترکیب اطلاعات مختلف از چندین منبع در یک پایگاه داده واحد. ممکن است وقت گیر و پرهزینه باشد، اما اغلب لازم است دید دقیقی از عملیات شرکت و داده های مشتریان در تمام بخش ها یا بخش ها داشته باشید. - نرم افزار یکپارچه سازی داده ها
این گزینه دیگری برای شکستن سیلو است که به سازمانها اجازه میدهد تا به سرعت سیستمها، برنامهها، پایگاههای داده و سرویسهای مختلف را بدون نیاز به کدنویسی دستی یا تلاش یکپارچه به هم متصل کنند. این برنامه ها روشی خودکار برای استخراج مجموعه داده های مرتبط از منابع متفاوت با ترسیم اشتراکات آنها مانند نام فیلدها یا انواع داده ها فراهم می کنند تا بتوان آنها را در یک مخزن واحد برای دسترسی آسان تر ترکیب کرد. (پتل، 2019) - یادگیری فدرال
در سال های اخیر، FL به عنوان یکی از امیدوارکننده ترین رویکردها برای مدیریت مقادیر زیادی از داده های توزیع شده ظاهر شده است. این شرکت ها را قادر می سازد تا مدل های پیش بینی با اطلاعات حساس کاربر ذخیره شده در دستگاه های جداگانه ایجاد کنند که از افشای هرگونه جزئیات محرمانه از طریق اینترنت در حین انتقال بین طرفین جلوگیری می کند. از آنجایی که سازمانهای بیشتری از این فناوری استفاده میکنند، به ابزار مهمی برای شکستن دیوارهای موجود بین پایگاههای داده در سطح سازمانی تبدیل میشود و در عین حال بینشهایی را از آنها بهدست میآورند.
پاتل، جی (2019). پل زدن سیلوهای داده با استفاده از یکپارچه سازی داده های بزرگ. مجله بین المللی سیستم های مدیریت پایگاه داده، 11(3)، 01-06. https://doi.org/10.5121/ijdms.2019.11301
Carruthers، A. (2022). شکستن سیلوهای داده. در A. Carruthers، ساخت Snowflake Data Cloud (ص 29-50). Apress. https://doi.org/10.1007/978-1-4842-8593-0_2
در نهایت، سیستمهای قدیمی که فاقد APIهای مدرن یا سایر روشهای ارتباط با فناوریهای جدیدتر هستند، میتوانند موانع قابل توجهی ایجاد کنند تا شرکتها را از دسترسی به مجموعه دادههای غنی از بینش مهمی که در آنها قرار دارند، بازدارند. در بسیاری از موارد حتی اگر آنها قادر به اتصال بودند، باز هم به فرآیندهای دستی نیاز دارند تا تجزیه و تحلیل های معنی دار را استخراج کنند که منجر به تاخیرهای زمانی قابل توجهی می شود که می تواند منجر به اشتباهات پرهزینه در طول فرآیندهای تصمیم گیری شود (Carruthers, 2022).
سیلوهای داده همچنین میتوانند در سطح سازمانی رخ دهند، زمانی که چندین فروشنده در مدیریت جنبههای مختلف فرآیند کسبوکار دخیل هستند، اما هیچکدام با دید کلی در مورد نحوه کار همه چیز با هم، وجود ندارند. به عنوان مثال، اگر یک فروشنده موجودی را مدیریت کند در حالی که دیگری سفارشات فروش را بدون هیچ گونه ارتباطی بین آنها مدیریت می کند، برای تیم مدیریت ارشد شرکت نمی توان تصویر کاملی از نحوه اجرای عملیات خود بدست آورد.
علاوه بر بهبود امنیت داده ها، آموزش فدرال مقیاس پذیری و کارایی بهتری را در مقایسه با سیستم های یادگیری ماشین سنتی ارائه می دهد. این سازمان ها را قادر می سازد تا به سرعت مدل ها را در چندین شبکه بدون نیاز به انتقال مقادیر زیادی از داده های حساس از یک سرور یا دستگاه به سرور دیگر مستقر کنند. این امر زمان و منابع صرف شده را کاهش می دهد و در عین حال بینش دقیقی از رفتار مشتری یا سایر روندهای بازار با حداقل تلاش از طرف سازمان دریافت می کند.
یکی از رایجترین نمونههای مشکل سیلو داده زمانی است که بخشها یا بخشهای مختلف در یک سازمان پایگاههای داده و سیستمهای خود را برای جمعآوری و ذخیره دادهها دارند. این می تواند منجر به مغایرت بین اطلاعات نگهداری شده توسط هر بخش و همچنین ناسازگاری بین برنامه های مورد استفاده برای دسترسی و تجزیه و تحلیل این داده ها شود. در نتیجه، سازمان ها ممکن است به دلیل این تفاوت ها نتوانند بینش دقیقی را از همه منابع موجود به دست آورند.
چنگ، ی.، لیو، ی.، چن، تی، و یانگ، کیو (2020). یادگیری فدرال برای هوش مصنوعی حفظ حریم خصوصی. ارتباطات ACM، 63(12)، 33-36. https://doi.org/10.1145/3387107
یادگیری فدرال یک راه حل موثر برای مقابله با مشکل سیلو داده است. با اجازه دادن به مدلها برای ایجاد مدلها در دستگاههای جداگانه بدون نیاز به ارسال اطلاعات حساس کاربر از طریق اینترنت، اطمینان میدهد که جزئیات محرمانه ایمن و ایمن نگه داشته میشوند و در عین حال دسترسی سازمانها به تجزیه و تحلیلهای قدرتمند را فراهم میکند. علاوه بر این، FL همچنین میتواند مقیاسپذیری و کارایی را با کاهش زمان و منابع صرف شده در هنگام استقرار مدلها در چندین شبکه و همچنین افزایش عملکرد هوش مصنوعی به دلیل ماهیت توزیعشده آن بهبود بخشد. این مزایا آن را به ابزاری عالی برای شرکتهایی تبدیل میکند که به دنبال دریافت بینش از دادههای خود بدون به خطر انداختن استانداردهای حریم خصوصی یا امنیتی هستند.
اسد، م.، مصطفی، ع.، و ایتو، ت. (2021). یادگیری فدرال در مقابل یادگیری ماشین کلاسیک: مقایسه همگرایی (arXiv:2107.10976). arXiv. http://arxiv.org/abs/2107.10976
Juan-Verdejo، A.، & Surajbali، B. (2016). معماری بازار چند ابری XaaS در حال اجرای مفاهیم صنعت 4.0. در LM Camarinha-Matos، AJ Falcão، N. Vafaei، & S. Najdi (Eds.) نوآوری فن آوری برای سیستم های فیزیکی-سایبری (جلد 470، ص 11-23). انتشارات بین المللی Springer. https://doi.org/10.1007/978-3-319-31165-4_2