هزینه محاسباتی مدلهای هوش مصنوعی امروزی با نرخهای ناپایدار در حال افزایش است. مایک دیویس، مدیر آزمایشگاه محاسبات عصبی در آزمایشگاه اینتل، امیدواریم تحقیقات با Hala Point کارایی و سازگاری فناوری هوش مصنوعی در مقیاس بزرگ را افزایش دهد.
چه می کند: Hala Point اولین سیستم عصبی در مقیاس بزرگ است که جدیدترین کارایی محاسباتی را در بارهای کاری اصلی هوش مصنوعی نشان می دهد. خصوصیات نشان می دهد که می تواند تا 20 کوادریلیون عملیات در ثانیه یا 20 پتاوب را با بازدهی بیش از 15 تریلیون عملیات 8 بیتی در ثانیه در هر وات (TOPS/W) هنگام اجرای شبکه های عصبی عمیق سنتی پشتیبانی کند. این رقیب و فراتر از سطوح به دست آمده توسط معماری های ساخته شده بر روی واحدهای پردازش گرافیکی (GPU) و واحدهای پردازش مرکزی (CPU) است. قابلیتهای منحصربهفرد HalaPoint میتواند یادگیری مداوم در زمان واقعی را برای برنامههای هوش مصنوعی مانند حل مسائل علمی و مهندسی، تدارکات، مدیریت زیرساخت شهر هوشمند، مدلهای زبان بزرگ (LLM) و عوامل هوش مصنوعی فعال کند.
نحوه استفاده: محققان آزمایشگاه ملی ساندیا قصد دارند از Halo Point برای تحقیقات محاسباتی پیشرفته در سطح مغز استفاده کنند. تمرکز این سازمان بر حل مشکلات محاسباتی علمی در فیزیک سخت افزار، معماری کامپیوتر، علوم کامپیوتر و انفورماتیک خواهد بود.
کریگ وینیارد گفت: «کار با Hala Point توانایی تیم Sandia ما را برای حل مشکلات مدلسازی محاسباتی و علمی بهبود میبخشد. به دفاع از علوم پایه.» ، تیم Hala Point در آزمایشگاه ملی Sandia را رهبری می کند.
HalaPoint در حال حاضر یک نمونه اولیه تحقیقاتی است که قابلیت های سیستم های تجاری آینده را توسعه خواهد داد. اینتل انتظار دارد که چنین درس هایی منجر به پیشرفت های عملی شود، مانند توانایی MBA ها برای یادگیری مداوم از داده های جدید. چنین تحولاتی وعده کاهش چشمگیر بار آموزشی ناپایدار ناشی از استقرار هوش مصنوعی در مقیاس بزرگ را می دهد.
چرا اهمیت دارد: روندهای اخیر در مقیاسبندی مدلهای یادگیری عمیق به تریلیونها پارامتر، چالشهای پایداری عظیم را در هوش مصنوعی نشان داده و نیاز به نوآوری در پایینترین سطوح مهندسی سختافزار را برجسته کرده است. محاسبات عصبی یک رویکرد اساساً جدید مبتنی بر بینش های علوم اعصاب است که حافظه و محاسبات را با موازی سازی بسیار ریز ترکیب می کند تا حرکت داده ها را کاهش دهد. در نتایج منتشر شده از کنفرانس بینالمللی آکوستیک، پردازش گفتار و سیگنال (ICASSP) در این ماه، Loihi 2 دستاوردهای قابل توجهی در کارایی، سرعت و سازگاری برای حجمهای کاری در مقیاس کوچک در حال ظهور نشان داد.
Hala Point در مقایسه با نسل قبلی خود، Pohoiki Springs، با چندین پیشرفت، عملکرد عصبی و بهرهوری را به مدلهای یادگیری عمیق سنتی، بهویژه مدلهایی که بارهای کاری بلادرنگ پردازش میکنند، مانند ویدیو، گفتار و ارتباطات بیسیم، ارائه میکند. به عنوان مثال، تحقیقات اریکسون در حال پیاده سازی Loihi 2 برای بهبود کارایی زیرساخت های ارتباطی است، همانطور که در کنگره جهانی موبایل امسال مشخص شد.
درباره Hala Point: پردازندههای عصبی Loihi 2 که اساس Hala Point را تشکیل میدهند، از اصول محاسباتی الهام گرفته از مغز، مانند شبکههای عصبی ناهمزمان و رویداد محور (SNN)، حافظه و محاسبات یکپارچه، و ارتباطات پراکنده و متغیر پیوسته استفاده میکنند. دستیابی به دستاوردهای قابل توجهی در مصرف برق و عملکرد. نورونها بهجای حافظه، مستقیماً با یکدیگر ارتباط برقرار میکنند و مصرف کلی انرژی را کاهش میدهند.
Hala Point دارای 1152 پردازنده Loihi 2 است که بر روی 4 گره پردازشی اینتل در یک شاسی مرکز داده شش قفسه ای به اندازه یک اجاق مایکروویو تولید شده اند. این سیستم از 1.15 میلیارد نورون و 128 میلیارد سیناپس توزیع شده بین 140544 هسته پردازش عصبی پشتیبانی می کند که حداکثر 2600 وات انرژی مصرف می کند. همچنین شامل بیش از 2300 پردازنده x86 تعبیه شده برای محاسبات اضافی است.
هالا پوینت پردازش، حافظه و کانالهای ارتباطی را در یک بافت موازی ادغام میکند و در مجموع 16 پتابایت بر ثانیه (PB/s) پهنای باند حافظه، 3.5 PB/s پهنای باند ارتباطات بین هستهای و 5 TB/s را ارائه میکند. ترابایت/ثانیه) پهنای باند ارتباطات بین تراشه ای. این سیستم می تواند بیش از 380 تریلیون سیناپس 8 بیتی و بیش از 240 تریلیون عملیات عصبی را در ثانیه پردازش کند.
این سیستم با استفاده از مدلهای شبکههای عصبی spiking الهامگرفته از زندگی، میتواند ظرفیت کامل ۱.۱۵ میلیارد نورون خود را ۲۰ برابر سریعتر از مغز انسان و تا ۲۰۰ برابر سریعتر در ظرفیت پایینتر اجرا کند. در حالی که هالا پوینت برای مدلسازی علوم اعصاب در نظر گرفته نشده است، ظرفیت نورونهای آن تقریباً معادل مغز جغد یا قشر میمون کاپوچین است.
سیستمهای مبتنی بر Loihi میتوانند استنتاج هوش مصنوعی را انجام دهند و مشکلات بهینهسازی را با استفاده از 100 برابر توان کمتر با سرعتهایی تا 50 برابر سریعتر از معماریهای سنتی CPU و GPU حل کنند. با بهرهبرداری از اتصال پراکنده تا 10:1 و فعالیتهای رویداد محور، نتایج اولیه در Hala Point نشان میدهد که سیستم میتواند بازده شبکه عصبی عمیق تا 15 TOPS/W2 را بدون نیاز به جمعآوری دادههای ورودی به صورت دستهای، که یک بهبود رایج است، به دست آورد. به پردازندههای گرافیکی که پردازش دادههایی را که در زمان واقعی میرسند، مانند ویدیو از دوربینها، بهطور قابلتوجهی به تأخیر میاندازند. در طول این تحقیق، LLM های عصبی آینده که قادر به یادگیری مداوم هستند، می توانند با حذف نیاز به بازآموزی دوره ای با مجموعه داده های روزافزون، منجر به صرفه جویی در انرژی گیگاوات ساعتی شوند.
بعدی: تحویل Hala Point به آزمایشگاههای ملی Sandia اولین استقرار خانواده جدیدی از سیستمهای تحقیقات عصبی در مقیاس بزرگ است که اینتل قصد دارد با همکاران تحقیقاتی خود به اشتراک بگذارد. توسعه بیشتر برنامههای محاسباتی عصبی را قادر میسازد تا بر محدودیتهای قدرت و تأخیر غلبه کنند که استقرار قابلیتهای هوش مصنوعی را در دنیای واقعی و در زمان واقعی محدود میکند.
اینتل همراه با اکوسیستمی متشکل از بیش از 200 عضو جامعه تحقیقاتی نورومورفیک اینتل (INRC)، از جمله گروههای آکادمیک پیشرو، آزمایشگاههای دولتی، مؤسسات تحقیقاتی و شرکتها در سراسر جهان، مرزهای هوش مصنوعی الهامگرفته از مغز را پیش میبرد و این فناوری را پیش میبرد. از نمونه های اولیه تحقیقاتی برای محصولات تجاری پیشرو در صنعت در سال های آینده.