Aurora از همان ابتدا به عنوان یک سیستم مبتنی بر هوش مصنوعی طراحی شد و به محققان این امکان را میدهد تا از مدلهای مولد هوش مصنوعی برای تسریع اکتشافات علمی استفاده کنند. پیشرفت قابل توجهی در تحقیقات اولیه مبتنی بر هوش مصنوعی Argonne حاصل شده است. داستانهای موفقیتآمیز شامل نقشهبرداری از ۸۰ میلیارد نورون مغز انسان، فیزیک ذرات پرانرژی با یادگیری عمیق، و طراحی و کشف دارو که توسط یادگیری ماشینی تسریع شدهاند، از جمله موارد دیگر است. ابررایانه Aurora یک سیستم گسترده با 166 رک، 10624 کد حسابی، 21248 پردازنده Intel Xeon CPU Series Max و 63744 Intel Data Center GPU Max Series است که آن را به یکی از بزرگترین کلاسترهای GPU در جهان تبدیل می کند.
Aurora همچنین شامل بزرگترین اتصال ابر محاسباتی باز مبتنی بر اترنت در یک سیستم واحد با 84992 نقطه پایانی فابریک HPE است. ابررایانه Aurora در معیار LINPACK با کارایی بالا (HPL) در رتبه دوم قرار گرفت، اما با استفاده از 9234 گره یا فقط 87 درصد از سیستم، سد اگزا مقیاس را با 1012 اگزافلاپس شکست. ابرکامپیوتر Aurora همچنین جایگاه سوم را در معیار گرادیان مزدوج با کارایی بالا (HPCG) با نرخ 5612 ترافلاپ در ثانیه (TF/s) برای 39 درصد از دستگاه کسب کرد. هدف این معیار ارزیابی سناریوهای واقعیتر است که بینشهایی را در مورد الگوهای ارتباطی و دسترسی به حافظه ارائه میدهند، که عوامل مهمی در برنامههای HPC در دنیای واقعی هستند. استانداردهایی مانند LINPACK را با ارائه دیدی جامع از قابلیت های یک سیستم تکمیل می کند.
در قلب ابرکامپیوتر Aurora، اینتل Data Center GPU Max Series قرار دارد. معماری پردازنده گرافیکی Intel Xe پایهای برای سری Max است و دارای سختافزار تخصصی مانند بلوکهای محاسباتی ماتریسی و برداری است که برای وظایف هوش مصنوعی و HPC بهینه شدهاند. اینتل.
قابلیتهای پردازش موازی معماری Xe در مدیریت عملیات بردار ماتریس پیچیده ذاتی در محاسبات هوش مصنوعی شبکه عصبی عالی است. این هسته های محاسباتی در تسریع عملیات ماتریس که برای مدل های یادگیری عمیق مهم هستند، محوری هستند. معماری Xe که با مجموعه ابزار نرمافزار اینتل، از جمله کامپایلر OneAPI DPC++/C++ Intel، مجموعهای غنی از کتابخانههای عملکردی، و چارچوبها و ابزارهای هوش مصنوعی بهینهسازی شده تکمیل میشود، یک اکوسیستم توسعهدهنده باز را تقویت میکند که در دستگاهها و عوامل شکلی انعطافپذیر و مقیاسپذیر است.
در جلسه ویژه خود در ISC 2024، در روز سه شنبه، 14 می، ساعت 6:45 بعد از ظهر، (GMT+2) سالن 4، مرکز همایش هامبورگ، آلمان، مدیر عامل شرکت کدپلی، اندرو ریچاردز، یک شرکت اینتل، به تقاضای رو به رشد برای محاسبات خواهد پرداخت. و شتاب نرم افزار در HPC و AI. این اهمیت OneAPI را برجسته می کند، که یک مدل برنامه نویسی یکپارچه را در معماری های مختلف ارائه می دهد. بر اساس استانداردهای باز، OneAPI توسعه دهندگان را قادر می سازد تا کدی را ایجاد کنند که به طور یکپارچه بر روی پلتفرم های سخت افزاری مختلف بدون تغییرات گسترده یا قفل شدن فروشنده اجرا شود. این همچنین هدف بنیاد یکپارچه شتاب دهنده (UXL) بنیاد لینوکس است، جایی که Arm، Google، Intel، Qualcomm و دیگران در حال توسعه یک اکوسیستم باز برای همه شتاب دهنده ها و محاسبات یکپارچه ناهمگن بر اساس استانداردهای باز برای شکستن قفل اختصاصی هستند. بنیاد UXL در حال افزودن اعضای بیشتری به ائتلاف رو به رشد خود است.
در همین حال، Intel Tiber Developer Cloud قدرت محاسباتی خود را با پلتفرمهای سختافزاری جدید و قابلیتهای خدماتی جدید گسترش میدهد که به شرکتها و توسعهدهندگان اجازه میدهد آخرین معماری اینتل را ارزیابی کنند، مدلها و حجمهای کاری هوش مصنوعی را به سرعت نوآوری و بهینه کنند، و سپس مدلهای هوش مصنوعی را در مقیاس اجرا کنند. دستگاههای جدید شامل پیشنمایشهای Intel Xeon 6 E-core و سیستمهای P-core برای مشتریان منتخب، و خوشههای مقیاس کامل مبتنی بر Intel Gaudi 2 و Intel Data Center GPU Max Series هستند. قابلیتهای جدید شامل سرویس Intel Kubernetes برای آموزش هوش مصنوعی ابری، حجم کاری استنتاج و محاسبه چند مستاجر است.
ابررایانههای جدیدی که با استفاده از فناوریهای Intel Xeon CPU Max Series و Intel Data Center GPU Max Series به کار گرفته شدهاند، هدف اینتل برای پیشرفت HPC و AI را نشان میدهد. این سیستم ها شامل کاساندرا از مرکز اروپایی مدیترانه ای برای تغییر آب و هوا (CMCC) برای تسریع مدل سازی تغییرات آب و هوایی است. آژانس ملی ایتالیا برای فناوریهای جدید، انرژی و توسعه اقتصادی پایدار (ENEA) CRESCO 8 برای ایجاد پیشرفتهایی در انرژی همجوشی. مرکز محاسبات پیشرفته تگزاس (TACC)، که برای فعال کردن تجزیه و تحلیل دادهها در زیستشناسی جریانهای آشفته مافوق صوت و شبیهسازی اتمی روی طیف وسیعی از مواد، کاملاً عملیاتی است. و همچنین سازمان انرژی اتمی بریتانیا (UKAEA) برای حل مشکلات مربوط به حافظه که از طراحی نیروگاه های همجوشی آینده پشتیبانی می کند.
نتیجه آزمایش هوش مصنوعی با دقت ترکیبی، مبنایی برای نسل بعدی پردازندههای گرافیکی اینتل برای هوش مصنوعی و HPC با کد Falcon Shores خواهد بود. Falcon Shores از نسل بعدی معماری Intel Xe با بهترین اینتل Gaudi بهره خواهد برد. این ادغام یک رابط برنامه نویسی یکپارچه را امکان پذیر می کند.
نتایج اولیه عملکرد در Intel Xeon 6 با حافظه P-core و Multiplexer Combined Ranks (MCR) با 8800 مگا انتقال در ثانیه (MT/s) تا 2.3 برابر بهبود عملکرد را برای برنامه های HPC در دنیای واقعی، مانند Nucleus برای مدلسازی اروپایی اقیانوس (NEMO)، هنگامی که با نسل قبلی مقایسه می شود، پایه ای قوی به عنوان انتخاب CPU میزبان ترجیحی برای راه حل های HPC ایجاد می کند.