در طول مرحله تحقیق و توسعه و معیار، ما توانستیم ببینیم که چقدر آسان استقرار، نصب و پیکربندی محیط HPC با استفاده از AWS ParallelCluster. ما همچنین مشاهده کردهایم که نمونههای C5n و M5zn با چه سرعتی در همه مناطق AWS در سراسر جهان در دسترس هستند. نمونه های M5zn از جهات مختلفی کاملاً متفاوت هستند. آنها هسته های سریع تری دارند و بر اساس معماری اینتل Cascade Lake هستند.
در نمودار شکل 3، هر چوب یک اجرا با پیکربندی متفاوت آمازون FSx برای پارامترهای Luster را نشان می دهد. به عنوان مثال، 5S — 1M به این معنی است که آزمون با 5 فاکتور Stripes و 1 مگابایت به عنوان اندازه بلوک داده کالیبره شده است.
در این آزمایش دوم، خواندن و نوشتن در سیستم فایل آمازون FSx for Luster را در برنامه EFISPEC3D فعال کردیم زیرا برنامه از نوشتن داده از طریق Intel MPI استفاده می کند. سپس ما تصمیم گرفتیم عملکرد Amazon FSx را برای Lustre بررسی کنیم.
هدف آزمایش عملکرد نوشتن نتایج در یک سیستم فایل زمانی بود که 2048 کار به طور همزمان نتایج را در سیستم فایل می نویسند. برای این آزمایش، ما از یک خوشه از 57 نمونه c5n.18xlarge استفاده کرده ایم.
متوجه میشویم که بهترین عملکردها با EFISPEC3D زمانی حاصل میشود که سیستم فایل را با ضریب راه راه 80 و اندازه بلوک 10 مگابایت تنظیم کنیم.
در اولین آزمایشها، ما مقیاسبندی قوی برنامه EFISPEC3D را روی نمونههای AWS c5n.18xlarge و m5zn.12xlarge آزمایش میکنیم.
از داده ها (206 گیگابایت). اندازه نوار از 1 مگابایت تا 10 مگابایت و فاکتور نوار از 5 تا 80 متغیر است.
¹ EFISPEC3d در کارگاه HPC نشان داده شده است. این کارگاه کاربر را از طریق فرآیند استقرار یک خوشه HPC و اجرای نرم افزار EFISPEC3D راهنمایی می کند. در این مکان یافت می شود:
نویسندگان و مشارکت کنندگان:
- فلورنت دی مارتین (BRGM) – زلزله شناس
- فایزه بولاحیا (BRGM) – دانشمند داده
- استیو مسنجر (AWS) – معمار ارشد راه حل متخصص HPC
- Gilles Tourpe (AWS) – مدیر توسعه کسب و کار HPC
- Diego Bailon HUMPERT (اینتل) – مدیر توسعه فروش AWS EMEA
- Loubna Wortley (اینتل) – مدیر توسعه فروش AWS EMEA
- لیلیا ضیانه خوجا (ANEO) – مشاور کارشناس HPC،
- دیمین دوبوک (ANEO) – کارشناس معمار راه حل HPC
اطلاعیه ها و سلب مسئولیت:
- عملکرد بر اساس استفاده، پیکربندی و سایر عوامل متفاوت است. بیشتر بدانید در www.Intel.com/PerformanceIndex.
- نتایج عملکرد بر اساس آزمایش در تاریخهای نشاندادهشده در پیکربندیها است و ممکن است همه بهروزرسانیهای در دسترس عموم را منعکس نکند. برای جزئیات پیکربندی به نسخه پشتیبان مراجعه کنید. هیچ محصول یا جزئی نمی تواند کاملاً ایمن باشد.
- هزینه ها و نتایج شما ممکن است متفاوت باشد.
- اینتل داده های شخص ثالث را کنترل یا ممیزی نمی کند. برای دقت باید به منابع دیگر مراجعه کنید.
- فناوریهای اینتل ممکن است به فعالسازی سختافزار، نرمافزار یا سرویس نیاز داشته باشند.
- © شرکت اینتل. اینتل، لوگوی اینتل و سایر علائم اینتل علائم تجاری Intel Corporation یا شرکت های تابعه آن هستند. نام ها و مارک های دیگر ممکن است به عنوان مالکیت دیگران ادعا شود. را
EFISPEC3D یک برنامه کامپیوتری علمی است که معادلات سه بعدی حرکت را با استفاده از روش المان محدود طیفی گالرکین پیوسته حل می کند. کد با استفاده از رابط عبور پیام (MPI) موازی می شود.
نتایج عملکرد
در طول تست های مقیاس بندی قوی، ما توانستیم عملکرد بسیار خوبی از برنامه EFISPEC3D را مشاهده کنیم که قدرت سرورهای C5n و M5zn را برای دنیای HPC نشان می دهد. یک شبیهسازی معمولی که حدود 300 روز بر روی یک هسته به طول میانجامد، در 25 دقیقه در AWS Cloud، با استفاده از 27 هزار هسته فیزیکی و بدون hyperthreading اجرا میشود.
نتایج زمانهای سپری شده را برای محاسبه حلقه زمانی (بر حسب ثانیه) EFISPEC3D با استفاده از ارتباطات مسدودکننده یا غیرمسدود، و سرعتهای بهدستآمده با توجه به شبیهسازی انجام شده روی یک هسته فیزیکی ارائه میکنند. میتوانیم متوجه شویم که مقیاس قوی در خوشه AWS با EFA 67٪ در 27036 هسته است، بهویژه برای نسخه ارتباطی غیرمسدود که برای آن سرعت 18030 روی 27036 هسته فیزیکی به دست آمده است (شکل 1 را ببینید). چنین افزایش سرعتی امکان محاسبه یک شبیهسازی استاندارد زلزله را در حدود 25 دقیقه به جای 300 روز روی یک هسته واحد فراهم میکند.
یک شبیه سازی در 101 مرحله زمانی با اندازه 1.0E-03 انجام می شود. جدول 1 اطلاعاتی در مورد شبیه سازی های مختلف انجام شده در نمونه های آمازون C5n نشان می دهد:
مقدمه
علاقه مندی در اینجا ارائه استفاده از خدمات AWS برای انجام شبیه سازی های پیش بینی BRGM است. یک شبیهسازی معمولی که حدود 300 روز بر روی یک هسته به طول میانجامد، در 25 دقیقه در AWS Cloud، با استفاده از 27 هزار هسته فیزیکی و بدون hyperthreading اجرا میشود.
هنگامی که از ارتباطات مسدود کننده استفاده می شود، می توانیم شاهد افت عملکرد در حدود 2048 هسته به دلیل زمان تراکم ناپذیر ارسال تماس های دریافت MPI باشیم.
شبیه سازی هگزادر 7M
این پست گزارشی از عملکرد EFISPEC3D[1]، برنامه HPC BRGM برای محاسبه سناریوهای زلزله بر روی اهرم AWS با پردازنده های Intel® Xeon® Scalable و Intel® OneAPI Toolkit برای تسریع محاسبات.
27 هزار هسته استفاده شده برای این گزارش عملکرد بر اساس نمونههای c5n.18xlarge با پردازنده Intel® Xeon® Platinum 8000 Series (Skylake-SP) و همچنین نمونههای m5zn.12xlarge با پردازندههای سفارشی Intel® Xeon® Scalable نسل دوم (Cascade Lake) هستند. ) در 4.5 گیگاهرتز. هر دو نمونه c5n و m5zn آمازون از آداپتور Elastic Fabric Adapter (EFA) برای پشتیبانی از ارتباطات بین گره ها استفاده می کنند.
در مورد سیستم فایل آمازون FSx for Luster، ما به پهنای باند بالاتر از 10 گیگابایت بر ثانیه رسیدیم که بیش از نیازهای برنامه ما را با نوشتن دیسک فشرده توسط همه گرههای محاسباتی برآورده کرد.
تاثیر پارامترهای سیستم فایل درخشش در پهنای باند اندازه گیری شده برای مرحله خواندن
EFISPEC3D با Fortran08 و Intel MPI برای حل معادلات موج سه بعدی با روش المان محدود طیفی پیاده سازی شده است.
Bureau de Recherches Géologiques et Minières (BRGM، سازمان زمین شناسی فرانسه) مؤسسه عمومی پیشرو در فرانسه برای کاربردهای علوم زمین برای مدیریت منابع سطحی و زیرسطحی با دیدگاه توسعه پایدار است.
در طی مراحل پس از پردازش برنامه EFISPEC3D، پهنای باند برای نوشتن یک فایل نتیجه 206 گیگابایتی به 10.3 گیگابایت در ثانیه افزایش یافت.