متا شتاب‌دهنده هوش مصنوعی جدید MTIA را با عملکرد بهبودیافته برای سهولت کنترل NVIDIA معرفی کرد.

متا نسل بعدی تراشه متا آموزش و شتاب دهنده استنتاج (MTIA) خود را معرفی کرده است که برای آموزش و استنتاج مدل های هوش مصنوعی در مقیاس طراحی شده است. جدیدترین تراشه MTIA یک طراحی نسل دوم متا سیلیکون است که به هوش مصنوعی اختصاص یافته است و بر اساس فناوری 5 نانومتری TSMC ساخته شده است. تراشه جدید با فرکانس 1.35 گیگاهرتز کار می کند و تا 90 وات TDP در هر بسته در مقایسه با 25 وات برای طراحی نسل اول افزایش می یابد. پردازش زیرروال جبر خطی پایه (BLAS) جایی است که تراشه می درخشد و شامل ضرب ماتریس و پردازش برداری/SIMD است. در پردازش آرایه GEMM، هر تراشه می تواند 708 ترافلاپ در INT8 (که در مشخصات به معنای FP8 است) با پراکندگی، 354 ترافلاپ بدون، 354 ترافلاپ در FP16/BF16 با پراکندگی و 177 ترافلوپس بدون پراکندگی.

پردازش برداری و کلاسیک در 11.06 ترافلاپ در INT8 (FP8)، 5.53 ترافلاپس در FP16/BF16 و 2.76 ترافلوپس در FP32 تک دقیق کمی کندتر است. تراشه MTIA به طور خاص برای اجرای آموزش هوش مصنوعی و استنتاج در چارچوب هوش مصنوعی PyTorch Meta با یک Backend منبع باز Triton که کد کامپایل شده را برای عملکرد بهینه تولید می کند، طراحی شده است. متا از این برای همه مدل‌های Llama خود استفاده می‌کند، و با Llama3 در گوشه و کنار، می‌توان روی این تراشه‌ها آموزش داد. متا برای مونتاژ آنها در یک سیستم، دو عدد از این تراشه ها را روی یک برد قرار می دهد و آنها را با 128 گیگابایت حافظه LPDDR5 جفت می کند. این برد از طریق PCIe Gen 5 به سیستمی متصل می شود که در آن 12 برد به صورت متراکم روی هم قرار گرفته اند. این فرآیند شش بار در یک قفسه برای 72 پنل و 144 تراشه در یک قفسه برای مجموع 101.95 پتافلاپ با فرض مقیاس‌بندی خطی با دقت INT8 (FP8) تکرار می‌شود. البته، مقیاس‌گذاری خطی در سیستم‌های مقیاس‌پذیر کاملاً امکان‌پذیر نیست، که آن را به کمتر از 100 پتافلاپ در هر رک کاهش می‌دهد.

در زیر تصاویری از شماتیک و مشخصات چیپست نسبت به نسخه قبلی و همچنین سیستم را مشاهده می کنید.

منبع

Tags: اینتل

متا شتاب‌دهنده هوش مصنوعی جدید MTIA را با عملکرد بهبودیافته برای سهولت کنترل NVIDIA معرفی کرد.

AleksandarK

گامدیاس سری PSU طلایی Helios P1A 80 Plus را معرفی کرد

نوشته‌های تازه

اینتل مگ

دسته‌ها

جدیدترین خبرها

شارکون قاب Rebel C20 ITX را برای نسخه های کامپکت رده بالا معرفی می کند

Astor: Blade of the Monolith در تاریخ 30 می بر روی تمامی پلتفرم ها عرضه خواهد شد

متا شتاب‌دهنده هوش مصنوعی جدید MTIA را با عملکرد بهبودیافته برای سهولت کنترل NVIDIA معرفی کرد.

AleksandarK

گامدیاس سری PSU طلایی Helios P1A 80 Plus را معرفی کرد

نوشته‌های تازه

اینتل مگ

دسته‌ها

برچسب‌ها

جدیدترین خبرها

شارکون قاب Rebel C20 ITX را برای نسخه های کامپکت رده بالا معرفی می کند

Astor: Blade of the Monolith در تاریخ 30 می بر روی تمامی پلتفرم ها عرضه خواهد شد