به گفته AMD، SGLang، یک زمان اجرا که اکنون توسط ROCm 6.3 پشتیبانی می شود، به طور خاص برای بهبود استنباط در مدل هایی مانند LLM و VLM در پردازنده های گرافیکی AMD Instinct طراحی شده است و به لطف Python یکپارچه و ظروف ROCm Docker پیکربندی شده از قبل، 6 برابر توان عملیاتی بالاتر و استفاده آسان تر را وعده می دهد. . علاوه بر این، AMD ROCm 6.3 همچنین بهینهسازیهای اضافی کامپایلر را با FlashAttention-2 ارائه میکند، که باید پیشرفتهای قابل توجهی را نسبت به FlashAttention-1، یک کامپایلر کاملاً جدید AMD Fortran با بارگذاری مستقیم GPU و سازگاری با عقب، به همراه داشته باشد هسته های HIP و کتابخانه های ROCm، پشتیبانی جدید FFT کاملا چند گره در rocFFT، که مقیاس بندی چند گره را ساده می کند و مقیاس پذیری را بهبود می بخشد، و همچنین کتابخانه های FFT چند گره جدید. بینایی کامپیوتری، rocDecode، rocJPEG و rocAL بهبود یافته، برای پشتیبانی از کدک AV1، رمزگشایی JPEG با شتاب GPU و تقویت صدای بهتر.
AMD مشتاق بود اشاره کند که ROCm 6.3 همچنان به «ارائه ابزارهای پیشرفته برای ساده کردن فرآیند توسعه و در عین حال دستیابی به عملکرد و مقیاسپذیری بهتر برای بارهای کاری هوش مصنوعی و HPC» و همچنین به پذیرش روح منبع باز و تکامل برای ملاقات با توسعهدهندگان ادامه میدهد. نیاز دارد. می توانید جزئیات بیشتر را در مرکز اسناد ROCm یا وبلاگ های AMD ROCm بیابید.