ما از توصیف معیار و دادههای عملکرد در شکل 1 استفاده کردیم تا تا حد امکان به مقایسه عملکرد سیب به سیب Sentieon و Parabricks نزدیک شویم. ما مراحل haplotypecaller، post-processing و fq2bam را از شکل 1 تا مراحل معمول خط لوله فراخوانی متغیر ترسیم کردیم (جدول 1). نقشه برداری ما بر اساس توضیحات زیر از معیارهای Parabricks است:
ما روی تست HG001 WGS 30x از چالش حقیقت PrecisionFDA تمرکز خواهیم کرد. مقایسه عملکرد Parabricks در مقابل جعبه ابزار تجزیه و تحلیل ژنوم (GATK) برای این آزمایش ارائه شده است (شکل 1). GATK استانداردی است که بر اساس آن دقت فراخوانی نوع مورد قضاوت قرار می گیرد، اما در جاوا نوشته شده است، بنابراین استاندارد طلایی عملکرد نیست. دانشگاه ایلینوی و کلینیک مایو قبلاً ثابت کردهاند که Sentieon به طور قابلتوجهی از GATK بدون از دست دادن دقت بهتر عمل میکند: Sentieon DNASeq Variant Calling Workflow عملکرد و دقت محاسباتی قوی را نشان میدهد. بنابراین، ما با مقایسه GATK زحمت نخواهیم کشید. هدف ما مقایسه نرم افزار Sentieon (نوشته شده در C++ و بهینه سازی شده برای CPU های برداری مدرن) با Parabricks (نوشته شده در CUDA و بهینه سازی شده برای پردازنده های گرافیکی NVIDIA) است.

مقایسه عملکرد Sentieon DNASeq با NVIDIA Clara Parabricks
نرمافزار Sentieon برای پردازندههای مدرن، بهویژه پردازندههای Intel Xeon، برای دستیابی به عملکرد بالا بدون زبانهای برنامهنویسی اختصاصی یا سختافزار تخصصی بردار شده است، که قفل شدن فروشنده را حذف میکند و هزینههای توسعه، استقرار و نگهداری نرمافزار را کاهش میدهد. ما میخواستیم عملکرد و دقت Sentieon را با جایگزینهایی مانند NVIDIA Clara Parabricks مقایسه کنیم تا ببینیم آیا سختافزار تخصصی مقرون به صرفه است یا حتی ضروری است.
فناوری های توالی یابی نسل بعدی (NGS) هزینه و زمان مورد نیاز برای توالی یابی کل ژنوم ها و اگزوم ها را به میزان قابل توجهی کاهش داده است. NGS و تجزیه و تحلیل ثانویه کارآمد، پزشکی دقیق را به محیط بالینی و حتی به نقطه مراقبت رسانده است. Sentieon نرم افزار تجزیه و تحلیل ژنوم خود را برای پردازنده های نسل سوم Intel® Xeon® Scalable و نسل چهارم پردازنده Intel Xeon Scalable (که قبلاً با نام رمز Sapphire Rapids شناخته می شد) بهینه کرد. این به گونه ای طراحی شده است که بر روی سیستم های چند هسته ای برای دستیابی به بهترین عملکرد در کلاس خود طراحی شده است، چه نیاز بالینی بازگشت سریع (مثلاً در بخش اورژانس برای پیش بینی واکنش های نامطلوب دارویی از یک ژنوم بیمار) باشد یا توان عملیاتی بالا (به عنوان مثال، در انکولوژی). آزمایشگاهی برای تجزیه و تحلیل نمونه های متعدد از یک تومور یا از بیماران مختلف).
«fq2bam مرحله شامل bwa-mem و بخش هایی از مرتب سازی مختصات، پس پردازش است شامل بخش هایی از مرتبسازی مختصات، علامتگذاری موارد تکراری و سپس bqsr. هاپلوتایپ فراخوان مرحله applicationbqsr روی bam ورودی اعمال میشود، که سپس به مرحله فراخوانی نوع داده میشود.

Sentieon از زبان های برنامه نویسی اختصاصی مانند CUDA استفاده نمی کند، بنابراین از قفل شدن فروشنده جلوگیری می کند. این نرم افزار به زبان C++ استاندارد نوشته شده است. همچنین برای استفاده از قابلیت پردازش برداری پردازنده های مدرن بهینه شده است. Sentieon برای دستیابی به عملکرد از بهبودهای الگوریتمی به جای سخت افزار گران قیمت و پرقدرت استفاده می کند. برای همه پلتفرم های توالی خوانی کوتاه و بلند مدت پشتیبانی و بهینه سازی می کند و یک برنده ثابت در چالش های باز FDA است. این نشان می دهد که Sentieon در پردازنده های Intel Xeon Scalable پلت فرم رهبری برای تجزیه و تحلیل ثانویه ژنوم است.
عملکرد رقابتی Sentieon در مقابل Parabricks در انواع پلتفرمهای محاسباتی در شکل 2 و جدول 2 نشان داده شده است. پلتفرمها و جزئیات قیمت در جدول 3 نشان داده شدهاند. پردازندههای نسل سوم اینتل Xeon Scalable عملکرد رقابتی را ارائه میدهند. پردازنده نسل چهارم اینتل Xeon Scalable (با کد قبلی Sapphire Rapids) بهترین عملکرد کلی را ارائه می دهد. با این حال، اجرا تنها بخشی از داستان است. هزینه به ازای هر ژنوم و مصرف انرژی نیز باید در نظر گرفته شود.
فناوریهای اینتل ممکن است به فعالسازی سختافزار، نرمافزار یا سرویس نیاز داشته باشند.
از نظر مصرف انرژی، دو پردازنده Intel Xeon Platinum 8352M در نمونه c6i.metal به 370 وات نیاز دارند، در حالی که هشت پردازنده NVIDIA A100 Tensor Core در نمونه p4d.24xlarge به 3200 وات نیاز دارند. بهترین عملکرد Parabricks به 8.6 برابر قدرت و 3.0 برابر هزینه نیاز دارد، اما فقط 1.5 برابر عملکرد پردازنده نسل فعلی Intel Xeon 8352M را ارائه می دهد.

© شرکت اینتل. اینتل، لوگوی اینتل و سایر علائم اینتل علائم تجاری Intel Corporation یا شرکت های تابعه آن هستند. نام ها و مارک های دیگر ممکن است به عنوان مالکیت دیگران ادعا شود.
اندازهگیریهای عملکرد توسط Sentieon در مارس 2022 انجام شد. سیستم مبتنی بر پردازنده Intel® Xeon® 8368 یک پردازنده دو سوکتی 2.4 گیگاهرتزی Intel Xeon Platinum 8368 (152 هسته، HyperThreading فعال)، حافظه 256 گیگابایتی TDR4، و 320 TDR4 است. درایوهای SSD اینتل 660p و 2 ترابایتی Intel DC P4510. سیستم مبتنی بر پردازنده Intel Xeon Scalable یک پلت فرم پیش تولید اینتل با دو پردازنده نسل چهارم Intel Xeon Scalable (با کد قبلی Sapphire Rapids، بیش از 40 هسته، HyperThreading فعال)، بایوس پیش تولید اینتل، 256 گیگابایت حافظه DDR ( 16(1DPC)/16 گیگابایت/4800 MT/s)، و 1 ترابایت SSD Intel D3-S4610. اوبونتو لینوکس 20.04 بر روی هر دو سیستم نصب شده است. عملکرد بر اساس استفاده، پیکربندی و سایر عوامل متفاوت است، بنابراین نتایج ممکن است متفاوت باشد.


نویسندگان: Henry A Gabb, Intel Corporation; دان فرید و ژیپان لی، شرکت Sentieon.
هزینه به ازای هر ژنوم برای پردازنده Intel Xeon (1.54 دلار) در مقایسه با A100 (4.59 دلار) (جدول 3) بسیار کمتر است. اگر پردازنده نسل چهارم اینتل Xeon Scalable قیمت AWS EC2 مشابهی داشته باشد، هزینه هر ژنوم به کمتر از یک دلار کاهش می یابد (2.1635 دلار در ساعت * 26.8 دقیقه = 0.97 دلار). همچنین شایان ذکر است که پردازندههای نسل چهارم Intel Xeon Scalable مورد استفاده در این بنچمارکها، سختافزار پیشنشر هستند، بنابراین عملکرد محصول نهایی میتواند بهبود یابد.
وبلاگ Parabricks که در بالا ذکر شد، دقت فراخوانی متفاوت (نمرات F1) را با GATK مقایسه می کند. با این حال، Sentieon یک برنده ثابت در چالش حقیقت PrecisionFDA است که توسط سازمان غذا و داروی ایالات متحده اداره می شود (شکل 3). معیار HG001 از این چالش ناشی می شود. در مسابقه جدیدتر PrecisionFDA Truth Challenge V2، Sentieon با 19 تیم دیگر رقابت کرد و چهار دسته از 12 دسته را برد. Parabricks در بین ورودی ها نبود.

دادههای عملکرد اخیر برای مقایسه در دسترس است: محک زدن خط لوله NVIDIA Clara Parabricks Germline در AWS. این مقاله دادههای عملکرد و هزینه آزمایشهای HG001 زیر را گزارش میکند:
- توالی کامل Exome (WES) @ 50x، 75x، و 100x پوشش
- توالی یابی کل ژنوم (WGS) با پوشش 30 برابر و 50 برابر
نتایج عملکرد بر اساس آزمایش در تاریخهای نشاندادهشده در پیکربندیها است و ممکن است همه بهروزرسانیهای در دسترس عموم را منعکس نکند. هیچ محصول یا جزئی نمی تواند کاملاً ایمن باشد.
عملکرد بر اساس استفاده، پیکربندی و عوامل دیگر متفاوت است. در www.intel.com/PerformanceIndex بیشتر بیاموزید.
هزینه ها و نتایج شما ممکن است متفاوت باشد.