معیار چالش اچپیسی
معیار چالش اچپیسی (high-performance computer), دارای تعداد بسیاری معیار برای امتحان کردن تعداد ویژگیهای مستقل عملکرد سیستم HPC (کارایی بالای یک کامپیوتر) میباشد. این پروژه توسط برنامهٔ سیستمهای کامپیوتری با کارایی بالای DARPA , وزارت انرژی ایالات متحدهٔ آمریکا مورد حمایت ملی قرار گرفتهاست.
متن
عملکرد برنامههای پیچیده روی سیستمهای HPC میتواند به انواع ویژگیهای عملکرد مستقل سختافزار بستگی داشته باشد، معیار چالش HPC تلاش برای بهبود دید در فضای چند بعدی با ترکیب کردن مقدار اندازهگیری شدهٔ این ویژگیها به یک برنامهٔ واحد است. با اینکه مشخصههای عملکردی برای ساختار خود کامپیوتر نیست اما فرض بر این است که پیادهسازی مرجع معیار چالش HPC در MPI در سیستم تحت آزمایش انبوه از سیستم پردازشگر است که دارای حافظهٔ مشترکی هستند و به شبکه متصل میباشند. با توجه به این فرض در یک ساختار پایگانی شده اکثر آزمایشها در چند حالت مختلف عملیاتی اجرا میشود.
با دنبال کردن نماده استفاده شده در گزارش معیار، میتوان نتایجی را متوجه شد. به عنوان مثال نتیجهٔ نماد «single» به این معناست که آزمایش بر روی یک پردازشگر تصادفی در سیستم اجرا شدهاست، نتیجهٔ نماد «star» به این معنا است که یک کپی مستقل از آزمایش بهطور همزمان روی هر پردازنده در سیستم اجرا میشود، نتیجهٔ نماد «global» به این معنا است که تمام پردازندهها برای حل یک مشکل با هماهنگی کار میکنند.
اجزاء
این معیار در حال حاضر شامل هفت آزمایش میباشد .(با حالت عملیات نشان داده شده برای هر کدام)
- HPL (High Performance LINPACK) - اندازهگیری عملکرد یک حل کننده برای یک سیستم متریک معادلات خطی (global)
- DGEMM - اندازهگیری عملکرد برای ضرب ماتریس در ماتریس (single, star)
- STREAM - اندازهگیری پهنای باند حافظه (single, star)
- PTRANS - سیستمی را اندازهگیری میکند که در آن، سیستم میتواند آرایهٔ بزرگی را انتقال دهد. (global)
- RandomAccess (دسترسی تصادفی) - سرعت به روز رسانی ۶۴ بیت را که عناصر آن به صورت تصادفی از یک جدول بزرگ انتخاب شدهاست اندازهگیری میکند. (single, star, global)
- (FFT (Fast Fourier Transform - یک تبدیل سریع فوریه (Fourier) را با استفاده از تعمیم الگوریتم کولی - توکی (Cooley–Tukey) بر روی یک بردار بزرگ یک بعدی انجام میدهد.
- Communication Bandwidth and Latency (پهنای باند ارتباطات و تأخیر زمانی) - اندازهگیریهای محور عملکرد MPI بر اساس b_eff (معیار پهنای باند، معیار تأخیر)
ویژگیهای عملکرد
در سطح بالا آزمایشهایی در نظر گرفته شدهاست تا چهار ویژگی مهم عملکرد را پوشش دهد.
دو خرده نمایی شناور، ارزیابی نقطه ای (DGEMM ,HPL)، پهنای باند حافظهٔ محلی (STREAM)، پهنای باند شبکه برای پیامهای طولانی (PTRANS, RandomAccess, FFT, b_eff) و پهنای باند شبکه برای پیامهای کوتاه (RandomAccess, b_eff)
برخی از این کدها پیچیده ار تز بقیه هستند و میتوانند سیاستهای عملکردی بیشتری داشته باشند. بهطور مثال، در برخی از سیستمها ی عملکرد HPL را میتوان با پهنای باند شبکه یا زمان تأخیر شبکه محدود کرد.
رقابت
مسابقه جایزه سالانه HPC Challenge در کنفرانس Supercomputing بر چهار معیار چالشبرانگیز در این مجموعه متمرکز است:
- HPL جهانی
- دسترسی تصادفی جهانی (معیار دسترسی تصادفی BSS)
- EP STREAM (سهگانه) در هر سیستم
- FFT جهانی
و همچنین دو نوع جایزه وجود دارد:
جایزهٔ ۱: بهترین عملکرد در یک پایگاه با اجرای بهینه شده که به وب سایت چالش HPC ارائه شدهاست.
جایرهٔ ۲: بیشتر «طرح» توسط چهار یا پنج هسته محاسباتی که شامل سه تا معیار یا بیشتر از سه پیادهسازی میشود.
منابع
- ↑ "HPC Challenge Benchmark". Wikipedia (به انگلیسی). 2018-05-01.
- ↑ "Benchmark (computing)". Wikipedia (به انگلیسی). 2018-01-23.
- ↑ "دارپا". ویکیپدیا، دانشنامهٔ آزاد. 2018-04-03.
- ↑ ASC Community (۲۰۱۸). Optimization for the High Performance LINPACK Benchmark. Singapore: Springer Singapore. صص. ۱۸۱–۱۹۱. شابک ۹۷۸۹۸۱۱۰۳۷۳۰۶.
- ↑ "Basic Linear Algebra Subprograms". Wikipedia (به انگلیسی). 2018-06-08.
- ↑ ZHANG, Hao; LIN, Wei; ZHOU, Yong-Bin; YE, Xiao-Chun; FAN, Dong-Rui (2009-07-29). "High-Bandwidth Memory Accessing Pipeline of General Purpose Processor". Chinese Journal of Computers. 32 (1): 142–151. doi:10.3724/sp.j.1016.2009.00142. ISSN 0254-4164.
- ↑ "Giga-updates per second". Wikipedia (به انگلیسی). 2015-09-27.
- ↑ "تبدیل سریع فوریه". ویکیپدیا، دانشنامهٔ آزاد. 2018-04-13.
- ↑ "Cooley–Tukey FFT algorithm". Wikipedia (به انگلیسی). 2018-06-02.
- ↑ "effective bandwidth". SpringerReference. Berlin/Heidelberg: Springer-Verlag.
- ↑ "ACM/IEEE Supercomputing Conference". Wikipedia (به انگلیسی). 2018-06-04.
- ↑ معیار طراحی شدهاست که اجازه جایگزینی مجموعه محدودی از توابع را با نسخههای به شدت بهینهسازی رامی دهد در حالی که باقی مانده یک اجرا "پایه". تغییرات اضافی (اما هنوز هم محدود) تحت رده "بهینه سازی" اجرا میشود.
- ↑ Dongarra, Jack; Kepner, Jeremy (2006). "HPC challenge---The 2006 HPC challenge awards". Proceedings of the 2006 ACM/IEEE conference on Supercomputing - SC '06. New York, New York, USA: ACM Press. doi:10.1145/1188455.1188460. ISBN 0-7695-2700-0.
پیوند به بیرون
- "HPC Challenge Award Competition"
- HPC Challenge Award Competition Official Website
- BSS Random Access Benchmark -ارزیابی عملکرد و بهینهسازی دسترسی حافظه تصادفی بر چندین محصول با بهرهوری بالا (جایزهٔ بهترین مقاله) در ACM/IEEE HiPC 2010