
أصدر مهندسو برامج Intel ONEDNN 3.8 لإنهاء الأسبوع من خلال تحسينات أداء جديدة وأكثر من ذلك.
تعمل مكتبة Intel Onednn التي أصبحت الآن جزءًا من مؤسسة UXL كبنات بناء لتطبيقات التعلم العميق AI / Deep. توفر هذه المكتبة لبنات بناء أساسية لتطبيقات التعلم العميق وهي مُحسّنة بقوة لعروض أجهزة Intel ، ولكن مع مرور الوقت ، طورت أيضًا دعمًا قويًا لمنصات الأجهزة المنافسة أيضًا.
مع ONEDNN 3.8 ، هناك تحسينات مستمرة Intel AMX ، أفضل أداء رسومات متكامل في Panther Lake XE3 ، وتحسينات لدعم رسومات XE2 الحالي ، وغيرها من التحسينات للاستفادة من منتجات وحدة المعالجة المركزية و GPU القادمة من Intel.
“معالجات الهندسة المعمارية
– تحسين أداء Matmul و Inner Primitives على المعالجات مع دعم تعليمات Intel AMX.
– تحسين أداء الالتفاف والمنتج الداخلي على المعالجات مع دعم تعليمات Intel AVX2.
– تحسين أداء دعم الالتفاف INT8 مع صفر نقاط.
– تحسين أداء الالتفاف FP32 مع أوزان مضغوطة FP16 و BF16 على المعالجات مع دعم مجموعة تعليمات Intel AVX2 أو Intel AVX-512.
– تحسين أداء الالتواء FP16/BF16 مع تحيز FP32 أو SUM بعد OPS أو تمدد.
– تحسين أداء BF16 تجميع الأداء الخلفي.
– تحسين أداء ما بعد OPS الثنائي مع البث per_w.منتجات الرسومات Intel
– تحسين الأداء على رسومات Intel ARC لمعالجات Intel Core Ultra المستقبلية (اسم الكود Panther Lake).
– تحسين أداء الالتواء في:
Intel ARC Graphics لـ Intel Core Ultra Processor Series 2 (بحيرة Lunar).
Intel ARC B-Series رسومات منفصلة (Battlemage سابقًا).
– تحسين أداء int8 matmul مع دعم النقاط الصفر لمصدر وموتات الوزن.
– تحسين أداء F4_E2M1 و F4_E3M0 Matmul و Report.
– تحسين الأداء للخسائر الفرعية التالية مع واجهة برمجة تطبيقات الرسم البياني:
انتباه منتج DOT المحجوز (SDPA) مع مفتاح وقيمة INT4 و INT8.
FP16/BF16 SDPA مع أنواع البيانات الوسيطة FP32. يوصى باستخدام أنواع البيانات الوسيطة FP32.
SDPA مع حجم الرأس 512 و 576.
انتباه الاستعلام المجمعة (GQA) مع موتر إدخال 5D. “
يحتوي الإصدار ONEDNN 3.8 أيضًا على تحسينات FP16 و INT8 و BF16 لمعالجات AARCH64 ، ودعم API GRAPH لدعم NVIDIA GPUs ، و ROCM 6 على وحدة المعالجة المركزية AMD ، ومجموعة متنوعة من التحسينات الأصغر الأخرى.
التنزيلات والمزيد من المعلومات حول إصدار مكتبة ONEDNN 3.8 لبناء تطبيقات التعلم العميق عبر جيروب. جديد معايير ONEDNN قريبا لإصدارات الأجهزة القادمة.
اترك تعليقاً