خوارزمية وحدة المعالجة المركزية تدرّب الشبكات العصبية العميقة أسرع من وحدة المعالجة الرسومية بـ 15 مرة

خوارزمية وحدة المعالجة المركزية تدرّب الشبكات العصبية العميقة أسرع من وحدة المعالجة الرسومية بـ 15 مرة

19 يونيو , 2021

ترجم بواسطة:

هاجر زميع

دقق بواسطة:

ثريا البرقان

بقلم: جايد بويد، جامعة رايس

أظهر علماء الكمبيوتر في جامعة رايس برمجية ذكاء اصطناعي (AI) تعمل على معالجات السلع وتدرّب الشبكات العصبية العميقة بمعدل ١٥ مرة أسرع من الأنظمة الأساسية القائمة على المعالجات الرسومية.

قال أنشومالي شريفاستافا، الأستاذ المساعد لعلوم الكمبيوتر في كلية براون للهندسة في رايس: “تكلفة التدريب هي عنق الزجاجة الفعلي في الذكاء الاصطناعي”. ويضيف: “تنفق الشركات ملايين الدولارات كل أسبوع فقط لتدريب وضبط أعباء عمل الذكاء الاصطناعي الخاص بهم”. سيقدم شريفاستافا ومعاونوه من رايس وانتل بحثًا يعالج هذا الاختناق (عنق الزجاجة) في ٨ أبريل في مؤتمر أنظمة التعلم الآليMLSys.

الشبكات العصبية العميقة (DNN) هي شكل قوي من أشكال الذكاء الاصطناعي يمكنها أن تتفوق على البشر في بعض المهام. عادةً ما يكون تدريب (DNN) عبارة عن سلسلة من عمليات مضاعفة أو ضرب المصفوفة، وهي مما يجعله عبئاً مثالياً لوحدات المعالجة الرسومية (GPUs)، والتي تعد أغلى بثلاث مرات تقريباً من وحدات المعالجة المركزية العامة (CPUs).

قال شريفاستافا: “الصناعة بأكملها تركز على نوع واحد من أنواع التحسين – مضاعفة أو ضرب المصفوفة بشكل أسرع”. وأضاف: “يبحث الجميع عن أجهزة وبنيات متخصصة لدفع عملية مضاعفة أو ضرب المصفوفة. يتحدث الناس الآن عن وجود مجموعات برامج وأجهزة متخصصة لأنواع محددة من التعلم العميق. بدلاً من إلقاء عملية تحسين النظام بالكامل على خوارزمية باهظة الثمن، أنا أقول، “دعونا نعيد النظر في الخوارزمية”.

قام مختبر شريفاستافا بذلك في عام 2019، حيث أعاد صياغة تدريب (DNN) كمشكلة بحث يمكن حلها باستخدام جداول التجزئة. تم تصميم “محرك التعلم العميق شبه الخطي” (SLIDE) خصيصًا للعمل على وحدات المعالجة المركزية السلعية أو الخاصة بالسلع، وقد أظهر شريفاستافا ومعاونوه من انتل أنه يمكن أن يتفوق على التدريب القائم على GPU عندما كشفوا عنه في مؤتمر MLSys 2020.

اكتشفت الدراسة التي سيقدمونها هذا الأسبوع في MLSys 2021 ما إذا كان يمكن تحسين أداء (SLIDE) من خلال عمليات التوجيه ومسرعات تحسين الذاكرة في وحدات المعالجة المركزية الحديثة.

قال المؤلف المشارك في الدراسة شابنام داغاغي، طالب دراسات عليا في رايس: “إن التسارع المستند إلى جدول التجزئة يتفوق بالفعل على أداء وحدة المعالجة الرسومية، ولكن وحدات المعالجة المركزية تتطور أيضًا”. وأضاف أيضاً: “لقد استفدنا من هذه الابتكارات لأخذ (SLIDE)إلى أبعد من ذلك، حيث أظهرنا أنه إذا لم تكن مهتمًا بمضاعفات أو ضرب المصفوفة، فيمكنك الاستفادة من القوة في وحدات المعالجة المركزية الحديثة وتدريب نماذج الذكاء الاصطناعي أسرع من أربعة إلى ١٥ مرة من أفضل بدائل الأجهزة المتخصصة”.

قال المؤلف المشارك للدراسة نيكولاس ميسبرغر، وهو طالب جامعي في رايس: “لا تزال وحدات المعالجة المركزية أكثر الأجهزة انتشارًا في مجال الحوسبة. ولا يمكن التقليل من فوائد جعلها أكثر جاذبية لأعباء عمل الذكاء الاصطناعي”.

المصدر: https://techxplore.com

ترجمة: هاجر زميع

تويتر: @ThisisMamaHajar

مراجعة: ثريا البرقان


اترك تعليقاً

القائمة البريدية

اشترك في قائمتنا البريدية ليصلك جديد مقالاتنا العلمية وكل ماهو حصري على مجموعة نون العلمية