تقنية تكشف أساس قرارات أنظمة تَعَلُّم الآلة

ترجم بواسطة:

دقق بواسطة:

في السنوات الأخيرة، أصبحت أفضل الأنظمة من حيث الأداء في أبحاث الذكاء الاصطناعي Artificial Intelligence مهتمة بالشبكات العصبية، والتي تبحث عن أنماط في بيانات التدريب التي تحقق تنبؤات مفيدة أو التصنيفات. قد يتم على سبيل المثال تدريب شبكة عصبية للتعرف على أشياء معينة في الصور الرقمية أو للاستدلال على موضوعات النصوص.

إلا أن الشبكات العصبية تُعتبر صناديق سوداء . بعد تدريبها ربما تُصبح جيدة جدًا في تصنيف البيانات،لكن على الرغم من كون هذه الشبكات هي المُنّتِجة إلا أنها لا تملك أدنى فكرة عن السبب! أما مع البيانات المرئية،فأنه من الممكن جعل التجارب التي تحدد ما هي المميزات المرئية التي تستجيب لها الشبكة العصبية أوتوماتيكية. أما بالنسبة لأنظمة معالجة النصوص فهي تميل لأن تكون أكثر غموضًا!

في رابطة مؤتمر اللغويات الحاسوبية عن طرق تجريبية في المعالجة الآلية للغات الطبيعية، باحثوا مختبر علوم الحاسب والذكاء الاصطناعي أم آي تي (MIT’s Computer Science and Artificial Intelligence Laboratory CSAIL) سوف يقدمون طريقة جديدة ليس لتدريب الشبكات العصبية لتقدم تنبؤات وتصنيفات فقط إنما لتقدم المبررات لتلك القرارات.

“في تطبيقات العالم الواقعي،أحياناً الناس يريدون حقًا أن يعلموا لماذا هذا النموذج يجعل التنبؤات تعمل”

يقول تاو لي Tao Lei،وهو طالب خريج هندسة إلكترونية وعلوم حاسب من أم آي تي MIT،وهو الكاتب الأول في الورقة الجديدة. “أحد أهم الأسباب التي تجعل الأطباء لا يثقون بطرق تَعَلُّم الآلة هو أنه لا يوجد دليل”.

“إنها ليست فقط في المجال الطبي”

وأضاف ريجينا برازيلاي ( Regina Barzilay ) وهو أستاذ إلكترونيات دلتا في الهندسة الكهربائية Delta Electronics Professor of Electrical Engineering وعلوم حاسب ومستشار رسائل دكتوراه ليسزLei’s Thesis Advisor. “أنها في أي مجال حيث تكون تكلفة تنبؤ الشيء الخاطئ عالية جدًا. تحتاج إلى تبرير لماذا فعلت ذلك”.

كما قال “هناك جوانب أوسع لهذا العمل أيضاً”، ويقول تومي جاكولا، أستاذ معهد ماساتشوستس للتكنولوجيا الهندسة الكهربائية وعلوم الحاسوب ومؤلف مشارك في الورقة العلمية “قد لا تريد فقط التحقق من أن هذا النموذج يقوم بالتنبؤ بالطريقة الصحيحة؛ ربما ترغب أيضًا في استخراج بعض المصطلحات المؤثرة لأنواع من التنبؤات التي يجب عملها. كيف يمكن للشخص العادي التواصل مع نموذج معقّد مُدرّب بخوارزميات لا يعرف عنها شيئًا؟ قد تكون هذه الخوارزميات قادرة على إخبارك عن مبرر لتنبؤ معين. وهذا المُنطلق يفتح طريقة مختلفة للتواصل مع هذا النموذج”.

العقول الافتراضية

تسمى الشبكات العصبية بذلك بسبب أنها تحاكي -تقريبًا- بنية الدماغ.هذه الشبكات العصبية تتألف من عدد كبير من العُقد المعالجة والتي تشبه الخلايا العصبية المنفردة،حيث أنها قادرة على الحسابات البسيطة جدًا فقط لكنها ترتبط مع بعضها البعض في شبكات كثيفة.

في العملية التي يُشار إليها باسم “التعلم العميق”(Deep Learning ) وهي أن بيانات التدريب يتم من خلالها تغذية مدخلات عُقد الشبكة، والتي تقوم بتعديل وتغذية العقد الأخرى وهكذا

بالنسبة للقيم المخزنة في عُقد مخرجات الشبكة فإنها ترتبط مع فئة التصنيف Classification Category والتي تجعل الشبكة تحاول التعلم على سبيل المثال، الكائنات في الصور أو موضوع مقال.

على مدى تدريب الشبكة،العمليات التي تتم عن طريق العُقد المفردة يتم تعديلها بشكل مستمر لتحقيق نتائج جيدة ومتجانسة عبر مجموعة كاملة من الأمثلة التدريبية. وبنهاية العملية،علماء الحاسب الذين قاموا ببرمجة هذه الشبكة هم غالبًا ليس لديهم فكرة عن ما هي إعدادات هذه العُقد! وحتى لو علموا كيف تبدو،سوف يكون من الصعب جدًا ترجمة هذه المعلومات منخفضة المستوى والتي تعود إلى وصف واضح لعملية صنع قرار النظام.

الورقة العلمية الجديدة لـتاو لي،برازيلاي، وجاكولا تتناول على وجه التحديد الشبكات العصبية المُدربة على البيانات النصية. لتتمكن من تفسير قرارات الشبكات العصبية،باحثو CSAIL قسموا الشبكة إلى نموذجين. النموذج الأول يقوم باستخراج قسم من النصوص من البيانات المُدربة والأقسام التي تم تسجيلها بناء على طولها وترابطها. حيث أن القسم الأقصر وما يزيد عنه يُرسم عن طريق سلاسل نصية من كلمات متتالية،والأعلى يُعتبر هو النتيجة.

الأقسام التي اُختيرت عن طريق النموذج الأول بعد ذلك تمرر إلى النموذج الثاني،والذي يقوم بدوره بمهمة التنبؤ أو التصنيف. بينما النماذج يتم تدريبها مع بعضها البعض،والهدف من ذلك التدريب هو تحقيق أقصى حد لكل من نتيجة استخراج الأقسام ودقة التنبؤ أو التصنيف.

واحدة من مجموعات البيانات التي قام الباحثون عند باختبار نظامهم عليها هي مجموعة من المراجعات من موقع إلكتروني،حيث أن المستخدمين يقومون بتقييم أنواع مختلفة من الكحول. مجموعة البيانات تتضمن النصوص الخام من المراجعات والتقييمات المُطابقة باستخدام نظام الخمس نجوم لكلِ من الصفات الثلاث:وهي الرائحة،المذاق والمظهر.

ما الذي يجعل البيانات جاذّبةً لباحثيِ معالجة اللغات الطبيعيةNatural Language Processing! هل لأنها تمت عن طريق التعليّق باليد لتشير إلى الجُمل في المراجعات المتطابقة مع النتائج. فعلى سبيل المثال،المراجعات ربما تحوي على ثمان أو تسع جُمل ومعلّق الحواشي ربما يقوم بإظهار تلك المراجعات التي تعود على هذه الكحول مثل “رأس ذو لون أسمر ويبلغ من السماكة حوالي نصف بوصة”،”التوقيع روائح غينيس”GuinnessSmells”وخالية من الكربونات”.كل جملة مرتبطة بتقييم صفة مختلفة.

التحقق من الصحة

وعلى هذا النحو، مجموعة البيانات توفر اختبار ممتاز لنظام الباحثينCSAIL. إذا كان أول نموذج يُستخرج هذه الثلاث جُمل والنموذج الثاني مرتبط بهم مع التقييم الصحيح،عندئذٍ النظام يقوم بتحديد أساس الحُكم الذي يقوم به معلّق الحواشي البشري.

من خلال التجارب، توافق النظام مع تعليقات الحواشي البشرية بنسبة 96في المئة و95 في المئة على التوالي،وذلك بالنسبة لتقييم المظهر والرائحة، و 80 في المئة لأكثر مفهوم غامض وهو المذاق.

في الورقة العلمية، قام الباحثون أيضًا باختبار تقرير نظامهم في قاعدة بيانات ذات الشكل الحرFree-Form من الأسئلة التقنية والإجابات،حيث أن المهمة لتحديد ما إذا كان السؤال المعطى قد تمت الإجابة عليه مسبقًا.

أما بالنسبة لعملهم الغير منشور،فقد قاموا بتطبيقه على تقاريرهم لآلاف من الأمراض،فيما يتعلق بأخذ عينات من الثدي،حيث أنه تعّلم شرح استخراج النصوص التي هي أساس تشخيص الأمراض. كما أنه تم استخدامه لتحليل تصوير الثدي بالأشعة السينية ،حيث أن النموذج الأول يقوم باستخراج أقسام من الصور بدلًا من أجزاءٍ من النص.

ترجمة: وفاء الداود

Twitter: @w_1992

المراجعة: منيرة السهلي

المصدر:

Science Daily