التعلم الذاتي للذكاء الاصطناعي في لعب الألعاب الرقمية.

التعلم الذاتي للذكاء الاصطناعي في لعب الألعاب الرقمية.

22 نوفمبر , 2019

يمكن للذكاء الاصطناعي أن يتعلم ذاتياً ويتفوق في الأداء والكفاءة، مما يصنع لدينا مفهوماً جديداً عن الروبوتات وما إمكانياتها .

منذ الأيام الأولى للشطرنج الافتراضي والسوليتير، كانت الألعاب الرقمية ملعباً لتطوير الذكاء الاصطناعي، فكان كل انتصار من قِبل آلة ضد الإنسان يصنع خوارزميات أكثر ذكاء وأكثر كفاءة، وحتى نتمكن من التعامل مع مشاكل العالم الحقيقي كإتمام المهام المعقدة مثل القيادة والتفاوض، يجب أن تنتقل هذه الخوارزميات إلى بيئات أكثر تعقيدًا من ألعاب الطاولة، وأن تتعلم العمل الجماعي، وكان تعليم الذكاء الاصطناعي كيفية العمل والتفاعل مع اللاعبين الآخرين لتحقيق النجاح مهمة لا يمكن التغلب عليها، حتى الآن.

أوضح الباحثون بالتفصيل في دراسة جديدة عن طريقة لتدريب خوارزميات الذكاء الاصطناعي للوصول إلى مستويات أداء الإنسان في لعبة الثلاثية الأبعاد متعددة اللاعبين وهي نسخة معدلة من حلبة لعبة “كوايك الثالثة” في طور الإمساك بالعلم.

مع أن هدف اللعبة واضح – وهو فريقان يتنافسان للإمساك بعلم الفريق الآخر- لكن الفوز يتطلب اتخاذ قرارات معقدة، والقدرة على التنبؤ بأعمال اللاعبين الآخرين والاستجابة لها.

هذه هي المرة الأولى التي يحصل الذكاء الاصطناعي فيها على مهارات تشبه الإنسان في لعبة إطلاق نار من منظور الشخص الأول، فكيف فعل الباحثون ذلك؟

منحنى تعلم الرجل الآلي

تم التوصل إلى العديد من المعالم في بحوث الذكاء الاصطناعي في ألعاب استراتيجية متعددة اللاعبين الأخرى في عام 2019، وقام خمسة “بوتس” – وهم لاعبون يتحكم بهم الذكاء الاصطناعي – بهزيمة فريق الرياضة الإلكترونية المحترفة في لعبة ” دوتا 2″، كما تعرض لاعبون محترفون للهزيمة من قبل الذكاء الاصطناعي في مباراة “ستاركرافت 2″، وفي جميع الحالات، طُبق شكل من أشكال التعلم التعزيزي، حيث تتعلم الخوارزمية عن طريق التجربة والخطأ ومن خلال التفاعل مع بيئتها.

الرقم الذي يظهر معدلات الفوز للاعبين الإنسان ضد وكلاء الاستجابة المتأخرة، وهذه العوامل منخفضة، مما يشير إلى أنه حتى مع حالات التأخير في رد الفعل القابلة للمقارنة بين البشر، فإن العوامل تتفوق على اللاعبين البشريين.

إن الروبوتات الخمسة التي تغلبت على البشر في  لعبة “دوتا 2” لم تتعلم اللعب من البشر، فقد تم تدريبهم حصريًا من خلال لعب مباريات ضد نسخ من أنفسهم، وجاء التحسن الذي سمح لهم بهزيمة اللاعبين المحترفين من توسيع نطاق الخوارزميات الموجودة، وبسبب سرعة الحاسب الآلي يمكن أن يلعب الذكاء الاصطناعي مباراة في بضع ثوان، وقد تستغرق دقائق أو حتى ساعات للبشر للعب، مما سمح للباحثين تدريب الذكاء الاصطناعي خمس وأربعين ألف سنة من اللعب في غضون عشرة أشهر من الوقت الحقيقي.

بدأ الروبوت بالإمساك بالعلم من الدراسة الأخيرة أيضا بالتعلم من الصفر، ولكن بدلا من اللعب ضد نسخ متطابقة، تم إنشاء مجموعة من ثلاثين روبوت، وتم تدريبها بالتوازي مع إشارة المكافأة الداخلية الخاصة بهم، وسيلعبون معاً ويتعلمون من بعضهم البعض، وكما لاحظ ديفيد سيلفر- وهو أحد الباحثين المشتركين بالدراسة- “أن الذكاء الاصطناعي بدأ يزيل قيود المعرفة الإنسانية… ويصنع معرفته بنفسه”.

إن سرعة تعلم البشر لا تزال أسرع بكثير من أكثر الخوارزميات تعزيزاً وعمقاً وتقدماً، فكل من بوتات OpenAI  وبوت DeepMind  المسمى بـAlphaStar  (وهو الذي لعب ستاركرافت 2) التهمت آلاف السنين من اللعب قبل أن تكون قادرة على الوصول إلى مستوى الإنسان من الأداء، ويقًدر أن هذا التدريب سيكلف الملايين من الدولارات ومع ذلك، فإن الذكاء الاصطناعي ذاتي التعليم قادر على هزيمة البشر في لعبتهم الخاصة، وهو اكتشاف مذهل يمكن أن يغير كيف نرى الآلات.

مستقبل البشر والآلات

وغالبا ما يُصور الذكاء الاصطناعي بأنه سيحل محل القدرات البشرية أو يكملها، ولكن نادراً ما يكون عضواً مكتملاً في الفريق، ويؤدي نفس المهمة التي يقوم بها البشر، وبما أن تجارب ألعاب الفيديو هذه تنطوي على التعاون بين الآلات والبشر، فإنها تقدم لمحة عن المستقبل.

إن اللاعبين البشريين للعبة الإمساك بالعلم قالوا أن الروبوتات أكثر تعاوناً من البشر الآخرين، ولكن اللاعبين من “دوتا 2” كان لهم رد متباين مع زملائهم ذوي الذكاء الاصطناعي، وكان بعضهم متحمسا ً جداً، قائلين إنهم يشعرون بالدعم، وأنهم تعلموا من اللعب إلى جانبهم.

شيفر- هي إحدى اللاعبات المحترفات في لعبة “دوتا 2”- تحدثت عن تجربتها في التعاون مع البوتات تقول:”شعرت في الواقع أنها لطيفة، فزميلي ذو الذكاء الاصطناعي ضحى بحياته من أجلي في مرحلة ما وحاول مساعدتي، كأنه كان يفكر “أنا متأكد من أنها تعرف ما تفعله” ومن ثم من الواضح أنني لم أكن أعرف، لكن، كما تعلم، كان يؤمن بي وهذا لا يحدث كثيرا مع زملائي في الفريق.”

وكان آخرون أقل حماسًا، ولكن بما أن الاتصال هو دعامة لأي علاقة، فإن تحسين الاتصال بين الإنسان والآلة سيكون حاسما في المستقبل، وقد كيّف الباحثون بالفعل بعض الميزات لجعل البوتات أكثر “ودية للإنسان”، مثل جعل البوتات تنتظر لاختيار شخصياتهم لتشكيلة الفريق قبل المباراة، لتجنب الضغط على البشر.

ولكن هل ينبغي لآلات الذكاء الاصطناعي أن يتعلموا منا أو يواصلوا تعليم أنفسهم؟

إن التعلم الذاتي دون تقليد البشر يمكن أن يعلم الذكاء الاصطناعي المزيد من الكفاءة والإبداع، ولكن هذا يمكن أن يشكل خوارزميات أكثر ملاءمة للمهام التي لا تنطوي على التعاون البشري، مثل روبوتات التخزين.

من ناحية أخرى، يمكن للمرء أن يجادل بأن وجود آلة مدربة من قبل البشر سيكون أكثر بديهية، ويمكن للبشر استخدام هذا الذكاء الاصطناعي لفهم (لماذا فعلت أيّ آلةُ ما ما فعلته) كما أن الذكاء الاصطناعي يصبح أكثر ذكاء، ونحن جميعاً مستعدون لمزيد من المفاجآت.

ترجمة: داليا آدم

@kurohana90210

مراجعة : افراح السالمي

Twitter: @fara7alsalmi

المصدر:https://m.techxplore.com


اترك تعليقاً

القائمة البريدية

اشترك في قائمتنا البريدية ليصلك جديد مقالاتنا العلمية وكل ماهو حصري على مجموعة نون العلمية

error: Content is protected !!