نظام ذكي اصطناعيًا يمكنه كشف المشاعر خلال المحادثات عن طريق نبرة الصوت

نظام ذكي اصطناعيًا يمكنه كشف المشاعر خلال المحادثات عن طريق نبرة الصوت

28 أغسطس , 2017

من طبيعتنا حقيقةُ أن محادثة واحدة يمكن فهمها بطرق مختلفة جدًا، وهذا قد يجعل المواقف الاجتماعية مليئة بالتوتر عند المصابين بالقلق وحالات مرضية كالأسبرجر.
قال باحثون من مختبر علم الحاسوب والذكاء الصناعي لجامعة ماساتشوستس ومن معهد للهندسة الطبية والعلوم، بأنهم اقتربوا من حل ممكن: وهو صناعة ذكية، عبارة عن جهاز قابل للارتداء يستطيع أن يتوقع ما إذا كانت المحادثة سعيدة، حزينة، أو محايدة بناءً على أنماط حديث الشخص وحيويتها.

” تخيل لو يمكنك عند نهاية محادثة ما إعادتها ورؤية أكثر اللحظات التي شعر فيها الناس حولك بالقلق” هذا ما قالته طالبة الدراسات العليا تقى الهنائي، التي ألفت ورقة بحث مع المرشح لنيل شهادة الدكتوراه محمد قاسمي، وسيقدمانها في مؤتمر الأسبوع القادم لـ “اتحاد تقدم الذكاء الصناعي”(AAAI) في سان فرانسيسكو. وأضافت: “إن ما قدمناه هو خطوة في هذا الاتجاه، مما يشير إلى أننا قد لا نكون بذلك البعد عن عالم يمكن أن يكون فيه للناس مدرب اجتماعي من الذكاء الصناعي في جيوبهم مباشرة”.
وبينما يروي أحد المتطوعين قصة، يستطيع الجهاز تحليل الصوت، ونص التسجيل الصوتي، والإشارات الجسدية لتحديد النبرة العمومية للقصة بدقة تبلغ 83%. وباستخدام تقنيات تعلم عميقة، يستطيع الجهاز أيضا أن يقدم “حصيلة للمشاعر” لفترة خمس ثوان معينة أثناء المحادثة.

ويقول قاسمي: “على حسب ما نعلم هذه أول تجربة تجمع بين البيانات الجسدية والبيانات الخطابية بطريقة غير فعالة ولكن نشيطة، وحتى عندما يتفاعل الأفراد بطريقة طبيعية غير منظمة، فإن نتائجنا تظهر بأنه بالإمكان تصنيف النبرة العاطفية للمحادثة في الواقع”.
ويقول الباحثون بأن أداء التطبيق سيتطور أكثر بجعل عدة أشخاص في محادثة ما يستخدمون ساعاتهم الذكية، مما يخلق بيانات أكثر لتحليلها بالخوارزميات. ويحرص الفريق على التنبيه بأنهم طوروا التطبيق بحرص شديد على الخصوصية: تعمل الخوارزميات داخليا في جهاز المستخدم كطريقة لحماية المعلومات الشخصية، وتقول الهنائي: “بأن نسخة المستهلك ستحتاج بالتأكيد أنظمة واضحة لتلقي الاستجابة من الناس المشاركين في المحادثات”.

 

 

كيفية العمل:
تظهر كثير من دراسات كشف مشاعر المشاركين بمقاطع فيديو “سعيدة أو “حزينة”، أو تطلب منهم أن يتصنعوا حال عاطفية معينة. ولكن في محاولة لجعل المشاعر حقيقية طلب الفريق من المشاركين أن يرووا قصصًا سعيدة أو حزينة من اختيارهم.
وارتدى المشاركين السوار الإلكتروني “سامسونج سيم باند”، وهو جهاز يرصد أشكال الموجات الجسدية بدقة عالية لقياس أنماط كالحركة، ومعدل نبض القلب، وضغط الدم، وتدفقه، وحرارة البشرة. كما يرصد التطبيق البيانات الصوتية والمحتوى النصي للرسائل الصوتية، لتحليل نبرة صوت المتحدث، نغمته، وحيويته، والمفردات.
“استخدام الفريق لأجهزة متوفرة في سوق المستهلك لجمع البيانات الجسدية وبيانات الحديث تبين قربنا لامتلاك أدوات كهذه في أجهزتنا اليومية” هذا ما قاله بجورن سكولر -أستاذ ورئيس الأنظمة الذكية والمعقدة في جامعة باساو في ألمانيا- والتي لم تشارك في البحث، وأضاف: “قريبًا يمكن للتكنولوجيا أن تصبح أكثر ذكاءً عاطفيًا، أو حتى’عاطفية‘ هي ذاتها”
وبعد رصد 31 محادثة مختلفة لعدة دقائق لكل واحدة، طبق الفريق خوارزميتين في البيانات: إحداهما صنفت الطابع الإجمالي للمحادثة كسعيدة أو حزينة، بينما الأخرى صنفت كل خمس ثوان من كل محادثة كإيجابية، أو سلبية، أو محايدة.
وتنبه الهنائي بأن :” في الشبكات التقليدية المحايدة، فإن البيانات كلًا بميزته تُقدم للخوارزميات في قاعدة الشبكة، وبالمقابل وجد الفريق بأن بإمكانهم تطوير الأداء بإعادة تنظيم المميزات المختلفة في طبقات الشبكة المتنوعة”.
وتقول الهنائي: “على سبيل المثال يعمل التطبيق على كيفية أن العاطفة في نص الرسالة الصوتية كانت أكثر تجردًا من البيانات الأولية لمقياس التساعي”، “و كم هو مذهل حقا! كيف بإمكان آلة الاقتراب من كيفية إدراكنا نحن البشر لهذه التفاعلات دون تدخل بارز منا كباحثين”.

 

 

النتائج:
في الواقع تتوافق نتائج الخوارزميات حقا مع ما نتوقع أن نلاحظه. فمثلا، ترتبط الانقطاعات الطويلة ونبرات الصوت الرتيبة مع القصص الحزينة، وترتبط أنماط الحديث الأكثر حيوية وتنوعا مع القصص السعيدة. وبالنسبة إلى لغة الجسد، ترتبط القصص الحزينة ارتباطًا قويًا مع زيادة التململ ونشاط القلب، بالإضافة إلى وضعيات يد معينة كوضع الشخص يده على وجهه.
وفي المتوسط، يمكن للنموذج تصنيف كل فترة خمس ثوان تحت مزاج معين، بدقة تبلغ تقريبا 18% أعلى من الفرصة، وبنسبة 7.5% أفضلية من الطرق الموجودة.

والخوارزميات ليست معتمدة بالكامل لتنشر على أساس التدريب الاجتماعي، ولكن الهنائي تقول بأنهم يعملون بنشاط للوصول إلى ذلك الهدف، وللعمل المستقبلي، يخطط الفريق لجمع البيانات على مستوى أوسع، وبالإمكان استخدامهم لأجهزة تجارية كساعة آبل، مما تسهل لهم إخراج التطبيق للعالم بسهولة أكثر.
“خطوتنا التالية هي تطوير التفصيل العاطفي للخوارزميات لتكون أكثر دقة في تحديد اللحظات المملة، والمتوترة، والحماسية بدلا من تصنيف التفاعلات كإيجابية أو سلبية”، وتكمل الهنائي: “تطوير تكنولوجيا متمكنة من قياس نبض عواطف الإنسان، له إمكانية في تطوير طريقة تواصلنا بشكل جسيم”.

 

 

 

 

 

 

ترجمة: مضاوي نواف الأزمع

Twitter: @Madawi_N2
مراجعة: أسماء محمد القحطاني
Twitter: @01sma01

 

 

المصدر:

Science Daily


اترك تعليقاً

القائمة البريدية

اشترك في قائمتنا البريدية ليصلك جديد مقالاتنا العلمية وكل ماهو حصري على مجموعة نون العلمية

error: Content is protected !!