top of page
Search
  • Writer's pictureDr. Arwa Aleryani

أهم الاتجاهات البحثية في معالجة اللغة الطبيعية والذكاء الاصطناعي

Updated: Jan 28, 2021

مقالتنا اليوم عن معالجة اللغة الطبيعية والذكاء الاصطناعي، والتي بدورها تنقسم الى عدة مواضيع كلا منهم له اهميته وتحدياته التي يمكن ان تكون مجال للبحث والاستكشاف. لا شك فيها ان محاولات العلماء والباحثون في استكشاف تطوير وتحسين فهم الحاسوب للغة الطبيعية تعتبر من الاهتمامات الكبيرة ولا شك فيها ان للغة العربية حيز من اهتمامات الباحثين العرب.

إذا كانت خطتك البحثية هي البحث في مجال الذكاء الاصطناعي وتعلم الالة فأنت أمام مجال المستقبل، لكنه ايضا بحر من العلم والمعرفة والمستجدات المتسارعة والتطورات والتحديات. إذا كان لديك الوقت الكافي فالرحلة جميلة وممتعة ان تبدأ من التعرف على الذكاء الاصطناعي والتنقل بين تطبيقاته المختلفة والتوسع بمعرفة التحديات ومجالات البحث العلمي في كل هذه التطبيقات، ومن ثم تختار التطبيق الذي ترغب بالتعمق فيه. اما إذا كان وقتك محدود، فيجب ان تعمل على تضييق عملية البحث وتركز على مجال اهتمامك الدقيق. فمثلا، هل خطتك في البحث مركزة على أحد تطبيقات الذكاء الاصطناعي بشكل خاص؟ وتهدف لحل تحدي معين وتقديم استكشاف جديد للحل؟ ام خطتك عن تطبيقات الذكاء الاصطناعي في مجال محدد مثل الطب او التعليم او الاعمال التجارية؟ وقد يكون هدفك في البحث عن دور الذكاء الاصطناعي في تحليل البيانات.، وهو المجال الأكثر طلبا.

أما إذا كنت مهتم بمعالجة اللغة الطبيعية ودور الذكاء الاصطناعي فيها، فهذه المقالة تقدم لك بعض من التحديات وفرص البحث في معالجة اللغة الطبيعية.

من التحديات التي سنتحدث عنها تعتبر مجالات للبحث كما ورد بالمقالة (مع الإضافات)

وتحتوي المقالة على أوراق بحثية متطورة يمكن الاطلاع عليها من المقالة الاصلية.


معالجة اللغة الطبيعية Natural Language Processing (NLP)


تساعد معالجة اللغة الطبيعية أجهزة الحاسوب على التواصل مع البشر بلغتهم الخاصة، وتوسع نطاق المهام الأخرى المتعلقة باللغة. على سبيل المثال، يتيح البرمجة اللغوية العصبية لأجهزة الحاسوب إمكانية قراءة النص وسماع الكلام وتفسيره وقياس المشاعر وتحديد الأجزاء المهمة.


تتمحور الأبحاث التي تتم في هذا المجال حول:

  • تحسين نموذج البرمجة اللغوية العصبية الجديد NLP paradigm : هو "التدريب المسبق + الضبط الدقيق". سيطر التعلم الانتقالي Transfer learning على أبحاث البرمجة اللغوية العصبية على مدار العامين الماضيين. التعلم الانتقالي هو مشكلة بحثية في تعلم الآلة تركز على تخزين المعرفة المكتسبة أثناء حل مشكلة واحدة وتطبيقها على مشكلة مختلفة ولكنها ذات صلة. على سبيل المثال، يمكن تطبيق المعرفة المكتسبة أثناء تعلم التعرف على السيارات عند محاولة التعرف على الشاحنات. على الرغم من أن نقل التعلم قد دفع بالتأكيد البرمجة اللغوية العصبية إلى المستوى التالي، إلا أنه غالبًا ما يتم انتقاده لأنه يتطلب تكاليف حسابية ضخمة ومجموعات بيانات مشروحة كبيرة.

  • تحسين اللسانيات والمعرفة Linguistics and knowledge : من المرجح أن تعمل اللسانيات والمعرفة على تعزيز أداء نماذج البرمجة اللغوية العصبية، ويعتقد الخبراء أن علم اللغة يمكن أن يعزز التعلم العميق Deep learning من خلال تحسين إمكانية تفسير النهج القائم على البيانات. يمكن الاستفادة من السياق والمعرفة البشرية في تحسين أداء أنظمة البرمجة اللغوية العصبية.

  • تحسين جودة الترجمة الآلية Neural machine translation: تُظهر الترجمة الآلية العصبية تقدمًا ملحوظًا. تعمل الترجمة الآلية المتزامنة بالفعل على المستوى الذي يمكن تطبيقها في العالم الحقيقي. تسعى الاعمال البحثية الأخيرة إلى زيادة تحسين جودة الترجمة من خلال تحسين بنيات الشبكة العصبية، والاستفادة من السياق المرئي وإدخال مناهج جديدة للترجمة الآلية غير الخاضعة للإشراف وشبه الإشراف.


المحادثة باستخدام الذكاء الاصطناعي Conversational AI


يشير الذكاء الاصطناعي للمحادثة إلى التقنيات مثل روبوتات المحادثة أو المساعدين الصوتيين، التي يمكن للمستخدمين التحدث إليها. يستخدمون كميات كبيرة من البيانات وتعلم الآلة ومعالجة اللغة الطبيعية للمساعدة في محاكاة التفاعلات البشرية والتعرف على مدخلات الكلام والنص وترجمة معانيها عبر لغات مختلفة.


تتمحور الأبحاث التي تتم في هذا المجال حول:

  • تحسن أنظمة الحوار: تتحسن أنظمة الحوار في تتبع الجوانب طويلة المدى للمحادثة. هدفت العديد من الأوراق البحثية خلال العام الماضي إلى العمل على تحسين قدرة النظام على فهم العلاقات المعقدة التي يتم تقديمها أثناء المحادثة من خلال الاستفادة بشكل أفضل من تاريخ وسياق المحادثة.

  • تحسين الاستجابات: تتعامل العديد من فرق البحث مع تنوع الاستجابات التي يتم إنشاؤها آليًا في الوقت الحالي، تولد روبوتات المحادثات الواقعية في الغالب ردودًا مملة ومتكررة. في العام الماضي، تم تقديم العديد من الأوراق البحثية الجيدة التي تهدف إلى توليد ردود متنوعة وذات صلة.

  • التعرف على المشاعر: يُنظر إلى التعرف على المشاعر على أنه ميزة مهمة لبرامج المحادثة مفتوحة المجال. لذلك، يبحث الباحثون عن أفضل الطرق لدمج التعاطف في أنظمة المحادثات. لا تزال الإنجازات في هذا المجال البحثي متواضعة ولكن التقدم الكبير في التعرف على المشاعر يمكن أن يعزز بشكل كبير أداء وانتشار الروبوتات الاجتماعية، وكذلك يزيد من استخدام روبوتات المحادثة في العلاج النفسي.


رؤية الحاسوب Computer Vision


رؤية الحاسوب هي أحد مجالات الذكاء الاصطناعي التي تدرب أجهزة الحاسوب على تفسير وفهم العالم المرئي. باستخدام الصور الرقمية من الكاميرات ومقاطع الفيديو ونماذج التعلم العميق، يمكن للآلات تحديد الأشياء وتصنيفها بدقة - ثم التفاعل مع ما "تراه".


تتمحور الأبحاث التي تتم في هذا المجال حول:

  • زيادة فعالية 3D: يعد ثلاثي الأبعاد 3D حاليًا أحد مجالات البحث الرائدة في رؤية الحاسوب. العديد من الأوراق البحثية الشيقة قدمت هذا العام أبحاث تهدف إلى إعادة بناء عالمنا ثلاثي الأبعاد من إسقاطاته ثنائية الأبعاد. قدم فريق Google Research أسلوبًا جديدًا لإنشاء خرائط عمق لمشاهد طبيعية كاملة. اقترح فريق Facebook AI حلاً مثيرًا للاهتمام لاكتشاف الكائنات ثلاثية الأبعاد في السحب النقطية Point cloud.

  • زيادة استخدام أساليب التعلم غير الخاضعة للأشراف: تزداد شعبية أساليب التعلم غير الخاضعة للأشراف. التعلم غير الخاضع للإشراف هو أسلوب تعلم الآلة الذي لا يحتاج المستخدمون فيه إلى الإشراف على النموذج. بدلاً من ذلك، يسمح للنموذج بالعمل من تلقاء نفسه لاكتشاف الأنماط والمعلومات التي لم يتم اكتشافها سابقًا. على سبيل المثال قدم فريق بحثي من جامعة ستانفورد نهج التجميع المحلي الواعد لاكتشاف الأشياء والتعرف عليها من خلال التعلم غير الخاضع للإشراف. في ورقة أخرى رائعة، تم ترشيحها لجائزة أفضل ورقة ICCV 2019 ، تم استخدام التعلم غير الخاضع للإشراف لحساب المراسلات عبر الأشكال ثلاثية الأبعاد. مع العلم عند التعامل مع مشكلات تعلم الآلة، هناك نوعان من البيانات (ونماذج تعلم الآلة) هما البيانات الخاضعة للإشراف وهي التي لها دائمًا هدف واحد أو عدة أهداف مرتبطة بها، والبيانات غير الخاضعة للإشراف وهي التي ليس لها أي هدف محدد مسبقاً.

ويمكن التعرف أكثر من خلال المقالة باللغة العربية " التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف"


  • دمج أبحاث الرؤية الحاسوبية مع البرمجة اللغوية العصبية: يتم دمج أبحاث الرؤية الحاسوبية بنجاح مع البرمجة اللغوية العصبية. تمكّن أحدث التطورات البحثية من إجراء تغيير قوي في التسمية التوضيحية بين صورتين في اللغة الطبيعية، والتنقل البصري واللغة في بيئات ثلاثية الأبعاد، وتمثيل اللغة والتعلم الهرمي من أجل استرجاع أفضل لتعليقات الصور والتأسيس البصري.


تعزيز التعلم (Reinforcement Learning (RL


التعلم المعزز هو مجال من مجالات تعلم الآلة، يهتم بكيفية قيام الوكيل البرمجي الذكي باتخاذ الإجراءات في بيئة ما من أجل تعظيم فكرة المكافأة التراكمية. التعلم المعزز هو واحد من ثلاثة نماذج أساسية لتعلم الآلة، جنبًا إلى جنب مع التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. الوكيل البرمجي A software agent عبارة عن برنامج حاسوبي يستخدم تقنيات الذكاء الاصطناعي لحل مشكلات معينة. عادةً ما يتم تثبيت هذا البرنامج على جهاز ويسمى كل من الجهاز والبرنامج بالوكيل. يتم استخدام كلمة وكيل في الذكاء الاصطناعي حيث عادة ما يتم اختصار كلمة وكيل برمجي إلى وكيل فقط agent.


تتمحور الأبحاث التي تتم في هذا المجال حول:


  • تعزيز التعلم Multi-agent reinforcement learning (MARL): يتقدم التعلم المعزز متعدد العوامل (MARL) بسرعة. أظهر فريق OpenAI مؤخرًا كيف أن الوكلاء في بيئة محاكاة الغميضة simulated hide-and-seek environment كانوا قادرين على بناء استراتيجيات لم يعرف الباحثون أن بيئتهم تدعمها. حصلت ورقة بحثية رائعة أخرى على تنويه مشرف في ICML 2019 للتحقيق في كيفية تأثير الوكلاء المتعددين على بعضهم البعض إذا تم تزويدهم بالدافع المقابل.

  • التقييم والتعلم خارج السياسة Off-policy evaluation and off-policy learning: يعتبر التقييم خارج السياسة والتعلم خارج السياسة مهمين للغاية لتطبيقات تعزيز التعلم RL المستقبلية. تشمل الإنجازات الأخيرة في هذا المجال البحثي حلولًا جديدة لتعلم سياسة الدفعات في ظل قيود متعددة، والجمع بين النماذج البارامترية وغير المعلمية، وإدخال فئة جديدة من الخوارزميات خارج السياسة لإجبار الوكيل البرمجي على التصرف بشكل قريب من السياسة.

  • الاستكشاف Exploration: الاستكشاف مجال يمكن من خلاله تحقيق تقدم جاد. قدمت الأوراق المقدمة في ICML 2019 طرق استكشاف فعالة جديدة مع التعلم المعزز RL التوزيعية، واستكشاف أقصى إنتروبيا Entropy ، وظروف أمنية للتعامل مع تأثير الجسر في التعلم المعزز. الانتروبيا Entropy هو مقياس للاضطراب أو عدم اليقين والهدف من نماذج تعلم الآلة وعلماء البيانات بشكل عام هو تقليل عدم اليقين. هذا يسمى كسب المعلومات، كلما زاد الانخفاض في عدم اليقين هذا، تم الحصول على مزيد من المعلومات حول Y من X.

للعلم

يعتبر ICCVهو الحدث الدولي الأبرز في مجال رؤية الكمبيوتر الذي يضم المؤتمر الرئيسي والعديد من ورش العمل والبرامج التعليمية المشتركة. بجودتها العالية وتكلفتها المنخفضة، توفر قيمة استثنائية للطلاب والأكاديميين والباحثين في الصناعة يمكن التعرف عليه من ICCV



الخلاصة

يعتبر الذكاء الاصطناعي من أهم مجالات الأبحاث المستقبلية لأنه أصبح مرتبط بكافة مجالات الحياة، كما ان مجالات البحث واعدة وخصبة وتغطي نواحي متعددة مثل الصحة والتعليم والأعمال وغيرها. ومن أهم المهارات والمعارف التي يجب ان تتوفر في الراغب بالانخراط في مجال الذكاء الاصطناعي فهم وإمكانية كبيرة في الرياضيات والاحصاء والخوارزميات والعلوم المعرفية مثل علم النفس والفلسفة وكذلك مهارات التحليل والتفكير المنطقي والصبر والأهم الشغف بالمعرفة والتدقيق والتمحيص لاستكشاف الجديد. ورغم ان فهم والتعمق بالتخصص هذا يستحسن ان يتم باللغة الإنجليزية لأنها اللغة التي يتوفر فيها كثير من المصادر والأبحاث، ولكن لا يمنع ان نفهم التخصص ونقرأ عنه ونتعلمه باللغة العربية واللغة الإنجليزية في نفس الوقت.

موقع "الذكاء الاصطناعي باللغة العربية " لمن يرغب بالاستكشاف أكثر.



دكتورة أروى الأرياني

أستاذ مشارك - تكنولوجيا المعلومات

باحث ومستشار أكاديمي مستقل

أضغط هنا " Dr. Arwa Aleryani-Blog " لتسجيل متابعة، حتى يصلك الجديد من المدونة الأكاديمية.





153 views
bottom of page