تعلم الألة (Machine Learning)، والمختصرة باسم (ML) هو استخدام الخوارزميات والنماذج الإحصائية لتحليل واستخلاص الاستنتاجات من الأنماط في البيانات باستخدام وتطوير أنظمة الحاسوب القادرة على التعلم والتكيف دون اتباع تعليمات صريحة مع تقييد التدخل البشري في توجيهها أو تغييبه تماما. وهو دراسة خوارزميات الحاسوب التي يمكن أن تتحسن تلقائيًا من خلال التجربة وباستخدام البيانات، ويعتبر جزء من الذكاء الاصطناعي. وتتنوع الاتجاهات البحثية في مجال تعلم الألة وتتزايد بشكل مستمر ومن هذه الاتجاهات ما سيتم سرده في هذه المقالة.
تعلم الألة بدون ترميز No-Code Machine Learning
تعد خوارزميات تعلم الألة بدون ترميز No-Code Machine Learning طريقة لبرمجة تطبيقات ML دون الحاجة إلى المرور بعمليات طويلة وشاقة من المعالجة المسبقة والنمذجة وتصميم الخوارزميات وجمع البيانات الجديدة وإعادة التدريب والنشر وغير ذلك. بعض من المزايا الرئيسية لتعلم الألة بدون ترميز التنفيذ السريع ويعني عدم وجود حاجة إلى كتابة أي تعليمات برمجية أو الحاجة إلى تصحيح الأخطاء، سيكون معظم الوقت المستغرق في الحصول على النتائج بدلاً من التطوير، وانخفاض التكاليف نظرًا لأن الأتمتة تلغي الحاجة إلى وقت تطوير أطول، لم تعد الكلفة العالية موجودة، كذلك البساطة للسهولة في الاستخدام نظرًا لتنسيق السحب والإفلات المبسط.
وبهذا التبسيط لن يعد صعبا ان تكون ملم بعمليات تعلم الألة، ولكن بالطبع لا يخدم هذه التبسيط المشاريع الكبيرة. ومع ذلك، قد يكون مناسبًا للمشاريع التنبؤية البسيطة لتحليل البيانات مثل أرباح التجزئة، والتسعير الديناميكي، ومعدلات الاحتفاظ بالموظفين. تعد خوارزميات تعلم الألة دون ترميز هي الخيار الأفضل للشركات الصغيرة التي لا تستطيع تحمل تكاليف الاحتفاظ بفريق من علماء البيانات. على الرغم من أن حالات الاستخدام محدودة، إلا أنها تعد خيارًا رائعًا لتحليل البيانات والتنبؤ بمرور الوقت دون قدر كبير من التطوير أو الخبرة.
تعلم الألة الصغير TinyML
في عالم تقوده حلول إنترنت الأشياء بشكل متزايد، تشق TinyML طريقها إلى هذا المزيج. في حين أن تطبيقات تعلم الألة واسعة النطاق موجودة، فإن قابليتها للاستخدام محدودة إلى حد ما. غالبًا ما تكون التطبيقات الصغيرة ضرورية. قد يستغرق طلب الويب بعض الوقت لإرسال البيانات إلى خادم كبير حتى تتم معالجتها بواسطة خوارزمية تعلم الألة ثم إرسالها مرة أخرى. بدلاً من ذلك ، قد يكون النهج الأكثر استحسانًا هو استخدام برامج ML على الأجهزة المتطورة.
يعتبر TinyML نوع من تعلم الألة الذي يعمل على تقليص شبكات التعلم العميق لتناسب الأجهزة الصغيرة. من خلال تشغيل برامج ML على نطاق أصغر على أجهزة IoT edge ، يمكن تحقيق زمن انتقال أقل واستهلاك أقل للطاقة ونطاق ترددي مطلوب أقل وضمان خصوصية المستخدم. نظرًا لأنه لا يلزم إرسال البيانات إلى مركز معالجة البيانات ، يتم تقليل وقت الاستجابة والنطاق الترددي واستهلاك الطاقة بشكل كبير. يتم الحفاظ على الخصوصية أيضًا نظرًا لأن الحسابات تتم محليًا بالكامل.
يحتوي هذا الابتكار الرائج على قدر كبير من التطبيقات في قطاعات مثل الصيانة التنبؤية للمراكز الصناعية وصناعات الرعاية الصحية والزراعة وغيرها. تستخدم هذه الصناعات أجهزة إنترنت الأشياء مع خوارزميات TinyML لتتبع البيانات المجمعة والتنبؤ بها. على سبيل المثال ، Solar Scare Mosquito هو مشروع إنترنت الأشياء يستخدم TinyML لقياس وجود البعوض في الوقت الفعلي. يمكن أن يولد هذا أنظمة إنذار مبكر للأوبئة المرضية من البعوض، على سبيل المثال.
تعلم الألة الجاهز AutoML
على غرار ML بدون ترميز، يهدف AutoML إلى جعل بناء تطبيقات تعلم الألة أكثر سهولة للمطورين. منذ أن أصبح تعلم الألة أكثر فائدة بشكل متزايد في مختلف الصناعات ، ازداد الطلب على الحلول الجاهزة. يهدف Auto-ML إلى سد الفجوة من خلال توفير حل سهل الوصول إليه لا يعتمد على خبراء ML.
يتعين على علماء البيانات الذين يعملون في مشاريع تعلم الألة التركيز على المعالجة المسبقة للبيانات، وتطوير الميزات، والنمذجة، وتصميم الشبكات العصبية، والمعالجة اللاحقة، وتحليل النتائج. نظرًا لأن هذه المهام معقدة للغاية ، يوفر AutoML التبسيط من خلال استخدام القوالب.
مثال على ذلك هو AutoGluon ، وهو حل جاهز للنصوص والصور والبيانات الجدولية. يتيح ذلك للمطورين وضع نماذج أولية لحلول التعلم العميق بسرعة والحصول على تنبؤات دون الحاجة إلى خبراء علوم البيانات.
يجلب AutoML أدوات المخططات الرسومية المحسّنة إلى الجدول ويتيح إمكانية الضبط التلقائي لبنى الشبكات العصبية. تقليديًا ، تم تصنيف البيانات يدويًا عن طريق الاستعانة بمصادر خارجية. هذا يجلب قدرًا كبيرًا من المخاطر بسبب الخطأ البشري. نظرًا لأن AutoML يعمل بشكل مناسب على أتمتة الكثير من عملية وضع العلامات، فإن خطر حدوث خطأ بشري أقل بكثير. هذا يقلل أيضًا من تكاليف العمالة ، مما يسمح للشركات بالتركيز بقوة أكبر على تحليل البيانات. نظرًا لأن AutoML يقلل من هذه الأنواع من التكاليف ، سيصبح تحليل البيانات والذكاء الاصطناعي والحلول الأخرى أرخص وأكثر سهولة في متناول الشركات في السوق.
مثال آخر على AutoML في العمل هو نماذج DALL-E و CLIP (التدريب المسبق للصور اللغوية المتباينة) من OpenAI. يجمع هذان النموذجان بين النص والصور لإنشاء تصميمات مرئية جديدة من وصف نصي.
إدارة تشغيل تعلم الألة (MLOps)
إدارة عمليات تعلم الألة (MLOps) Machine Learning Operationalization Management هي ممارسة لتطوير حلول برمجيات تعلم الألة مع التركيز على الموثوقية والكفاءة. هذه طريقة جديدة لتحسين طريقة تطوير حلول تعلم الألة لجعلها أكثر فائدة للشركات. يمكن تطوير تعلم الألة والذكاء الاصطناعي باستخدام تخصصات التطوير التقليدية، ولكن السمات الفريدة لهذه التكنولوجيا تعني أنها قد تكون أكثر ملاءمة لاستراتيجية مختلفة. يوفر MLOps صيغة جديدة تجمع بين تطوير أنظمة ML ونشر أنظمة ML في طريقة واحدة متسقة. أحد الأسباب التي تجعل MLOps ضرورية هو أننا نتعامل مع الكثير والكثير من البيانات على نطاقات أكبر والتي تتطلب درجات أكبر من الأتمتة. أحد العناصر الرئيسية في MLOps هو دورة حياة الأنظمة، التي قدمها نظام DevOps.
تتمثل إحدى مزايا MLOps في قدرتها على معالجة أنظمة الحجم بسهولة. من الصعب التعامل مع هذه المشكلات على نطاقات أكبر بسبب فرق علوم البيانات الصغيرة والفجوات في الاتصال الداخلي بين الفرق والأهداف المتغيرة والمزيد.
عندما نستخدم تصميم هدف العمل أولاً ، يمكننا جمع البيانات وتنفيذ حلول ML بشكل أفضل خلال العملية بأكملها. تحتاج هذه الحلول إلى إيلاء اهتمام وثيق لمدى ملاءمة البيانات، وإنشاء الميزات، والتنظيف، وإيجاد مضيفي الخدمة السحابية المناسبين، وسهولة التدريب على النموذج بعد النشر في بيئة الإنتاج. من خلال تقليل التباين وضمان الاتساق والموثوقية ، يمكن أن يكون MLOps حلاً رائعًا للمؤسسات على نطاق واسع.
التعلم العميق الكامل Full-stack Deep Learning
أدى الانتشار الواسع لأطر التعلم العميق والأعمال التجارية لتكون قادرة على تضمين حلول التعلم العميق في المنتجات إلى ظهور طلب كبير على "التعلم العميق الكامل". ما هو التعلم العميق الكامل؟ لنتخيل أن لديك مهندسين مؤهلين تأهيلاً عالياً للتعلم العميق قاموا بالفعل بإنشاء بعض نماذج التعلم العميق الرائعة. ولكن مباشرة بعد إنشاء نموذج التعلم العميق، هناك عدد قليل من الملفات غير المتصلة بالعالم الخارجي حيث يعيش المستخدمون المستهدفون.
كخطوة تالية ، يتعين على المهندسين ربط نموذج التعلم العميق ببعض البنية التحتية مثل الخلفية على سحابة، تطبيق الهاتف المحمول وبعض الأجهزة المتطورة (Raspberry Pi و NVIDIA Jetson Nano وما إلى ذلك)
تعلم الألة غير الخاضع للرقابة Unsupervised ML
مع تحسن الأتمتة ، هناك حاجة إلى المزيد والمزيد من حلول علوم البيانات دون تدخل بشري. يعد ML غير الخاضع للإشراف اتجاهًا واعدًا لمختلف الصناعات وحالات الاستخدام. نحن نعلم بالفعل من التقنيات السابقة أن الآلات لا يمكنها التعلم بمفردها. يجب أن يكونوا قادرين على أخذ معلومات جديدة وتحليل تلك البيانات من أجل الحل الذي يقدمونه. ومع ذلك ، يتطلب هذا عادةً قيام علماء البيانات البشرية بإدخال هذه المعلومات في النظام.
يركز ML غير الخاضع للإشراف على البيانات غير المسماة. بدون توجيه من خبير البيانات، يتعين على برامج تعلم الألة غير الخاضعة للرقابة أن تستخلص استنتاجاتها الخاصة. يمكن استخدام هذا في دراسة هياكل البيانات بسرعة لتحديد الأنماط المفيدة المحتملة واستخدام هذه المعلومات لتحسين عملية صنع القرار وزيادة أتمتها. أحد الأساليب التي يمكن استخدامها لفحص البيانات هو التجميع. من خلال تجميع نقاط البيانات مع الميزات المشتركة ، يمكن لبرامج تعلم الألة فهم مجموعات البيانات وأنماطها بشكل أكثر كفاءة.
التعلم المعزز Reinforcement Learning
في تعلم الألة، هناك ثلاثة نماذج؛ التعلم تحت الإشراف، والتعلم غير الخاضع للإشراف، والتعلم المعزز. في التعلم المعزز، يتعلم نظام تعلم الألة من التجارب المباشرة مع بيئته. يمكن للبيئة استخدام نظام المكافأة / العقوبة لتعيين قيمة للملاحظات التي يراها نظام ML. في النهاية، سيرغب النظام في تحقيق أعلى مستوى من المكافأة أو القيمة، على غرار تدريب التعزيز الإيجابي للحيوانات.
يحتوي هذا على قدر كبير من التطبيقات في لعبة الفيديو ولعبة اللوحة AI. ومع ذلك، عندما تكون السلامة سمة مهمة للتطبيق، فقد لا يكون ML التعزيزي هو أفضل فكرة، نظرًا لأن الخوارزمية تتوصل إلى استنتاجات بأفعال عشوائية، فقد تتخذ قرارات غير آمنة عمدًا في عملية التعلم وهذا يمكن أن يعرض المستخدمين للخطر إذا تركت دون رادع. هناك أنظمة تعلم معزز أكثر أمانًا قيد التطوير للمساعدة في حل هذه المشكلة التي تأخذ السلامة في الحسبان لخوارزمياتها.
تعلم قليل من اللقطات ، لقطة واحدة، بدون طلقة Few Shot, One Shot, & Zero Shot Learning
يعد جمع البيانات أمرًا ضروريًا لممارسات تعلم الألة. ومع ذلك ، فهي أيضًا واحدة من أكثر المهام شاقة ويمكن أن تتعرض للخطأ إذا تم تنفيذها بشكل غير صحيح. يعتمد أداء خوارزمية تعلم الألة بشكل كبير على جودة ونوع البيانات المقدمة.
التعلم بالقليل من اللقطات Few shot يركز على بيانات محدودة. إلا أنه يحتوي على تطبيقات مختلفة في مجالات مثل تصنيف الصور والتعرف على الوجه وتصنيف النص. على الرغم من أن عدم الحاجة إلى قدر كبير من البيانات لإنتاج نموذج قابل للاستخدام أمر مفيد ، إلا أنه لا يمكن استخدامه لحلول معقدة للغاية. من الأمثلة الرائعة على تطبيقات تعليمية قليلة اللقطات اكتشاف الأدوية. في هذه الحالة ، يتم تدريب النموذج على البحث عن جزيئات جديدة واكتشاف الجزيئات المفيدة التي يمكن إضافتها في الأدوية الجديدة. يمكن أن تكون الجزيئات الجديدة التي لم تخضع للتجارب السريرية سامة أو غير فعالة ، لذلك من الضروري تدريب النموذج باستخدام عدد صغير من العينات.
وبالمثل ، فإن التعلم بلقطة واحدة one shot يستخدم بيانات أقل. ومع ذلك ، فإنه يحتوي على بعض التطبيقات المفيدة للتعرف على الوجه. على سبيل المثال، يمكن للمرء مقارنة صورة هوية جواز السفر المقدمة بصورة الشخص من خلال الكاميرا. هذا لا يتطلب سوى البيانات الموجودة بالفعل ولا تحتاج إلى قاعدة بيانات كبيرة من المعلومات.
يعد التعلم الصفري Zero shot أمرًا محيرًا في البداية. كيف يمكن أن تعمل خوارزميات تعلم الألة بدون بيانات أولية؟ تراقب أنظمة Zero shot ML موضوعًا وتستخدم معلومات حول هذا الكائن للتنبؤ بالتصنيف الذي قد يقع فيه. هذا ممكن للبشر. على سبيل المثال، من المحتمل أن يكون الإنسان الذي لم ير نمرًا من قبل، ولكنه رأى قط قادرًا على تحديد النمر على أنه نوع من الحيوانات القطط.
تقاطع ML و IoT
إنترنت الأشياء هو بالفعل تقنية راسخة حيث يتم توصيل العديد من الأجهزة أو "الأشياء" عبر الشبكة ويمكنهم التواصل مع بعضهم البعض. تتزايد هذه الأجهزة باستمرار، لدرجة أنه قد يكون هناك أكثر من 64 مليار جهاز إنترنت الأشياء بحلول عام 2025. تجمع كل هذه الأجهزة البيانات التي يمكن تحليلها ودراستها للحصول على رؤى مفيدة. هذا هو المكان الذي يصبح فيه تعلم الألة مهمًا للغاية! يمكن استخدام خوارزميات تعلم الألة لتحويل البيانات التي تم جمعها بواسطة أجهزة إنترنت الأشياء إلى نتائج مفيدة قابلة للتنفيذ.
ومن الأمثلة على ذلك Green Horizons ، وهو مشروع أنشأه مختبر أبحاث الصين التابع لشركة IBM والذي يهدف إلى التحكم في مستويات التلوث لمعايير أكثر قابلية للتنفس. يمكن القيام بذلك باستخدام شبكة إنترنت الأشياء حيث تقوم المستشعرات بجمع الانبعاثات من المركبات ومستويات الغبار واتجاه تدفق الهواء والطقس ومستويات حركة المرور وما إلى ذلك، ثم يتم استخدام خوارزميات ML لإيجاد أفضل طريقة لتقليل هذه الانبعاثات. يمكن أيضًا رؤية تقاطع ML و IoT في مجال المركبات الذكية حيث يجب أن تكون السيارات ذاتية القيادة دقيقة للغاية وتحتاج جميع الأجزاء للتواصل مع بعضها البعض في أجزاء من الثانية على الطريق. يوضح هذا مدى أهمية مزيج هذه التقنيات. حتى أن شركة Gartner تتوقع أن أكثر من 80٪ من مشاريع إنترنت الأشياء الخاصة بالمؤسسات ستستخدم الذكاء الاصطناعي وتعلم الألة بشكل ما بحلول عام 2022 ، وهو أعلى بكثير من نسبة 10٪ من المشاريع التي تستخدمه حاليًا.
تعلم الألة في الأمن السيبراني Machine Learning in Cyber Security
نظرًا لأن تعلم الألة أصبح أكثر شيوعًا في الأوقات الحالية، فإنه يزيد أيضًا من تطبيقاته في العديد من الصناعات المختلفة. واحدة من أكثرها شعبية هي صناعة الأمن السيبراني. يحتوي تعلم الألة على العديد من التطبيقات في مجال الأمن السيبراني، بما في ذلك تحسين برامج مكافحة الفيروسات المتاحة، ومكافحة الجريمة الإلكترونية التي تستخدم أيضًا إمكانات تعلم الألة، وتحديد التهديدات الإلكترونية، وما إلى ذلك.
يستخدم تعلم الألة أيضًا لإنشاء برنامج Smart Antivirus يمكنه تحديد أي فيروس أو برنامج ضار من خلال سلوكه غير الطبيعي بدلاً من مجرد استخدام توقيعه مثل برنامج مكافحة الفيروسات العادي. لذلك يمكن لمضاد الفيروسات الذكي تحديد التهديدات القديمة من الفيروسات التي تمت مواجهتها سابقًا وأيضًا التهديدات الجديدة من الفيروسات التي تم إنشاؤها مؤخرًا من خلال تحليل سلوكها. نظرًا لأن العديد من الشركات تدمج هذه الأيام تعلم الألة في الأمن السيبراني، فإن الأمثلة الأكثر شيوعًا على ذلك هي Chronicle ، وهي شركة للأمن السيبراني تديرها Alphabet (الشركة الأم لـ Google) ، Sqrrl ، وهي شركة أسسها موظفون سابقون في وكالة الأمن القومي.
الخلاصة
أصبحت التكنولوجيا أسرة كبيرة جدا يترابط أفرادها مع بعضهم البعض ويدعموا بعضهم البعض، ويستقل كل منهم بميزات واستخدامات خاصة به. انترنت الأشياء ( Internet of Things) ليس علم مستقل بذاته، الحوسبة السحابية (Cloud computing) لا تعمل بمعزل عن بقية التقنيات، تحليل البيانات الرقمية يعمل بتعاون خوارزميات تعلم الألة (Machine learning) وغيرها من التقنيات، الذكاء الاصطناعي (Artificial Intelligence) يمد خيوطه لبقية التقنيات، الواقع المعزز ( Augmented Reality) يستند على البيانات الرقمية التي تم تحليلها من قبل بقية التقنيات، وهكذا الكل يعمل من أجل الكل.
من المهم ان نعمل على قاعدة "تعلم الكثير عن مجال واحد وتعلم القليل عن كل مجال". رغم ان تفرع التكنولوجيا شجع على التخصص بتلك أو ذاك من التقنيات، ولكن بقليل من التركيز نجد ان الجذور متشابكة. تصب اغلب التقنيات إلى جمع البيانات الرقمية ( Big Data) وتكديسها ومن أجل ذلك اخُترعت كثير من التقنيات التي تجلب البيانات الرقمية، وتكون لدينا ما يعرف بالبيانات الضخمة، القوة التي تنمو بشكل كبير، تضخمت وانتقلت إلى السحب cloud computing حتى تستطيع التضخم أكثر وأكثر، ومع هذه التقنيات ظهرت تقنيات لتحليل هذه البيانات والاستفادة منها واستخلاص المعرفة، لخدمة تقنيات أخرى تدعم وتساعد في رفاهية الأنسان وتدفع بعجلة الحياة إلى الأمام فقط بوقود البيانات الرقمية.
المصادر
دكتورة أروى يحيى الأرياني
أستاذ مشارك - تكنولوجيا المعلومات
باحث ومستشار أكاديمي
أضغط هنا "Dr. Arwa Aleryani-Blog " لتسجيل متابعة، حتى يصلك الجديد من المدونة الأكاديمية.
Comments