نتابع في هذه المقالة بقية منصات تحليلات البيانات والتي يمكن الاطلاع على الجزء الأول من خلال مقالة
منصة CDH (Cloudera Distribution for Hadoop)
يهدف CDH إلى نشر التكنولوجيا على مستوى المؤسسات. إنه مفتوح المصدر تمامًا ولديه نظام أساسي للتوزيع المجاني ويشمل Apache Hadoop و Apache Spark و Apache Impala وغيرها. يسمح بجمع ومعالجة وإدارة واكتشاف ونمذجة وتوزيع بيانات غير محدودة.
الايجابيات
توزيع شامل.
يدير Cloudera Manager كتلة Hadoop بشكل جيد للغاية.
سهل التنفيذ.
إدارة أقل تعقيدًا.
مستوى عال من الأمن والحوكمة.
منصة Apache Cassandra
يعتبر Apache Cassandra غير مكلف وموزع مفتوح المصدر NoSQL DBMS مصمم لإدارة كميات ضخمة من البيانات المنتشرة عبر العديد من مزودات المنتجات، مما يوفر توفرًا عاليًا. يستخدم CQL (Cassandra Structure Language) للتفاعل مع قاعدة البيانات. مع العلم Cassandra هو نظام قائم على Java يمكن إدارته ومراقبته عبر امتدادات إدارة Java (JMX).
الايجابيات
لا توجد نقطة فشل واحدة.
يتعامل مع البيانات الضخمة بسرعة كبيرة.
تخزين منظم السجل.
النسخ المتماثل الآلي.
قابلية التوسع الخطي.
موقع Apache Cassandra
منصة KNIME
منصة KNIME ترمز لــ Konstanz Information Miner وهي أداة مفتوحة المصدر تُستخدم لتقارير المؤسسة ، والتكامل، والبحث، وإدارة علاقات العملاء، واستخراج البيانات، وتحليلات البيانات، واستخراج النصوص، وذكاء الأعمال. وهو يدعم أنظمة تشغيل Linux و OS X و Windows.
الايجابيات
عمليات ETL بسيطة.
يتكامل بشكل جيد مع التقنيات واللغات الأخرى.
مجموعة خوارزمية غنية.
سير عمل منظم وقابل للاستخدام للغاية.
أتمتة الكثير من العمل اليدوي.
موقع KNIME
منصة Datawrapper
هي عبارة عن منصة مفتوحة المصدر لتصور البيانات التي تساعد مستخدميها على إنشاء مخططات بسيطة ودقيقة وقابلة للتضمين بسرعة كبيرة.
الايجابيات
سهل الاستخدام.
يعمل بشكل جيد للغاية على جميع أنواع الأجهزة - الهاتف المحمول أو الجهاز اللوحي أو سطح المكتب.
استجابة كاملة.
سريع و تفاعلي.
يجمع كل المخططات في مكان واحد.
خيارات التخصيص والتصدير رائعة.
لا يتطلب أي ترميز.
موقع Datawrapper
منصة MongoDB
هي قاعدة بيانات NoSQL موجهة للمستندات مكتوبة بلغة C و ++C و JavaScript. مجانية للاستخدام وهي أداة مفتوحة المصدر تدعم أنظمة تشغيل متعددة بما في ذلك Windows Vista (والإصدارات الأحدث) و OS X (10.7 والإصدارات الأحدث) و Linux و Solaris و FreeBSD.
تشمل ميزاته الرئيسية التجميع والاستعلامات المخصصة واستخدامات تنسيق BSON والتقاسم والفهرسة والنسخ المتماثل والتنفيذ من جانب المزود لجافا سكريبت والمخطط والتجميع المغلق وخدمة إدارة MongoDB (MMS) وموازنة التحميل وتخزين الملفات.
مع العلم يرمز BSON إلى Binary Javascript Object Notation. وهو عبارة عن تسلسل ثنائي التشفير لوثائق JavaScript Object Notation (JSON) . تم تمديد BSON لإضافة بعض أنواع البيانات الاختيارية غير الأصلية ، مثل التواريخ والبيانات الثنائية.
الايجابيات
سهل التعلم.
يوفر الدعم لتقنيات ومنصات متعددة.
موثوقة ومنخفضة التكلفة.
موقع MongoDB
الخلاصة
أولاً، دعنا نزيل الالتباس بين محلل البيانات التقليدي ومحلل البيانات الضخمة. سيطر الأول على قطاع الأعمال لفترة طويلة ويهتم بالبيانات المنظمة وتحليلاتها. نظرًا لأن البيانات تصبح أكثر تعقيدًا ، فهناك حاجة متزايدة للمهنيين ذوي المهارات والخبرات المتقدمة.
ومن ثم، يأتي محللو البيانات الضخمة إلى المشهد، ويعملون بشكل أساسي مع البيانات الخام من مصادر متعددة وغير المنظمة وشبه المنظمة وبأحجام ضخمة. ونظرًا لحجمها الكبير، يمكن لأدوات إدارة البيانات غير التقليدية أن تعمل على البيانات الضخمة بكفاءة. لذلك، من المسلم به أن طبيعة العمل لمحلل البيانات الضخمة والمهارات المطلوبة ستختلف عن مهارات محلل البيانات التقليدية.
محلل البيانات الضخمة يتنقل في أنظمة إدارة قواعد البيانات ويتعامل مع كميات كبيرة من البيانات غير المهيكلة. يُفضل دائمًا امتلاك المعرفة التقنية، رغم أنها ليست إلزامية، إلا أنها تزكية مناسبة.
تساعد تحليلات البيانات الضخمة المؤسسات على تسخير بياناتها واستخدامها لتحديد الفرص الجديدة. وهذا بدوره يؤدي إلى تحركات أعمال أكثر ذكاء وعمليات أكثر كفاءة وأرباح أعلى وعملاء أكثر سعادة. أصبح تحليلات البيانات الضخمة مجال سريع النمو مع فرص مذهلة للمهنيين في جميع الصناعات وفي جميع أنحاء العالم. مع استمرار ارتفاع الطلب على متخصصي البيانات الضخمة المهرة ، أصبح الطلب عالمي من خلال التعامل اونلاين مع الموهوبين والمهرة من متخصصي تحليلات البيانات الضخمة.
بينما تتطلب وظائف البيانات الضخمة غالبًا الحصول على درجة علمية ومعرفة جيدة بالرياضيات والإحصاء ولمالية ولاقتصاد وعلوم الحاسوب، فإن هذا ليس هو الحال دائمًا خاصة للشركات متوسطة النشاط. نظرًا لأن المجال يتطور بنفس سرعة البيانات التي يحللها، فإن الدور يتطلب من المتخصصين رفع المهارات باستمرار من خلال الدبلومات والدورات التخصصية التي تأهل الشخص بالمعرفة الجديدة للوصول إلى متخصص أو محلل بيانات ضخمة مع ما يلزم من مهارات حل المشاكل والتفكير المنطقي والابداعي والشغف لاكتشاف الجواهر المخبئة داخل البيانات الضخمة.
لمعرفة بقية الأدوات يمكن الاطلاع على المصدر:
دكتورة أروى يحيى الأرياني
أستاذ مشارك - تكنولوجيا المعلومات
باحث ومستشار أكاديمي
أضغط هنا "Dr. Arwa Aleryani-Blog " لتسجيل متابعة، حتى يصلك الجديد من المدونة الأكاديمية.
Comentarios