ما هي البيانات الضخمة وبماذا تستخدم

تقدم البيانات الضخمة ميزة تنافسية للمؤسسات اذا أحسنت الأستفادة منها وتحليلها لانها تقدم فهمًا أعمق لعملائها ويساعد ذلك على اتخاذ القرارات داخل المؤسسة بصورة أكثر فعالية، ما هي البيانات الضخمة؟

3 إجابات

“البيانات الضخمة Big Data” هو مصطلح يشير إلى كمية هائلة من البيانات المهيكلة والبيانات غير المهيكلة. وسميت بـ “الضخمة” لأن حجمها كبير لدرجة أنه من الصعب معالجتها باستخدام البرمجيات وقواعد البيانات التقليدية.

وفي معظم الشركات تكون البيانات أكبر حجمًا أو أسرع نموًا من طاقتها الاستيعابية. وللبيانات الضخمة القدرة على مساعدة الشركات على تحسين عملياتها وتسريعها وجعل عملية اتخاذ القرارات عملية ذكية. ومن المهم معرفة أن البيانات الضخمة غالبًا ما يكون مصدرها البريد الإلكتروني أو الأجهزة المحمولة أو التطبيقات أو الحواسيب الشخصية أو قواعد البيانات أو المخدمات وما إلى ذلك.

وإن تلقي هذا النوع من البيانات وتننظيمه وتعديله ومن ثم تحليله هو أمر هام في مساعدة الشركة على زيادة ريعها وجذب المزيد من الزبائن إليها وتحسين عملها بشكل عام. ومن أجل إدارة البيانات الضخمة، يجب معرفة خصائصها الثلاثة، ومن الجدير بالذكر أن كل من تلك الخصائص تطرح سؤالًا يساعد على التعامل معها.  تتمثل الخصائص في:

  1. الحجم (Volume): يشير إلى الحجم المتفجر للبيانات في عالم الحوسبة. يطرح “الحجم” سؤالًا حول كمية البيانات.
  2. السرعة (Velocity): تشير إلى سرعة المعالجة. تطرح “السرعة” سؤالًا حول السرعة التي يتم فيها معالجة البيانات.
  3. التنوع (Variety): يشير إلى أنواع البيانات. يطرح “التنوع” سؤالًا حول مدى تفاوت تنسيقات البيانات.

أكمل القراءة

أصبحنا في زمن التكنولوجيا والمعلومات الإلكترونية والكثير من المصطلحات العلمية ومنها مصطلح البيانات الضخمة أي المجموعات الكبيرة والمتنوعة من المعلومات، بحيث تكثر حجمًا وسرعةً أو بمعنى أدق هي المعلومات التي يخزنها العالم كل يوم في حواسيب الكترونية ضخمة؛ لأننا لا نستطيع تخزينها بالطرق التقليدية، بسبب حجمها وتنوعها وتعقيدها لتصبح أكثر مصداقية.

فهذه البيانات تساعد الشركات والمؤسسات على تحسين العمليات والمعلومات وسرعة في اتخاذ القرارات، وغالبًا تخزن في خوادم ضخمة ذات سعة كبيرة أو لا متناهية. ويقاس حجم المعلومات والبيانات بالبيتا والإكسا والزيتابايت في وقتنا الحالي، كما يعتبر علم البيانات علم يدخل في أكثر المجالات فهو يدخل في:

  • الشركات سواء الصغيرة أو حتى الضخمة من أجل الطلبات والإبلاغ عن المشكلات التي تواجههم في حالة نقل البضائع، وسهولة معرفة النتائج في الربح، والخسارة.
  •  المستشفيات والمراكز الطبية عن طريق تأمين الرعاية والمتابعة للمرضى والمراجعين في حالة التشخيص وفقًا للتحاليل والأشعة المخزنة عن المريض.
  • البنوك والمصارف فهي تساعد على معرفة الجرائم الإلكترونية والتعامل معها ومعرفة البطاقات الإتمانية المزيفة والتداولات المالية الغير قانونية.
  •  عالم التسويق والإعلانات باستخدام خوارزميات مخصصة تساعد في حملات التسويق والإعلان.
  •  التعليم لتحسين نظام التعليم والمناهج وأداء المعلمين واتخاذ رد فعل سريع للمشكلات في النظام التعليمي.

وليس هذا فقط وإنما دخلت البيانات الضخمة في مجال الرياضة بمتابعة حياة الرياضيين ونظامهم الغذائي والتمارين، والتطور الفيزيولوجي للرياضي لتحسين مستواه الحركي.

أكمل القراءة

البيانات الضخمة هي مجموعات كبيرة من المعلومات تنمو بشكل مستمر، تتميز البيانات الضخمة بقاعدة (VVV) وهي الحجم الضخم (Volume)، من فئة تيرابايت وبيتابايت، والسرعة (Velocity) حيث يتم التحديث المستمر والمنتظم يترافق مع زيادة الحجم، والتنوع (Variety) مجال متنوع من البيانات.

يمكن أن تكون على أشكال:

  • البيانات المنظمة أو المُهيكلة (Structured): تكون محفوظة ضمن جداول منسقة ممكنة الفرز، كملفات إكسل أو في قواعد بيانات SQL، ذات أهمية كبيرة لسهولة تجميعها من مواقع مختلفة في قاعدة البيانات.
  • البيانات غير المنظمة أو غير المُهيكلة (structuredUn): ليس لها نموذج معين أو غير منظمة بطريقة محددة مسبقًا، تتضمن ملفات الصوت أو ملفات الفيديو أو قواعد بيانات No-SQL، مؤخرًا تم استخدام تقنيات حديثة لتخزين هذا النوع من البيانات، مما أدى إلى زيادة كبيرة في القدرة على تخزينها ومعالجتها.
  • البيانات شبه المنظمة أو شبه المُهيكلة (Semi-Structured): من أشكال البيانات المنظمة التي لا تتوافق مع الهيكل الرسمي لنماذج بقواعد البيانات أو جداول البيانات، من أمثلتها JSON وXML، يعتبر تحليلها أسهل من تحليل البيانات غير المنظمة.
  • البيانات الوصفية (Data about Data): لا تعتبر بنية منفصلة، إذ تعتبر من عناصر تحليل البيانات الضخمة، توفر معلومات إضافية حول مجموعة معينة من البيانات.

يتم استخراج البيانات الضخمة من مصادر البيانات (MS SQL و MySQL و NoSQL و Hadoop و Spark)، واستخدام لغات برمجة مثل (Python، Scala، Java) لمعالجتها، واستخدامها في العديد من المجالات العملية التجارية والتسويقية والطبية.

أكمل القراءة

هل لديك إجابة على "ما هي البيانات الضخمة وبماذا تستخدم"؟