تريند 🔥

🌙 رمضان 2024

جمع الإنترنت وتخزينه على حاسوبك الشخصي قد يصبح حقيقة بوجود Web Scraping!

هدى مالك
هدى مالك

4 د

أصبح هوس التقنية وتغير معطياتها بتسارع رهيب أحد سمات العصر الذي نعيشه، كما تزايد الشغف لابتكار آليات تسهل الغوص في هذا العالم التقني بالغ الدقة والتجدد، في لحظة قراءتك لهذا المقال أنت تسهم في ترويج المحتوى الرقمي وتداوله على نطاق واسع، ولا شك أنك ستصادف ملايين الروابط التي تتضمن صورًا لافتة ومعطيات رقمية ترغب في تخزينها في حاسوبك، من أبرز التحديات التي ستواجهك كيفية تخزين هذه المعلومات، فما هي الطرق التي ستنتهجها للوصول إلى تخزين معطياتك بسرعة وسلاسة بطرق علمية ذكية وآمنة؟ تخيل أنك في غرفة مزدحمة بالملفات، ترى كيف ستتمكن من تخزين ما حولك دون أن يتأثر محتوى الملفات، هذا ما سيتم التطرق إليه في هذا المقال.


بدائل متنوّعة يمكنك تجريبها!


web scraping

قبل أن نغوص في شرح بدائل التخزين المتاحة بدقة واستفاضة لا بد أن نستعرض مجموعة من الآليات المتاحة للحفظ والتخزين والتي أثبتت محدوديتها واحتواءها على عدد كبير من النقائص ومن أهمها: النسخ واللصق، ميّزة screen shot وغيرها من الطرق التي اعتاد عليها معظم المستخدمين، في الواقع كل هذه الطرق تقليدية غير موجّهة لمحترفي الويب، إضافة إلى كون بعض المعلومات غير قابلة للنسخ واللصق دون تشويه الهيكل العام للبيانات، أنت تحتاج بلا شك إلى طريقة معاصرة كتقنية تتيح لك استخراج المعلومات كما هي منشورة بالضبط في الموقع المختار، نحن نتحدث الآن عن تقنية web scraping والتي يقابلها مصطلح تجريف الويب أو كشط الويب بلغتنا العربية.

اقرأ أيضًا: لم تسيطر الصين على هذا القطاع.. هواتف ذكية تستحق الاقتناء من خارج الصين تعرف عليها الآن!


تجريف الويب… مصطلح تقني حديث!

web scraping

من خلال التسمية المقترحة لهذه الآلية أي “زحف وكشط الويب” يمكن حصر المفاهيم والتعريفات المنسوبة إليها فيما يلي:
“هي طريقة بسيطة لاستخراج كافة البيانات والمعلومات الموجودة بأي موقع متاح في شبكة الإنترنت العالمية على شكل صور وبيانات وجداول…. جاهزة للاستعمال دون الحاجة إلى أكواد معقدة لتحويلها من بيانات على شكل HTML “HyperText Markup Language  إلى بيانات على شكل Excel أو XML- CSV أو JSON.

اقرأ أيضًا: الحقيقة وراء برنامج تيك توك.. عنصرية واضطهاد للطبقة الفقيرة وسياسات تقرأ عنها للمرة الأولى!


ما هي أفضل الأدوات المتاحة؟

تم العمل على تطوير المئات من الأدوات والبرامج والتطبيقات لتحاكي عمل زحف الويب وتجسده على مختلف حواسيب المستخدمين حول العالم، تختلف الأدوات لكن الهدف واحد وهو جمع البيانات وتخزينها على الحاسوب. يكمن الاختلاف في سرعة التحويل وآلية عمل البرنامج بشكل عام بإمكانية البحث مباشرة في البرنامج والتحميل في نفس الوقت دون الحاجة إلى URL بفضل محرر مرتبط بالمتصفح… ومن بين هذا العدد الهائل من الأدوات إليك أفصل الأدوات حسب المميزات التقنية والآليات الأذكى التي تسعد أي مبرمج أو رجل أعمال يبحث عن الأفضل لتسهيل عمله:


Scraper chrome

وهو من أكثر الأدوات استعمالًا لاستخراج الـ data باستخدام sitemap“ XMP file” لتحميل البيانات من المواقع التي تضم هذه الفعالية على شكل ملفات CVS بشكل مجاني وآمن تمامًا.


octoparse

يعمل على كشط البيانات بطريقة تنظيمية وفق ملفات Excel – text – HTML لقاعدة التحميل بحاسوبك على مدار 24 ساعة. يقوم بفك شفرات الداتا المعقدة جدًا بعد تفعيل الوضع المتقدم (للمزيد عن هذا البرنامج اقرأ المزيد على هذا الرابط).


لماذا نستعمل تقنية زحف الويب؟

تقنية زحف الويب Web Scraping موجهة في الأساس إلى مالكي الشركات والمبرمجين المحنكين فهي معروفة في مجال التجارة الإلكترونية والذكاء التنافسي الذي يبني الاقتصاد المحلي والعالمي بفضل عمليات الحصول على المعلومات من مواقع منافسة “تجارية واقتصادية وإدارية” كأسعار المنتجات وبيانات وتقارير هامة تضم إحصائيات رسمية وأحوال الأسواق والبورصات….. أي باختصار تشكل تقنية كشط الويب حقلًا ذهبيًا لإدارة الأعمال وتبادل الخبرات وتحقيق مقارنة للمنتجات لتكوين منافسة قوية بين الأطراف التي تشكل أساس عالم الأعمال والتقنيات المعاصرة، إضافة إلى هذا يساعد Web Scraping المبرمجين المبتدئين على الحصول على محتوى مواقع الإنترنت وتعديله واللعب بالمحتوى والحصول على المعلومات المطلوبة.


كيف نستخلص البيانات من شبكة الإنترنت؟

ذو صلة

يمكنك الحصول على الداتا من صفحة ويب معينة بإتباع خطوات سهلة عبر استخدام أحد البرامج المدرجة أعلاه أو عن طريق البرمجة وكتابة برنامج يعتمد على مكتبات البايثون python المختلفة مثل: Requests أو Beautiful Soup.

  1. حدد الرابط URL الخاص بالصفحة المراد استخراج البيانات منها.
  2. تحقق من أنها الصفحة الصحيحة.
  3. ابحث عن البيانات التي تريد استخراجها تحديدًا “يمكن أن تكون وثيقةً أو نصًا أو جزءًا من نص…”
  4. اكتب الكود الذي يستخرج لك هذه البيانات.
  5. خزن البيانات التي حصلت عليها بأي وسيلة ترغب بها.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة