يتعرض العديد من المستخدمين إلى مشكلة ترميز اللغة في صفحات الويب وهي مشاكل في عرض بعض المحارف الخاصة باللغة الخاصة بالموقع، عندما تكون اللغة إنجليزية لا يحدث تعارض أثناء عرضها ضمن المتصفح ولكن تلك مشكلة ترميز اللغة في صفحات الويب تظهر في بقية اللغات وخاصة تلك التي تحوي أحرفاً مثل å ä ö وهذا يزيد صعوبة فك وإظهار هذه المحارف ضمن صفحات المواقع.

طريقة التمثيل الأساسية في الحاسب

المشكلة بشكل أساسي هي عدم قدرة الحواسيب على التعامل بشكل مباشر مع المحارف هي فقط تتعامل مع مع الرقمين 0 و 1 بالتحديد وتسمى بت Bit، وتجتمع معًا على شكل مجموعات من ثمانية بتات تدعى بايت Byte، وكل بايت يمثل رقمًا بين 0 و 255، مثلاً الـ 0 يمثل بـ 00000000 و الـ255 يمثل بـ11111111، ولتمثيل الأرقام الكبيرة يستخدم بايتين معًا أي 16 بت، والتي يمكنها تشكيل الأرقام في المجال 0-65535، ثم 4 بايتات للأرقام الأكبر وهكذا.

مشكلة ترميز اللغة في صفحات الويب

يخزن الحاسب النصوص كسلاسل نصية حيث يكون لكل حرف فيها ترميز خاص من الأرقام، وفقًا لنموذج الترميز العالمي، والمشكلة هي وجود أكثر من نموذج ترميز في العالم ويكون تمثيل المحارف مختلفًا بين كل نموذج عن الآخر ولذلك يظهر أحرف غير متوقعة عند تغيير الترميز المستخدم.

مثلًا المحرف ä يعبر عنه بالرقم 228 في نموذج الترميز ISO-8859-1، ويخزن كمحرفين أساسيين يعبر عنهما بالرقم 50084 في نموذج الترميز UTF-8، لذلك عند محاولة تفسير المحرف ä المشفر وفق النظام IS0-8859-1 باستخدام فك التشفير اعتمادًا على UTF-8 فسوف نحصل على المحرفين ä.

تفسير حل مشكلة ترميز اللغة في صفحات الويب

يمكن حل هذه المشكلة بطريقتين:

  1. أن يعتمد الجميع على نموذج ترميز واحد.
  2. أن يقوم الحاسب الذي يرسل النص المطلوب بإرسال نمط الترميز الذي يستخدمه للجهة الأخرى.

يبدو أن الحل الأول مستحيل فهنالك اعتماديات مختلفة حسب المناطق لأنماط ونماذج الترميز لمختلف المحارف تبعًا لكل لغة، حيث يوجد لكل منها نموذج ترميز خاص لتمثيل محارفها.1

النمط العالمي Unicode/UTF-8 هو أحد طرق الترميز التي تحوي أي محرف موجود في مختلف اللغات، والمشكلة الوحيدة هي أن هذا النمط غير مستخدم في كافة المناطق والمواقع.

بشكل عام يكمن حل المشكلة الأساسي أثناء كتابة كودات صفحات المواقع وهناك يجب التصريح عن الترميز المتاح لصفحة الانترنت عن طريق تعليمة بسيطة، ولكن لا بد من الإشارة إلى قدرة المتصفحات الحديثة تلقائيًا على حل هذه المشكلة دون تدخل المبرمج أو المستخدم وسنوضح ذلك.

هل لا زالت مشكلة ترميز اللغة في صفحات الويب عائقًا

في الواقع أصبح حل المشكلة أمرًا بديهيًا لدرجة تمت إضافته إلى الأدوات البرمجية المستخدمة في بناء المواقع بشكل افتراضي؛ فعلى سبيل المثال عند بناء موقع ويب واستخدام HTML5 فإن الترميز الافتراضي لعناصر الصفحة يكون من نوع UTF-8 دون تدخل المبرمج ومع ذلك لازال بعض المبرمجين يضيفون التعليمة الشهيرة هذه لتحديد نمط الترميز:

<meta charset=”UTF-8″>

وبالنسبة للمحتوى الذي يحفظ ضمن قاعدة بيانات ليتم عرضه ضمن الموقع، فهو أيضًا أصبح بشكل افتراضي يحفظ باستخدام الترميز UTF-8، وبذلك وفي جميع المواقع الحديثة لم يعد هنالك خوف من مشكلة ترميز اللغات.2

المراجع