LEAP26

جوجل تطلق تطبيق إملاء صوتي يعمل بالذكاء الاصطناعي دون الحاجة للإنترنت

عبد الرحمن عمرو
عبد الرحمن عمرو

3 د

أطلقت غوغل تطبيق إملاء صوتي يعمل بدون اتصال دائم بالإنترنت.

يعتمد التطبيق على نماذج تعرف صوتي تعمل محليًا على الجهاز.

يحاول التطبيق فهم الكلام وتنظيف النص ليكون جاهزًا للاستخدام.

يمكن الجمع بين المعالجة المحلية وقدرات السحابة لتحسين الدقة والأداء.

تسعى غوغل لإعادة بعض القدرات إلى الجهاز مع الحفاظ على خصوصية المستخدم.

في لحظة عابرة، حين تملي فكرة سريعة على هاتفك في الطريق أو بين اجتماع وآخر، يصبح الاتصال بالإنترنت تفصيلاً مؤرقاً أكثر مما ينبغي. هنا تحديداً اختارت غوغل أن تتدخل بهدوء، مطلقة تطبيق إملاء صوتي يعمل دون اتصال دائم بالشبكة، في خطوة تبدو صغيرة ظاهرياً لكنها تعكس تحوّلاً أوسع في طريقة تعامل الشركات مع الذكاء الاصطناعي والخصوصية معاً.


تطبيق يعمل على الحافة لا في السحابة

التطبيق الجديد الذي يحمل اسم Google AI Edge Eloquent يعتمد على نماذج تعرّف صوتي مبنية على Gemma، ويتم تشغيلها محلياً على الجهاز بعد تنزيلها. الفكرة بسيطة تقنياً لكنها عميقة الأثر: تحويل الكلام إلى نص دون الحاجة إلى إرسال التسجيلات إلى خوادم سحابية.

هذا النهج المعروف باسم المعالجة على الحافة يعيد بعض السيطرة إلى المستخدم. فبدلاً من الاعتماد الكامل على Gemini السحابي، يمكن تفعيل وضع محلي بالكامل، ما يعني سرعة استجابة أفضل وطمأنينة أكبر فيما يخص البيانات الحساسة.


تنظيف النصوص… قبل أن تراها

لا يكتفي التطبيق بنسخ الكلام حرفياً، بل يحاول فهم المقصود. عند إيقاف التسجيل، يقوم تلقائياً بحذف كلمات التردد مثل ام أو آه، ويعيد صياغة العبارات المتعثرة في نص أكثر مهنية. كما يتيح تحويل المحتوى إلى نقاط رئيسية أو صيغة رسمية أو نسخة مختصرة أو موسعة.

هذه الطبقة من المعالجة اللغوية تعكس تطور نماذج معالجة اللغة الطبيعية، إذ لم يعد الهدف مجرد تفريغ صوتي، بل إنتاج نص جاهز للاستخدام في البريد الإلكتروني أو التقارير أو الملاحظات السريعة.


المزاوجة بين المحلي والسحابي

المثير للاهتمام أن غوغل لم تتخلَّ تماماً عن السحابة. عند تفعيل الوضع السحابي، يستفيد التطبيق من قدرات Gemini لتنظيف أدق للنصوص. كذلك يمكنه استيراد أسماء ومصطلحات من Gmail لتحسين الدقة.

  • إمكانية إضافة كلمات مخصصة لتفادي أخطاء المصطلحات التقنية.
  • عرض إحصاءات مثل عدد الكلمات وسرعة الإملاء.
  • الاحتفاظ بسجل قابل للبحث لجلسات التفريغ السابقة.

هذا التوازن بين الذكاء المحلي والخدمات السحابية يعكس استراتيجية هجينة، تمنح المستخدم خيار المفاضلة بين الأداء الفوري والقدرات التوسعية.


سوق مكتظ لكن سريع النمو

تدخل غوغل في وقت يشهد فيه تطبيق الإملاء الصوتي ازدهاراً ملحوظاً، مع منافسين مثل Wispr Flow وSuperWhisper وغيرهما. تحسّن نماذج التعرف الصوتي جعل الكتابة بالصوت خياراً عملياً فعلاً، لا مجرد ميزة تجريبية.

لكن دخول لاعب بحجم غوغل يعني شيئاً آخر: إمكانية دمج هذه القدرات مستقبلاً على نطاق أوسع داخل أندرويد ولوحات المفاتيح الافتراضية، وربما على مستوى النظام بالكامل. App Store يلمّح بالفعل إلى نسخة أندرويد قد تسمح بجعل التطبيق لوحة مفاتيح افتراضية على مستوى النظام، ما يوسع حضوره اليومي.


إشارة إلى اتجاه أعمق

ذو صلة

إطلاق التطبيق بهدوء ومن دون ضجيج تسويقي يعكس سلوكاً متكرراً من غوغل في اختبار منتجات الذكاء الاصطناعي أولاً قبل توسيعها. لكنه يكشف أيضاً عن اتجاه متنامٍ: إعادة بعض قدرات الذكاء الاصطناعي إلى الجهاز نفسه، بدلاً من الاعتماد الكلي على مراكز البيانات.

في عالم تتزايد فيه حساسية البيانات الشخصية، قد لا يكون السؤال هو مدى ذكاء التطبيق، بل أين تتم معالجته. وبين الراحة الفورية وخصوصية المستخدم، يبدو أن غوغل تحاول هذه المرة الجمع بين الاثنين بصمت محسوب.

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة