تريند 🔥

🌙 رمضان 2024

تعرف على أداة Whisper من شركة Open AI .. الأفضل في التعرف على الكلام المنطوق حتى الآن

محمد نصار
محمد نصار

2 د

أداة Whisper من OpenAI هي أداة ثورية في التعرف على الكلام بواسطة الذكاء الاصطناعي تعرف بدقتها الفائقة في التفريغ.

أنشأت Whisper على 680 ألف ساعة من البيانات المُشرف عليها، ويمكنها التفريغ وحتى ترجمة اللغات في الصوت بأخطاء ضئيلة.

على الرغم من كونها صُممت في المقام الأول للمطورين والباحثين، فإن طبيعتها المفتوحة المصدر تسمح بتطبيقات أوسع، مما يعد بتقدم كبير في التفريغ المدعوم بالذكاء الاصطناعي.

طبقًا لموقع xda-developers، فإن أحدث ابتكارات شركة Open AI الذي يُسمى  Whisper قد نال إعجاب الجميع، إذ رأوه أنه أدق أداة للتعرف على الكلام بواسطة الذكاء الاصطناعي حتى الآن، فإن هذه الأداة لا تتعرف على الصوت بدقة فقط، بل لديها قدرات رائعة مثل ترجمة اللغات من الصوت المُفرغ.

أدخلت أداة Whisper ثورة في عالم تفريغ الصوت في الطريقة التي يتعامل معها الأشخاص بمختلف مهنهم مع تحويل الصوت إلى نص، فالطرق التقليدية مثل التفريغ اليدوي أو استخدام منصات مثل يوتيوب لإنشاء الترجمات ثم التعديل على الترجمة التي ينتجها، لكن الآن ومع دخول الذكاء الاصطناعي في جميع المجالات تقريبًا فإن أداة مثل Whisper قد تساعد في عملية التفريغ بشدة.


كدليل على قوة أداء Whisper، فإن الأداة استطاعت تفريغ فيديو مدته 10 دقائق في خمس دقائق نص تقريبًا، كما أظهرت دقتها عند تفريغ مقابلة مدتها 25 دقيقة دون خطأ، طُورت هذه الأداة من قبل شركة Open AI، وهي نظام تلقائي للتعرف على الكلام يُظهر دقة لا مثيل لها في فهم الكلمات المنطوقة، وتدربت على 680 ألف ساعة من البيانات المستخرجة من الإنترنت، وثلث هذه البيانات بلغات غير الإنجليزية، وتدعي شركة Open AI أن هذه الأداة لها نسبة خطأ أقل من 50% وهذا أقل من أخطاء النماذج الأخرى، وهذا ما أكده المستخدمون.

ذو صلة

ما يُثير الاهتمام حول Whisper أنها أداة تستهدف المطورين والباحثين، إذ قالت الشركة أن السبب وراء فتح المصادر للنماذج والشفرة المصدرية هو تكوين أساس لبناء التطبيقات المفيدة ولمزيد من البحث في معالجة الكلام، وعلى الرغم من أن هذه الأداة ليست للاستخدام العام بعد، إلا أنها تُظهر إمكانيات رائعة حتى الآن.

لا شك أن هذه الأداة سوف تضع معايير جديدة للتعرف على الكلام بواسطة الذكاء الاصطناعي، ودقتها لا مثيل لها وتنوعها يجعلها أكثر أداة قيمة لتفريغ الصوت حتى الآن، ومع استمرار تطوير الذكاء الاصطناعي، فإن أداة مثل Whisper تمثل نموذجًا للتطور في هذا المجال.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة