بحث
Voxtral: نموذج مفتوح المصدر يتجاوز التسجيل إلى تلخيص الصوت
الذكاء الاصطناعي #Voxtral #التعرف_على_الصوت

Voxtral: نموذج مفتوح المصدر يتجاوز التسجيل إلى تلخيص الصوت

تاريخ النشر: آخر تحديث: 20 مشاهدة 0 تعليق 1 دقائق قراءة
20 مشاهدة
0 إعجاب
0 تعليق
موثوق 95%

أطلقت شركة Mistral نموذج الصوت مفتوح المصدر Voxtral، الذي يعد بديلاً قوياً لنماذج الذكاء الاصطناعي الصوتية المدفوعة مثل ElevenLabs وHume AI. يهدف Voxtral إلى سد الفجوة بين نماذج التعرف على الصوت المملوكة والنماذج المفتوحة التي تعاني من الأخطاء.

Credit: VentureBeat made with Midjourney
Credit: VentureBeat made with Midjourney

مميزات Voxtral

يتوفر Voxtral بإصدارين: 24B و3B، حيث يُستخدم الإصدار الأكبر في التطبيقات على نطاق واسع، بينما يُناسب الإصدار الأصغر الاستخدامات المحلية. كما يوفر Voxtral دقة عالية وفهمًا دلاليًا أصليًا، مما يجعله خيارًا مثاليًا للمؤسسات.

يستطيع Voxtral الاستماع وتفريغ ما يصل إلى 30 دقيقة من الصوت أو 40 دقيقة من الفهم الصوتي، بالإضافة إلى تقديم تلخيصات وإجابة على الأسئلة بناءً على المحتوى الصوتي.

أداء النموذج

أثبت Voxtral تفوقه على نماذج الصوت الموجودة، بما في ذلك Whisper من OpenAI، حيث أظهر عددًا أقل من الأخطاء في الكلمات. كما أن Voxtral متاح عبر واجهة برمجة التطبيقات الخاصة بـ Mistral بسعر 0.001 دولار لكل دقيقة.

التعليقات 0

سجل دخولك لإضافة تعليق

لا توجد تعليقات بعد. كن أول من يعلق!