بحث
إنفيديا Blackwell تخفض تكلفة الذكاء الاصطناعي 10 أضعاف
الذكاء الاصطناعي #إنفيديا #الذكاء_الاصطناعي

إنفيديا Blackwell تخفض تكلفة الذكاء الاصطناعي 10 أضعاف

منذ 9 ساعات 7 مشاهدة 0 تعليق 3 دقائق قراءة
7 مشاهدة
0 إعجاب
0 تعليق
موثوق 95%

كشفت إنفيديا رسمياً أن منصة Blackwell الجديدة نجحت في خفض تكاليف معالجة الذكاء الاصطناعي (Inference) بنسبة تتراوح بين 4 إلى 10 أضعاف لدى كبار المزودين، في خطوة قد تغير اقتصاديات القطاع بالكامل.

وأظهر تحليل جديد أن هذا الانخفاض الهائل في التكلفة لم يتحقق بفضل العتاد الجديد فحسب، بل نتيجة دمج شرائح Blackwell مع البرمجيات المحسنة والتحول إلى النماذج مفتوحة المصدر.

المعادلة الاقتصادية: الأداء يقلل التكلفة

قد يبدو الأمر غير بديهي، لكن خفض تكاليف المعالجة يتطلب الاستثمار في بنية تحتية أعلى أداءً. السبب بسيط: تحسين الإنتاجية (Throughput) يترجم مباشرة إلى تكلفة أقل لكل رمز (Token).

وفي هذا السياق، صرح ديون هاريس، مدير حلول الذكاء الاصطناعي في إنفيديا، قائلاً: "الأداء هو ما يخفض تكلفة الاستنتاج. ما نراه هو أن الإنتاجية تترجم حرفياً إلى قيمة مالية حقيقية وتخفيض في التكاليف".

أرقام من أرض الواقع: تخفيضات تصل لـ 90%

استعرضت إنفيديا بيانات من شركات مثل Baseten وDeepInfra وFireworks AI وTogether AI، أظهرت تحسينات ملموسة:

  • قطاع الرعاية الصحية: نجحت شركة Sully.ai في خفض تكاليف الذكاء الاصطناعي بنسبة 90% (10 أضعاف) مع تحسين سرعة الاستجابة بنسبة 65%، وذلك عبر الانتقال من النماذج المغلقة إلى نماذج مفتوحة المصدر تعمل على منصة Blackwell.
  • قطاع الألعاب: خفضت منصة Latitude تكاليفها 4 أضعاف. انخفضت التكلفة لكل مليون رمز من 20 سنتاً على منصة Hopper السابقة إلى 5 سنتات فقط على Blackwell، بعد اعتماد تنسيق NVFP4 منخفض الدقة.
  • خدمة العملاء: سجلت شركة Decagon انخفاضاً بمقدار 6 أضعاف في التكلفة لكل استعلام للدعم الصوتي، مع الحفاظ على زمن استجابة أقل من 400 مللي ثانية.

العوامل التقنية وراء القفزة الهائلة

أوضحت إنفيديا أن الوصول إلى تخفيض 10 أضعاف يعتمد على ثلاثة عوامل رئيسية مجتمعة:

  1. تنسيق الدقة NVFP4: وهو العامل الأكثر تأثيراً. ففي حالة Latitude، وفر العتاد وحده تحسناً بمقدار الضعف، لكن اعتماد تنسيق NVFP4 (الذي يقلل عدد البتات المطلوبة) ضاعف هذا التحسن ليصل إلى 4 أضعاف.
  2. هندسة النماذج (MoE): تستفيد نماذج "خليط الخبراء" (Mixture-of-Experts) بشكل كبير من تقنية NVLink في Blackwell، التي تتيح تواصلاً سريعاً بين أجزاء النموذج المتخصصة.
  3. تكامل البرمجيات: الدمج بين العتاد ومكدس البرمجيات مثل TensorRT-LLM وDynamo يلعب دوراً حاسماً في تحقيق أقصى وفورات.

نصيحة للشركات: الاختبار قبل الانتقال

رغم هذه الأرقام المغرية، تؤكد شروتي كوباركار، من قسم تسويق منتجات الذكاء الاصطناعي في إنفيديا، على ضرورة دراسة كل حالة على حدة. وتقول: "تحتاج الشركات إلى العمل انطلاقاً من أعباء العمل الخاصة بها وقيود التكلفة".

الشركات التي تدير تطبيقات ذات حجم ضخم وحساسية عالية لزمن الانتقال (Latency) هي المستفيد الأكبر. أما التطبيقات ذات الحجم الأقل، فقد يكفيها تحسين البرمجيات أو تغيير النماذج على البنية التحتية الحالية دون الحاجة لتحديث شامل للأجهزة.

ختاماً، المعادلة لا تقتصر على سعر الشريحة، بل تشمل التكلفة التشغيلية الكاملة واختيار المزود المناسب الذي يقدم المزيج الأمثل من العتاد والبرمجيات لنوع عملك المحدد.

الأسئلة الشائعة

تتراوح نسبة خفض التكاليف بين 4 إلى 10 أضعاف، اعتماداً على دمج العتاد مع البرمجيات المحسنة والنماذج المفتوحة.

تساعد تقنية NVFP4 منخفضة الدقة في مضاعفة كفاءة المعالجة وتقليل حجم البيانات المطلوبة، مما يقلل التكلفة بشكل كبير دون التأثير على الدقة.

ليس بالضرورة. تنصح إنفيديا الشركات باختبار أعباء العمل أولاً، حيث قد تستفيد التطبيقات الصغيرة من تحسين البرمجيات على الأجهزة الحالية.

التعليقات 0

سجل دخولك لإضافة تعليق

لا توجد تعليقات بعد. كن أول من يعلق!