موظفان سابقان في جوجل يطلقان منصة ذكاء اصطناعي للفيديو (2026)
في خطوة لافتة تهدف لاستغلال طوفان البيانات المرئية، نجح موظفان سابقان في جوجل، قضيا عقداً من الزمن في العمل معاً في جوجل اليابان، في جمع تمويل أولي بقيمة 5.8 مليون دولار لشركتهما الناشئة InfiniMind. تهدف الشركة إلى معالجة مشكلة "البيانات المظلمة"، وهي الأرشيفات الضخمة من الفيديو والصوت التي تحتفظ بها الشركات دون تحليل أو استفادة حقيقية.
من جوجل إلى ريادة الأعمال
لاحظ المؤسسان، أزا كاي (الرئيس التنفيذي) وهيراكو ياناغيتا (مدير العمليات)، نقطة تحول في التكنولوجيا أثناء عملهما في جوجل. وبحلول عام 2024، نضجت التقنية وأصبح طلب السوق واضحاً، مما دفعهما لتأسيس InfiniMind في طوكيو، مع خطط لنقل المقر الرئيسي إلى الولايات المتحدة.
أوضح كاي أن الحلول الحالية كانت تفرض مقايضة صعبة؛ حيث يمكن للتقنيات القديمة تسمية الكائنات في إطارات فردية، لكنها تعجز عن تتبع السرد أو فهم السببية أو الإجابة عن أسئلة معقدة حول محتوى الفيديو، مما يترك أرشيفات البث التلفزيوني وساعات التصوير الطويلة دون تحليل.
ثورة نماذج الرؤية واللغة
يكمن السر في التقدم الهائل الذي حققته نماذج الرؤية واللغة (Vision-Language Models) بين عامي 2021 و2023. أشار كاي إلى أن ذكاء الفيديو الاصطناعي بدأ يتجاوز مجرد وضع العلامات البسيطة، مدعوماً بانخفاض تكاليف وحدات معالجة الرسوميات (GPU) وتحسن الأداء السنوي بنسبة 15-20% خلال العقد الماضي.
منتجات InfiniMind وخطط 2026
أطلقت الشركة منتجها الأول "TV Pulse" في اليابان في أبريل 2025، وهي منصة تعمل بالذكاء الاصطناعي لتحليل المحتوى التلفزيوني في الوقت الفعلي، مما يساعد الشركات الإعلامية وتجار التجزئة على تتبع تعرض المنتجات ومشاعر العملاء. وقد نجحت المنصة بالفعل في جذب عملاء يدفعون بعد برامج تجريبية ناجحة.
وتستعد الشركة الآن للسوق الدولية عبر منتجها الرئيسي "DeepFrame"، وهي منصة ذكاء فيديو طويلة المدى قادرة على معالجة 200 ساعة من اللقطات لتحديد مشاهد أو متحدثين أو أحداث محددة. ومن المقرر إطلاق النسخة التجريبية في مارس، يليها الإطلاق الكامل في أبريل 2026.
التركيز على المؤسسات
في سوق مجزأ، تميز InfiniMind نفسها بالتركيز حصرياً على حالات الاستخدام المؤسسي مثل المراقبة والأمن والتحليل العميق، بخلاف شركات مثل TwelveLabs التي توفر واجهات برمجة تطبيقات عامة. وأكد كاي أن حلهم لا يتطلب كتابة أكواد برمجية (No-code)، ويدمج فهم الصوت والكلام، ويعالج مقاطع فيديو غير محدودة الطول بكفاءة عالية من حيث التكلفة.
واختتم كاي حديثه برؤية طموحة قائلاً: "هذا المجال مثير وهو أحد المسارات نحو الذكاء الاصطناعي العام (AGI). هدفنا النهائي هو دفع حدود التكنولوجيا لفهم الواقع بشكل أفضل ومساعدة البشر على اتخاذ قرارات أفضل".
الأسئلة الشائعة
هي شركة ناشئة أسسها موظفان سابقان في جوجل، متخصصة في تحويل أرشيفات الفيديو والصوت غير المستغلة (البيانات المظلمة) إلى بيانات تجارية منظمة وقابلة للبحث.
من المقرر إطلاق النسخة التجريبية من DeepFrame في مارس، على أن يتم الإطلاق الكامل للسوق الدولية في أبريل 2026.
حصلت الشركة على تمويل أولي بقيمة 5.8 مليون دولار بقيادة UTEC ومشاركة مستثمرين آخرين مثل CX2 وHeadline Asia.
التعليقات 0
سجل دخولك لإضافة تعليق
لا توجد تعليقات بعد. كن أول من يعلق!