بحث
الاستدلال غير المتزامن: تحسين أداء الروبوتات
أخرى #الاستدلال_غير_المتزامن #روبوتات

الاستدلال غير المتزامن: تحسين أداء الروبوتات

تاريخ النشر: آخر تحديث: 11 مشاهدة 0 تعليق 3 دقائق قراءة
11 مشاهدة
0 إعجاب
0 تعليق
موثوق 95%

تتزايد تعقيدات سياسات الروبوتات، حيث تتنبأ بمجموعات من الإجراءات المستقبلية بدلاً من إجراء واحد فقط. وهذا يؤدي إلى بقاء الروبوت غير نشط أثناء انتظار إجراءات جديدة، مما يتسبب في تأخيرات ملحوظة أثناء التنفيذ ويفتقر إلى الاستجابة. يعمل الاستدلال غير المتزامن على تحسين حلقة التحكم، مما يزيل التأخيرات أثناء التشغيل ويحقق تحكمًا أكثر تكيفًا من خلال فصل توقع الإجراءات عن تنفيذها. في هذه المقالة، سنتناول الأساسيات وراء الاستدلال غير المتزامن وكيف يمكن استخدامه لتحسين أداء سياسات الروبوتات في العالم الحقيقي.

البدء

ابدأ باستخدام الاستدلال غير المتزامن من خلال اتباع البرنامج التعليمي الخاص بنا.

الاستدلال التسلسلي (الأول) مقابل الاستدلال غير المتزامن (الثاني). يسمح بإعادة التخطيط وحلقة تحكم أكثر إحكامًا، مما يؤدي إلى (1) محاولات الاسترداد، و(2) تسريع بمعدل ~2x في إكمال المهام. يستمر الاستدلال التسلسلي في تنفيذ مجموعة الإجراءات الحالية حتى بعد الفشل في الإمساك بالشيء، بينما يمكن للاستدلال غير المتزامن إعادة التخطيط وتنفيذ مجموعة الإجراءات الجديدة. كلا الإعدادين يستخدم نفس السياسة!

الاستدلال غير المتزامن: نظرة عميقة

مع الاستدلال غير المتزامن، نفصل تنفيذ الإجراءات عن توقعها. هذا الأمر مهم بشكل خاص بالنظر إلى ميل النماذج الشائعة حاليًا مثل [ACT] و[OpenVLA] و[PI0] و[SmolVLA] إلى إخراج مجموعات من الإجراءات بدلاً من إجراءات فردية. اقنع نفسك بذلك من خلال تشغيل جميع هذه النماذج باستخدام LeRobot.

يؤدي استخدام المجموعات بشكل تسلسلي إلى (1) تأخيرات أثناء التشغيل، تؤثر على وقت تنفيذ المهام و(2) نقص في الاستجابة، بسبب التصرف بشكل مفتوح. يقلل الاستدلال غير المتزامن من كلا هذين القيدين من خلال فصل توقع الإجراءات عن تنفيذها. قدمنا الاستدلال غير المتزامن في SmolVLA، ووجدنا أنه يؤدي إلى تسريع بمعدل ~2x في وقت إكمال المهام مع معدل نجاح مماثل.

نقوم بتصميم نظام مكون من عنصرين حيث يتم تنفيذ استدلال السياسة وتنفيذ الإجراءات في عمليتين مختلفتين، ربما على جهازين مختلفين متصلين عبر الشبكة:

  • A PolicyServer، مستضاف على أجهزة تسريع وقادر على إجراء الاستدلال باستخدام موارد حسابية أكثر من تلك المخصصة على روبوت حقيقي.
  • A RobotClient يقوم بإضافة الإجراءات المستلمة إلى قائمة الانتظار وينفذها بينما يتم حساب المجموعة التالية.

تعتمد الاتصالات بين PolicyServer وRobotClient على gRPC، والذي يضمن أداءً أسرع بمعدل ~5× مقارنةً بواجهة برمجة التطبيقات REST المماثلة. نتيجة كل هذا هي روبوت لا ينتظر أبداً الاستدلال.

Async inference scheme
Async inference scheme

الاستدلال غير المتزامن، يبرز: (1) العميل الذي يرسل الملاحظة الأولى للاستدلال، ويتلقى المجموعة الأولى بعد فترة قصيرة؛ (2) العميل الذي يرسل ملاحظة أخرى للمعالجة بينما لم ينفذ بعد المجموعة الحالية؛ (3) العميل الذي يتلقى مجموعة إجراءات محدثة، والتي يجمعها مع ما تبقى من المجموعة التي كان ينفذها سابقًا.

الاستنتاجات

يظهر الاستدلال غير المتزامن كحل فعال لتحسين أداء الروبوتات من خلال تقليل التأخيرات وزيادة الاستجابة، مما يجعله خيارًا مثاليًا في التطبيقات العملية.

التعليقات 0

سجل دخولك لإضافة تعليق

لا توجد تعليقات بعد. كن أول من يعلق!