الاستدلال غير المتزامن: تحسين أداء الروبوتات

تتزايد تعقيدات سياسات الروبوتات، حيث تتنبأ بمجموعات من الإجراءات المستقبلية بدلاً من إجراء واحد فقط. وهذا يؤدي إلى بقاء الروبوت غير نشط أثناء انتظار إجراءات جديدة، مما يتسبب في تأخيرات ملحوظة أثناء التنفيذ ويفتقر إلى الاستجابة. يعمل الاستدلال غير المتزامن على تحسين حلقة التحكم، مما يزيل التأخيرات أثناء التشغيل ويحقق تحكمًا أكثر تكيفًا من خلال فصل توقع الإجراءات عن تنفيذها. في هذه المقالة، سنتناول الأساسيات وراء الاستدلال غير المتزامن وكيف يمكن استخدامه لتحسين أداء سياسات الروبوتات في العالم الحقيقي.

البدء

ابدأ باستخدام الاستدلال غير المتزامن من خلال اتباع البرنامج التعليمي الخاص بنا.

الاستدلال التسلسلي (الأول) مقابل الاستدلال غير المتزامن (الثاني). يسمح بإعادة التخطيط وحلقة تحكم أكثر إحكامًا، مما يؤدي إلى (1) محاولات الاسترداد، و(2) تسريع بمعدل ~2x في إكمال المهام. يستمر الاستدلال التسلسلي في تنفيذ مجموعة الإجراءات الحالية حتى بعد الفشل في الإمساك بالشيء، بينما يمكن للاستدلال غير المتزامن إعادة التخطيط وتنفيذ مجموعة الإجراءات الجديدة. كلا الإعدادين يستخدم نفس السياسة!

الاستدلال غير المتزامن: نظرة عميقة

مع الاستدلال غير المتزامن، نفصل تنفيذ الإجراءات عن توقعها. هذا الأمر مهم بشكل خاص بالنظر إلى ميل النماذج الشائعة حاليًا مثل [ACT] و[OpenVLA] و[PI0] و[SmolVLA] إلى إخراج مجموعات من الإجراءات بدلاً من إجراءات فردية. اقنع نفسك بذلك من خلال تشغيل جميع هذه النماذج باستخدام LeRobot.

يؤدي استخدام المجموعات بشكل تسلسلي إلى (1) تأخيرات أثناء التشغيل، تؤثر على وقت تنفيذ المهام و(2) نقص في الاستجابة، بسبب التصرف بشكل مفتوح. يقلل الاستدلال غير المتزامن من كلا هذين القيدين من خلال فصل توقع الإجراءات عن تنفيذها. قدمنا الاستدلال غير المتزامن في SmolVLA، ووجدنا أنه يؤدي إلى تسريع بمعدل ~2x في وقت إكمال المهام مع معدل نجاح مماثل.

نقوم بتصميم نظام مكون من عنصرين حيث يتم تنفيذ استدلال السياسة وتنفيذ الإجراءات في عمليتين مختلفتين، ربما على جهازين مختلفين متصلين عبر الشبكة:

A PolicyServer، مستضاف على أجهزة تسريع وقادر على إجراء الاستدلال باستخدام موارد حسابية أكثر من تلك المخصصة على روبوت حقيقي.


A RobotClient يقوم بإضافة الإجراءات المستلمة إلى قائمة الانتظار وينفذها بينما يتم حساب المجموعة التالية.


تعتمد الاتصالات بين PolicyServer وRobotClient على gRPC، والذي يضمن أداءً أسرع بمعدل ~5× مقارنةً بواجهة برمجة التطبيقات REST المماثلة. نتيجة كل هذا هي روبوت لا ينتظر أبداً الاستدلال.


Async inference scheme
الاستدلال غير المتزامن، يبرز: (1) العميل الذي يرسل الملاحظة الأولى للاستدلال، ويتلقى المجموعة الأولى بعد فترة قصيرة؛ (2) العميل الذي يرسل ملاحظة أخرى للمعالجة بينما لم ينفذ بعد المجموعة الحالية؛ (3) العميل الذي يتلقى مجموعة إجراءات محدثة، والتي يجمعها مع ما تبقى من المجموعة التي كان ينفذها سابقًا.

    
        
            
        
        مقالات ذات صلة
    
    
        
        

        
        
                            
                                        
                        
                        
                    
                    
                                                    أخرى
                                                5 أدوات أساسية لكل مالك منزل جديد (لا غنى عنها)
                        
                            
                                
                                منذ 3 ساعات
                            
                            
                                
                                0
                            
                        
                    
                
                            
                                        
                        
                        
                    
                    
                                                    أخرى
                                                شاشات التلفزيون: حلول سطوع OLED وترقية جهازك القديم
                        
                            
                                
                                منذ 3 ساعات
                            
                            
                                
                                0
                            
                        
                    
                
                            
                                        
                        
                        
                    
                    
                                                    أخرى
                                                إنفينيتي Q50 2016: 400 حصان بسعر أقل من كورولا 2026
                        
                            
                                
                                منذ 4 ساعات
                            
                            
                                
                                0
                            
                        
                    
                
                            
                                        
                        
                        
                    
                    
                                                    أخرى
                                                احمِ منزلك الذكي: خدعة Home Assistant الأساسية للاختبار الآمن
                        
                            
                                
                                منذ 6 ساعات
                            
                            
                                
                                0
                            
                        
                    
                
                            
                                        
                        
                        
                    
                    
                                                    أخرى
                                                تلسكوب ويب يكشف أسرار أورانوس: أضواء قطبية غريبة وتبريد مستمر
                        
                            
                                
                                منذ 6 ساعات
                            
                            
                                
                                0
                            
                        
                    
                
                            
                                        
                        
                        
                    
                    
                                                    أخرى
                                                نظارات أبل الذكية: كاميرتان نادرتان وتصميم فاخر
                        
                            
                                
                                منذ 10 ساعات
                            
                            
                                
                                0
                            
                        
                    
                
                    

        
        
    


الاستنتاجات
يظهر الاستدلال غير المتزامن كحل فعال لتحسين أداء الروبوتات من خلال تقليل التأخيرات وزيادة الاستجابة، مما يجعله خيارًا مثاليًا في التطبيقات العملية.