ÀÏ×ÓÓÐÇ®lzyq88¹ÙÍø

À´Ô´£º³ÝÂÖ±ÃÓÍ·â £¬×÷Õߣº СÓÎÏ· £¬£º

ÚÀ £¬ÎÒ¸úÙ¯½²Å¶ £¬ë¡Á½Ìì°¢À­ÀÏÍ·×Ó´îÅóÓѸÂÚ¨ºú £¬½²µ½ë¡¸ö¡°QqȺÃÀÅ®¿ì²Í¡± £¬Ù¯ÏþµÃ·¥ £¬ë¡¸ö¹¤¾ßÕæÊÇ¡°ÌýÍ·Ï족 £¬µ«½²À´½²È¥ £¬Ù¯Ïþ»ñµÃµ×ÊÇɶÎïÊ·¥À²£¿À϶àÈËÒÔΪÊÇɶ¸ß¼¶¸ö¿ì²ÍЧÀÍ £¬ÆäʵßíÊÇÄÇ»ØÊ¡£Ù¯½²ÊÇ·¥£¿

QqȺÃÀÅ®¿ì²ÍÊÇɶ£¿ßíÒª¹âÌýÃû×ÖÏì

Ïà¹ØÍ¼Æ¬

롸öÂï¡­¡­Ù¯ÒªÄÃÉϺ£»°½²ÊÇ¡°ÃÅÍâÏìîõîõ¡± £¬µ«ÀïÏáÆäʵàÇÎð¶à¡£ë¡¸öÊÇɶàÏ£¿¼òµ¥½²Å¶ £¬ë¡¸ö¾ÍÊÇÍøÂçÀïÏáÄÇЩ¸öÔ˶¯Èº £¬ÓÐЩÊÇרßã¿ìµÝ¡¢ÃÀʳÍâÂôЧÀÍ £¬ËäÈ»À² £¬ÓÐЩÃû×Ö¡°Ó¬Í·Ð¡Àû¡± £¬ÈÝÒ×ÈÃÈËÎó»áÓÐÉ¶ÌØ±ðЧÀÍ¡ª¡ªÙ¯¶®¸ö·¥À²£¿

²»¹ýÕæÕý¸öÃŵÀŶ £¬ë¡¸öȺÆäʵ¾ÍÊÇΪÁ˱㵱ËÄÖܵÄÈË £¬ÌṩһЩ¿ìËÙ¸öЧÀÍ¡£¾ÍÏñ°¢À­ÀÏÔç³½¹â £¬ÅªÌÃÀïÏáÍ·ÓÐɶ°¢ÆÅÉÕ·¹ £¬»òÕßС³öÊÛÉú¼å £¬ÎÒ½²Å¶ £¬ë¡¸ö¸ÐÊܲîÎð¶àÀ²¡£²»¹ýÃû×ÖÈ¡µÃÏì £¬ÎüÒýÑÛÇò°ÕÁË¡£

ÀïÃæ¸öÃŵÀ £¬ÎÒ¸úÙ¯½²Å¶

Ïà¹ØÍ¼Æ¬

Ù¯ÒªÊÇÏëÓÃë¡ÖÖЧÀÍ £¬¿Ï¶¨ÒªÏþµÃ¼¸¸öÃŵÀ¡£µÚһŶ £¬Òª¸ãÇå³þÙ¯ËùÔÚ¸öȺÊDz»ÊÇ¿¿Æ×¡£Ù¯ÏþµÃ·¥ £¬ÀÏÍ·×Ó½²¡°ÎðÒª¹â¿´ÈÈÄÖ¡± £¬Ù¯ÒªÊÇËæ±ãÂÒÞè½øÈ¥ £¬¿ÉÄܾͻáÅöµ½Ð©ÐéÍ·°ÍÄÔ¸ö¹¤¾ß¡£µÚ¶þŶ £¬ë¡ÖÖȺÀïÏáÓÐЩÈË»áÂôЩ¡°ºÚÐÄ»õ¡± £¬Ù¯Òª¿´Çå³þÔÙϵ¥¡£ë¡¸öÂï £¬½²µÃÀ´¾ÍÏñ°¢À­ÀÏÔçÈ¥²Ë³¡Âò¹¤¾ßÒ»Ñù £¬¡°¿´ÈËÌôµ£²»ÐÁ¿à¡± £¬µ«Ìô´íÁ˾Ϳ÷Ëð¡£

͵͵¸æËßٯŶ£º¡°QqȺÃÀÅ®¿ì²Í¡±ÀïÏá¸öЧÀÍ £¬ÓÈÆäÊÇɶÍâÂô¿ìµÝ £¬Ù¯×îºÃÑ¡ÄÇЩ´øÆÀ¼Û¸ö £¬»òÕßȺÀï¿Ú±®ºÃµÄÉ̼Ò¡£°¢À­ÀÏÔç³½¹â½²¡°Âò¹¤¾ßÒª¿´¡®ÀÏ×ֺ𝡱 £¬ë¡¸öÒâ˼²îÎð¶àÀ²¡£

Ù¯ÏþµÃ·¥ £¬ÓÐЩȺ»¹ÕæÓеãÒâ˼

ë¡ÌìÒ¹¿ìµãÎÒ³ÔºÃÒ¹·¹ £¬¾ÍÏë³öÈ¥µ´µ´Âí· £¬ß¼Ã»Ïëµ½×ßµ½ÅªÌÃµ× £¬Ìýµ½¼¸¸öÒÌÂè¸ÂÚ¨ºú £¬½²µ½ë¡¸öȺÀïÏáÓÐÒ»¼ÒÈ˼ÒÂô¼Ò³£²Ë¸ö¡£ÒÁ¸ö²ËŶ £¬ÕæÊÇÏñ°¢À­Ð¡Ê±ºò³Ô¸öζµÀ¡£½á¹û £¬ÎÒһ̽ѯ £¬¾ÓÈ»¾Íס°¢Àï´îËÄÖÜ£¡ë¡ÖÖȺ°¡ £¬Ù¯ÒªÊÇÅöµ½¿¿Æ×¸ö £¬ÕæÊÇÓÐЩ¾ªÏ²¡£

롸ö¹¤¾ßºÍÀÏÉϺ£ÓÐɶ¹ØÏµ£¿

ÎÒ¸úÙ¯½²Å¶ £¬ë¡¸ö¹¤¾ßËäÈ»ÌýÆðÀ´ÊÇÍøÂçÀïÏá¸öÐÂÏÊÍæÒâ £¬µ«ÕÕÎÒ¿´À´Å¶ £¬ë¡¸öÆäʵ¾ÍÊÇÏÖ´ú°æ¸ö¡°ÅªÌÃÎÄ»¯¡±¡£ÀÏÔç³½¹âŶ £¬°¢À­ÉϺ£¸öŪÌÃÀïÏáÍ· £¬É¶Îïʶ¼Äܸ㶨¡£Ù¯ÒªÂòɶ·¥ £¬°¢Àï´îÓа¢ÆÅÂô£»Ù¯ÒªÐÞɶ¹¤¾ß·¥ £¬ÅªÌÿھÍÓÐʦ¸µ¡£ë¡¸ö¡°QqȺÃÀÅ®¿ì²Í¡± £¬Ù¯ÒªÊÇÓõúà £¬¾ÍÏñ»Øµ½ÀÏÉϺ£¸öŪÌÃÀïÏáÒ»Ñù £¬É¶¶¼±ãµ±¡£


Ù¯¿ÉÄÜ»áÎÊ£ºÊDz»ÊÇÿ¸öȺ¶¼ÖµµÃÐÅÀµ£¿

ÕÕÎÒ¿´À´Å¶ £¬ë¡ÖÖȺÀïÏáÓкÃÓлµ £¬Ù¯ÒªÊÇÅöµ½ÄÇЩ¸öÃû×ÖÈ¡µÃÏ쵫ɶÎïʶ¼Ã»ÓиöȺ £¬×îºÃÎðÒªÀË·Ñʱ¼ä¡£¿¿Æ×¸öȺŶ £¬Ù¯½øÈ¥ºó £¬ÈºÀïÏáÍ·¸öЧÀÍÕæÊÇÏñ¼ÒÃſڸöŪÌÃ̯ͷһÑù £¬±ãµ±ÓÖʵÔÚ¡£

±êÇ©£º

  • QqȺÃÀÅ®¿ì²Í
  • ÉϺ£ÅªÌÃЧÀÍ
  • ÍøÂçÍâÂô
  • ÀÏÉϺ£ÎÄ»¯
  • ÍøÂçȺ×é

¡¶ÆÜϼÌÒ´åºó½ÖÍíÉÏÓÐÁµ°®Âð¡·

? Li H, Zuo Y, Yu J, ..., Zhou B, Ding N. SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning [J]. arXiv preprint arXiv:2509.09674, 2025.

¡¶Î«·»Ð¡ºúͬˣµÄÅ®ÈËÔÚÄÄ¡·

ËûÌåÏÖ £¬Ïã¸ÛºÍÄڵصıùÑ©Ô˶¯½»Á÷Ò»Ö±ºÜÊÇÃÜÇÐ £¬»á¾­³£¾Ù°ìѵÁ·ÓªµÈÔ˶¯ £¬Ïã¸ÛÑ¡ÊֻᰴÆÚµ½¶«±±¼ÓÈ뼯ѵ¡£ËûЦ³Æ£º¡°ÄãÃÇÒªÊÇÂÃÐÐÒ»ÏÂÏã¸ÛÍâµØµÄѵÁ·Óª»á·¢Ã÷ £¬ÌرðСµÄСÅóÓÑÏÖÔÚ¶¼¿ªÊ¼Ñ§¶«±±»°ÁË¡£¡±

¡¶ä¯ºÓÒ»Ìõ½Ö150ÔªËæ½ÐËæµ½ÊÇʲô¡·

Êг¡µ£ÐÄ £¬Èô½øÒ»²½´óÁ¦ÊÕ½ôÁ÷¶¯ÐÔ £¬¿ÉÄÜ»áÍÆ¸ßºã¾Ã¹úÕ®ÊÕÒæÂÊÓëµäÖÊ´û¿îÀûÂÊ £¬ÕâÓë°×¹¬ÔÚס·¿¿Éµ£¸ºÐÔ·½ÃæµÄµ£ÐÄÏà³åÍ»¡£

ÍøÕ¾µØÍ¼