ÚÀ£¬Ù¯ÏþµÃ·¥£¬×î½üÎÒÅöµ½Ò»¸öÀÏÅóÓÑ£¬ÒÁ¸úÎÒ½²Æð롸ö¡¸ÃÀÅ®ÌØÊâЧÀÍÁªÏµ·½·¨¡¹£¬ÎÒ¾ÍÏëÆðÀÏÔç³½¹âÀÕÄϾ©Â·ÉϸÂÚ¨ºú¸öÈÕ×Ó¡£ÏÖÔÚ¸öСÄêÇᣬÀÏÊÇÏëÒªÖªµÀë¡Ð©¹¤¾ß£¬·¥ÏþµÃÀïÍ·Óм¸¶àÃŵÀŶ¡£
ÀÏÉϺ£¸ö¼ûÎÅ£ºÁªÏµ·½·¨Ò²ÓÐÃŵÀ
½²µ½ë¡¸ö¡¸ÃÀÅ®ÌØÊâЧÀÍÁªÏµ·½·¨¡¹Å¶£¬¿ÉÄÜÓÐЩÈËÒÔÎªËæ±ãÕÒÕÒ¾ÍÓÐÁË¡£Æäʵ£¬ÄÄÄÜÏñÖóÒ»ÍëÑ©²ËÈâË¿Ãæ£¬µÃÒ»²ã²ãµØ°þ¿ªÀ´²ÅÏþµÃÀïÍ·¸ö×Ìζ¡£ë¡¸öÁªÏµ·½·¨ÂʵÔÚÒ²ßíÊÇÄÇô¼òµ¥£¬ÀïÍ·ÓкÃЩ¸ö¹ÊÊÂŶ¡£
ÁªÏµ·½·¨µÄ¡°Ì×·¡±
ÎÒ¸úÙ¯½²Å¶£¬ë¡¸öÁªÏµ·½·¨°¡£¬¸ú롸öÕÔÏÈÉúȥŪÌÃÀïÍ·ÕÒÀÏÉϺ£Éú¼å²î²»Àë¡£Ò»¸öÊǵÃÏþµÃÄÄÄÜÕÒ£¬Ò»¸öÊÇÕÒµ½ÁË»¹µÃ¿´Çå³þÀïÍ·¸ö·×Ó¡£ºÃ¶à³½¹â£¬Ù¯ÒÔΪÕÒµ½µÄÁªÏµ·½·¨ÊǶԵ쬽á¹ûÒ»¸öȦ×ÓÈÆÏÂÀ´£¬·¢Ã÷ÊǸö¡°»ÆÅ£¡±£¡
͵͵¸æËßÄãŶ£¬ë¡ÖÖÁªÏµ·½·¨£¬×îºÃÊÇ×Ô¼ºÓÐÊìÈ˽éÉÜ£¬»òÕßÈ¥ÄÇЩÀÏ×ֺŵĵط½ÎÊÎÊ£¬±È½Ï¿¿Æ×¡£¾ÍÏñ¡°ÏʵÃÀ´¡±¸öÉú¼åÄê¸â£¬¹â¿´Ãû×ÖÊÇßíÐе쬻¹µÃ¿´Î¶µÀÊDz»ÊÇÕæµÄÀÏ¡£¡°
´Ó¡°ÁªÏµ·½·¨¡±µ½¡°ÌåÑ顱µÄת±ä
ÕÕÎÒ¿´À´Å¶£¬ë¡Ð©ÁªÏµ·½·¨°¡£¬Âú×ãºÃÆæÐÄÊÇÒ»¸ö·½Ã棬µ«×îÖØÒª¸öÊÇÔõô¡°Óúá±Ëü¡£¾ÍÏñٯȥ³ÇÚòÃíÂòС³Ô£¬Âòµ½µÄÊÇÒ»ÖÖÌåÑ飬ÁªÏµ·½·¨Ò²²î²»Àë¡£ÕÒµ½ÕæÕýºÏÊʸö£¬²ÅÊÇ¡°µÖµÃÉÏÒ»ÍëÏʵÃÀ´¸öÅŹÇÄê¸â¡±¡£
ºóÊÖÎÊÌâÓëÀÏ¿ËÀÕÃÕµ×
¿ÉÄÜÙ¯ÏÖÔÚÒªÎÊÁË£º¡°ÄǾ¿¾¹ë¡¸öÁªÏµ·½·¨ÔõôÓÃ×îºÃ°¡£¿¡±
ÎÒ¸úÙ¯½²Å¶£¬ÁªÏµ·½·¨ºÃÓã¬Òªº¦ÔÚÓÚÕÒµ½¶ÔµÄÄǸöÈË»òÕߵط½£¬ÈÃÒÁ¸øÙ¯¸öÕý×Ú¸öÌåÑ飬ßíÊÇËæ±ãÒ»¸öµØ·½¶¼ÄÜÓиöŶ¡£
±êÇ©£ºÃÀÅ®ÌØÊâЧÀÍÁªÏµ·½·¨£¬ÀÏÉϺ££¬ÃŵÀ£¬ÁªÏµ·½·¨Ì×·£¬ÌåÑé
¡¶¸·ÑôÕ¾Óпì²ÍЧÀÍÂð¡·
³Âﲨ³Æ£¬2024ÄêÏã¸Û¾¼Ã¼µÃ2.5%µÄκÍÔö³¤¡£½ñÄêÏã¸Û¾¼ÃÍⲿÇé¿öÈÔ¾ßÌôÕ½£¬µ«Ò²Óлý¼«ÒòËØ¡£¿¼Âǵ½Äڵؾ¼Ã¼ÌÐøÎȶ¨Ôö³¤¡¢¹ú¼ÒÄÚÍâÑ»·Ï໥Ôö½ø¡¢½øÒ»²½À©´ó¸ßˮƽ¶ÔÍ⿪·ÅÒÔ¼°Ö÷ÒªÑëÐÐÖð²½·Å¿íÇ®±ÒÕþ²ßµÈÒòËØ£¬Ô¤²âÏã¸Û¾¼ÃÔÚ2025Äê»á¼ÌÐøÎºÍÔö³¤£¬È«ÄêʵÖÊÔö³¤½éºõ2%ÖÁ3%£¬»ù±¾Í¨ÕÍÂʺÍÕûÌåͨÕÍÂʽ«»®·ÖΪ1.5%ºÍ1.8%¡£(Íê)
¡¶ÕÒÅ®ÁôËÞ¶àÇ®¡·
? Li H, Zuo Y, Yu J, ..., Zhou B, Ding N. SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning [J]. arXiv preprint arXiv:2509.09674, 2025.
¡¶Î¼ÄÏÄÐÈË×ȥµÄСÏï¡·
±ã½Ý¸ßЧµÄÎÞÈË»úËÍÍâÂô£¬ÖÇÄÜÂÌÉ«µÄÏÖ´ú»¯½¨Öþ£¬ÁýÕÖ³ÇÏçµÄ5GÍøÂ磬´ºÍíÎę̀ÉÏŤÑí¸èµÄÈËÐλúеÈË¡¡¿Æ¼¼¸Ä±äÉú»îµÄг¡¾°£¬ÈÃÍâ¹úÓο͡°´ó¿ªÑ۽硱¡£ËûÃÇÇ×ÉíÌåÑéµÄ±³ºó£¬ÊÇÖйúÁ¬ÐøÔöÇ¿µÄ¾¼ÃʵÁ¦¡¢¿Æ¼¼ÊµÁ¦¡¢×ۺϹúÁ¦¡£