乒乓球AI机器人赢了人类 专业教练:到达中级选手水平_AR低组装导轨_华体会体育最新贴吧
华体会体育最新专注台湾CPC直线导轨_CPC滑块_CPC微型导轨_线性滑轨代理 全国服务热线: 13532728713

AR低组装导轨

乒乓球AI机器人赢了人类 专业教练:到达中级选手水平

时间: 2025-03-15 12:57:50 |   作者: AR低组装导轨

产品介绍/参数

  实践测验中,机器人实时习惯不一样选手风格,终究赢下了与初学者的一切竞赛,同中级玩家对打也有55%的胜率。

  与它对阵的美国乒乓球明星Barney J. Reed给予了高度评价:超出预期,这个机器人已到达中级水平。

  乒乓球是一项对膂力和战略、技巧等各方面归纳要求很高的运动,人类也往往要经过多年练习才干把握。

  因而,不同于像象棋、围棋这种纯战略游戏,关于机器人而言,乒乓球成为检测其归纳才能的重要基准,比方高速运动、实时的精准操控、战略决策、体系模块规划等等。

  举个比方,面临球的不同落点,机器人需求快速移动方位;面临显着的出界球,机器人应挑选不接。

  团队找到了29个不同技术水平的乒乓球运动员进行了竞赛,包含初学者、中级、高档和高档以上。

  人类与机器人进行了3场竞赛,竞赛遵从规范乒乓球规矩。(不过因为机器人无法发球,整场由人类来发球)

  在此之前,其实也有相应的乒乓球机器人研讨,此次谷歌机器人的特别之处在于,它能够同从未见过的人类进行全面的竞技对决。

  比方看这位选手,竞赛刚局面机器人显着还在习惯进程中,人类以9比2的大比分打败机器人。

  但就在下一局之后,机器人显着了解了对手风格,一直在紧紧追着比分。两边打得也是有来有往。

  终究在一切对手中,机器人赢得了一切初学者竞赛,在与中级选手的竞赛中胜率为55%。

  尽管现在机器人还没有很好的办法打败高档选手,但在人类的各种反应中,能够正常的看到,我们都很乐意同这个机器人游玩。

  主体选用的是6自由度的瑞士公司ABB 1100机械臂,设备在两个Festo直线导轨上,使其能够在平面内移动。横向移动导轨长4米,纵向移动导轨长2米。

  团队规划了分层和模块化的战略架构,Agent包含一个初级技术库(LLC)和一个高档操控器(HLC)。

  LLC是一组专门的战略,每个战略都经过练习来履行特定的乒乓球技术,如正手击球、反手击球、发球等。这些LLC运用CNN架构,经过仿真环境中的进化战略算法进行练习。

  练习进程选用了从实在国际搜集的球状况数据集,以保证模仿环境与实在环境的一致性。

  包含多个组件:风格战略,用于挑选正手或反手;旋转分类器,用于识别来球的旋转类型;LLC技术描绘符,描绘每个LLC的才能;一组启发式战略,用于依据当前情况shortlist候选LLC。

  HLC还运用在线学习的LLC偏好来习惯对手的特色和补偿仿真到实际的距离。

  具体来说,团队先是搜集了少数人类竞赛数据,设置初始化使命条件,然后用强化学习在模仿环境中练习一个Agent,再将战略零样本布置到实在国际中。

  其间运用MuJoCo物理引擎准确模仿球和机器人动力学,包含空气阻力、Magnus效应等,还规划处理了上旋球“校对”,经过在仿真中切换不同的球拍参数来模仿实在国际中的上旋和下旋作用。

  在Agent和人类不断对打的进程中,能够生成更多的练习使命条件,并重复练习-布置。

  机器人技术逐步提高,竞赛也逐步变得复杂,但仍根据实际国际的使命条件。机器人搜集完数据,还能发现其才能的缺乏,随后经过在模仿环境中继续练习来补偿这些缺点。

  经过这种办法,机器人的技术能够在模仿与实际相结合的循环进程,主动迭代改善。

  此外,这个机器人还能追寻对手的行为和打法来习惯不一样的对手,比方对手倾向于将球打回桌子的哪一侧。

  依照对球旋转的估量,制作机器人的上台率图,成果当面临更多下旋球时,其上台率明显下降。

  研讨人员表明,机器人在处理弧线低且挨近球桌的球时,为防止撞击到球桌,很难处理好,并且在实时确认球的旋转类型上也存在限制。

  比方谷歌之前的i-Sim2Real研讨中,练习的机器人与人类打球,最多可接连打340次不落地,相当于接连打了4分钟+。

同类最新