美国研究人员解决博弈困境,可更好地推理无人驾驶汽车等自动系统

盖世汽车讯 为理解自动驾驶汽车如何在复杂道路上行驶,研究人员经常会使用一种数学模型——博弈论,此种模型代表了理性的代理人为实现目标而采取的战略行为。

Dejan Milutinovic教授(图片来源:加州大学圣鲁克兹分校)

据外媒报道,美国加州大学圣鲁克兹分校电子与计算机工程系教授Dejan Milutinovic长期以来一直与同事们研究博弈论的复杂子集——微分博弈论,该理论与运动中的游戏玩家有关。其中一种游戏名为贴墙追踪游戏,是一种相对简单的游戏模式,即速度较快的追踪者的目标就是抓住速度较慢的逃跑者,而逃跑者被限制必须贴着墙移动。

自从该游戏在60年前被人首次阐释以来,游戏中一直有一个困境——游戏中一组位置被认为并非是最优解的位置。不过,现在,Milutinovic教授与同事发表了一篇新论文证明该长期存在的困境实际上并不存在,还介绍了一种新分析方法,证明贴墙追踪游戏总会有一种确定的解决方案。该发现为解决微分博弈领域中存在的其他类似挑战打开了大门,还能够让人们更好地推理无人驾驶汽车等自动驾驶系统。

博弈论被用于对经济学、政治学、计算机科学和工程学等各种领域内的行为进行推理。在博弈论中,纳什均衡是被最普遍认可的概念之一。该概念由数学家约翰纳什提出,定义了博弈中所有参与者以最少的遗憾完成博弈的最优策略。不选择最优策略的任何玩家最终都会后悔,因此,理性的玩家都会积极选择均衡策略。

该概念适用于贴墙追踪游戏,经典的纳什均衡策略恰好用于游戏中的两个玩家,追踪者与逃跑者,描述了双方几乎在所有位置上的最佳策略。不过,在追踪者与逃跑者之间有一组位置,在经典的分析中并没有得出最优的博弈策略,从而出现了困境。该组位置被称为奇异曲面,多年来,研究界都接受了该困境是真实存在的。

不过,Milutinovic与同事不愿意接受这一点。他表示:“这让我们感到困扰,因为我们认为如果逃跑者知道有一个奇异曲面,就可能去到该奇异曲面并错用了该面。逃跑者能够迫使你去到你不知道如何采取最佳行动的奇异曲面,那么大家就不知道在更复杂的游戏中此种情况会有什么影响。”

因此,Milutinovic与同事想出了一种新方法来解决该问题。他们采用了一种贴墙追踪游戏出现时并不存在的数学概念。通过使用Hamilton–Jacobi–Isaacs方程的粘性解,并引入求解奇异曲面的损失率分析,他们发现一个在游戏所有环境下都可以确定的最优解,从而解决了该困境。

偏微分方程的粘性解是一个数学概念,直到20世纪80年代才出现,提供了一个Hamilton–Jacobi–Isaacs方程解的独特推理线。众所周知,该概念与最优控制和博弈论问题的推理有关。

使用粘性解,也就是函数,来解决博弈论问题涵盖用微积分来求此类函数的导数。当与游戏相关的粘性解具有定义良好的导数时,很容易就能找到最佳博弈解决方案。但在贴墙追踪游戏中,情况并非如此,没有定义良好的导数导致了该困境。

通常而言,当困境存在时,一个实用的方法是玩家随机选择一种可能出现的行动,并接受此类决定带来的损失。但是出现了一个问题:如果出现了损失,每个理性的玩家都会希望将损失降至最小。

因此,为了找出玩家如何将损失最小化,研究人员分析了Hamilton-Jacobi-Isaacs方程在导数未明确定义的奇异曲面周围的粘性解。然后,在方程的奇异曲面状态上引入损失率分析。他们发现,当每个参与者都将自己的损失降至最低时,他们在奇异曲面上的行动就会有明确的博弈策略。

研究人员发现,此种将损失最小化的行为不仅定义了奇异曲面的最佳博弈行动,也与经典分析中找到的每种可能状态下的最优博弈行动相一致。

Milutinovic与同事还对探索拥有奇异曲面的其他博弈论问题感兴趣,在此类情况下他们的新方法能够得到应用。

免责声明:本文由用户上传,如有错误请指正,如有侵权,请联系删除!

(0)
上一篇 2023年3月28日 16:03
下一篇 2023年3月28日 16:03

相关推荐

  • 宝马x1多少钱(2023款宝马X1新款价格和图片)

    宝马X1的报价揭晓,我们将从4个方面,对宝马X1报价的稳定性进行分析。 宝马X12022款推出全新车型,官方指导价为27.98-33.98万,预估参考落地价为31.12-37.72万,根据地区不同也会有不同程度的优惠。 2022款 sDrive20Li 时尚型 官方指导价:27.98万 参考落地价:31.12万 2022款 xDrive25Li 尊享型 官方…

    2023年5月29日
    0
  • 富士康携手英伟达打造自动驾驶平台

    盖世汽车讯 据外媒报道,1月3日,芯片制造商英伟达(Nvidia)和电子产品制造商富士康(Foxconn)宣布合作开发自动驾驶汽车平台。 根据合作协议,富士康将作为一级制造商,面向全球汽车市场生产基于NVIDIA DRIVE Orin™的电子控制单元(ECU)。富士康生产的电动汽车(EV)将采用DRIVE Orin ECU和DRIVE Hyperion™传感…

    2023年4月5日
    0
  • 长安逸动plus(长安逸动plus多少钱)

    长安逸动plus作为城市穿梭新标杆备受瞩目,我们将从四个方面对其进行详细阐述,包括外观设计、智能互联、驾驶辅助和动力性能。 2022款长安逸动plus正式上市。新款逸动PLUS推出6款车型,指导价格区间为7.29-10.39万元。不同地区经销商会有一定的优惠幅度。 1.6L GDi手动精英型 指导价格:7.29元 1.6L GDi手动豪华型 指导价格:7.7…

    2023年6月5日
    0
  • 马力或超 600 匹 凯迪拉克 LYRIQ V 路试谍照曝光

    近日,有海外媒体曝光了一组凯迪拉克 LYRIQ V 最新的路试谍照,这也是该车型谍照首次被曝光。外观方面,新车覆盖的伪装并不算厚重,主要的伪装都集中在了车身下沿位置。作为凯迪拉克 LYRIQ 车型的高性能版车型可以看到车辆已经换装了造型更加犀利的前保险杠。车身侧面,整体的车身轮廓与普通版的 LYRIQ 基本保持一致,伪装也在车门下沿位置。车尾方面,灯组的轮廓…

    2023年3月27日
    0
  • 交强险最高赔偿金额是多少

    交强险的意思是机动车交通事故责任强制保险,属于国家强制性购买的保险,不买上路是违法行为。那么交强险最高赔偿金额是多少? 以上就是给各位带来的关于交强险最高赔偿金额是多少的全部内容了。

    2023年4月22日
    0