美国研究人员解决博弈困境,可更好地推理无人驾驶汽车等自动系统

盖世汽车讯 为理解自动驾驶汽车如何在复杂道路上行驶,研究人员经常会使用一种数学模型——博弈论,此种模型代表了理性的代理人为实现目标而采取的战略行为。

Dejan Milutinovic教授(图片来源:加州大学圣鲁克兹分校)

据外媒报道,美国加州大学圣鲁克兹分校电子与计算机工程系教授Dejan Milutinovic长期以来一直与同事们研究博弈论的复杂子集——微分博弈论,该理论与运动中的游戏玩家有关。其中一种游戏名为贴墙追踪游戏,是一种相对简单的游戏模式,即速度较快的追踪者的目标就是抓住速度较慢的逃跑者,而逃跑者被限制必须贴着墙移动。

自从该游戏在60年前被人首次阐释以来,游戏中一直有一个困境——游戏中一组位置被认为并非是最优解的位置。不过,现在,Milutinovic教授与同事发表了一篇新论文证明该长期存在的困境实际上并不存在,还介绍了一种新分析方法,证明贴墙追踪游戏总会有一种确定的解决方案。该发现为解决微分博弈领域中存在的其他类似挑战打开了大门,还能够让人们更好地推理无人驾驶汽车等自动驾驶系统。

博弈论被用于对经济学、政治学、计算机科学和工程学等各种领域内的行为进行推理。在博弈论中,纳什均衡是被最普遍认可的概念之一。该概念由数学家约翰纳什提出,定义了博弈中所有参与者以最少的遗憾完成博弈的最优策略。不选择最优策略的任何玩家最终都会后悔,因此,理性的玩家都会积极选择均衡策略。

该概念适用于贴墙追踪游戏,经典的纳什均衡策略恰好用于游戏中的两个玩家,追踪者与逃跑者,描述了双方几乎在所有位置上的最佳策略。不过,在追踪者与逃跑者之间有一组位置,在经典的分析中并没有得出最优的博弈策略,从而出现了困境。该组位置被称为奇异曲面,多年来,研究界都接受了该困境是真实存在的。

不过,Milutinovic与同事不愿意接受这一点。他表示:“这让我们感到困扰,因为我们认为如果逃跑者知道有一个奇异曲面,就可能去到该奇异曲面并错用了该面。逃跑者能够迫使你去到你不知道如何采取最佳行动的奇异曲面,那么大家就不知道在更复杂的游戏中此种情况会有什么影响。”

因此,Milutinovic与同事想出了一种新方法来解决该问题。他们采用了一种贴墙追踪游戏出现时并不存在的数学概念。通过使用Hamilton–Jacobi–Isaacs方程的粘性解,并引入求解奇异曲面的损失率分析,他们发现一个在游戏所有环境下都可以确定的最优解,从而解决了该困境。

偏微分方程的粘性解是一个数学概念,直到20世纪80年代才出现,提供了一个Hamilton–Jacobi–Isaacs方程解的独特推理线。众所周知,该概念与最优控制和博弈论问题的推理有关。

使用粘性解,也就是函数,来解决博弈论问题涵盖用微积分来求此类函数的导数。当与游戏相关的粘性解具有定义良好的导数时,很容易就能找到最佳博弈解决方案。但在贴墙追踪游戏中,情况并非如此,没有定义良好的导数导致了该困境。

通常而言,当困境存在时,一个实用的方法是玩家随机选择一种可能出现的行动,并接受此类决定带来的损失。但是出现了一个问题:如果出现了损失,每个理性的玩家都会希望将损失降至最小。

因此,为了找出玩家如何将损失最小化,研究人员分析了Hamilton-Jacobi-Isaacs方程在导数未明确定义的奇异曲面周围的粘性解。然后,在方程的奇异曲面状态上引入损失率分析。他们发现,当每个参与者都将自己的损失降至最低时,他们在奇异曲面上的行动就会有明确的博弈策略。

研究人员发现,此种将损失最小化的行为不仅定义了奇异曲面的最佳博弈行动,也与经典分析中找到的每种可能状态下的最优博弈行动相一致。

Milutinovic与同事还对探索拥有奇异曲面的其他博弈论问题感兴趣,在此类情况下他们的新方法能够得到应用。

免责声明:本文由用户上传,如有错误请指正,如有侵权,请联系删除!

(0)
上一篇 2023年3月28日 16:03
下一篇 2023年3月28日 16:03

相关推荐

  • 固特异与Gatik准确估算轮胎路面摩擦力 提高车辆安全性与性能

    通过自动驾驶运输技术,固特异与Gatik向更安全、更可持续的货运运输迈出了重要一步。据外媒报道,两家公司在一次概念验证中展示了配备固特异SightLine技术的智能轮胎,可以准确地估算出轮胎-路面摩擦力,并向Gatik的自动驾驶系统(ADS)提供实时信息。这一突破能够通过提供关键数据提高车辆的安全性与性能,为Gatik在B2B短途运输市场上的客户提高效率与价…

    2023年4月7日
    0
  • 打入城市NOA,理想凭什么?

    继小鹏、极狐之后,城市NOA领域又将迎来一个新的玩家:理想。 2月8日,理想汽车在L7发布会上公布了城市NOA的路测视频,并表示今年四季度将在AD MAX上开放城市NOA的早鸟用户内测,只要OTA软件升级,所有MAX版车型都会立刻拥有城市NOA功能。换言之,L7 Max、L8 Max、L9 Max有望率先体验理想城市NOA。 那么,姗姗来迟的理想准备如何打入…

    2023年4月12日
    0
  • 新款普拉多(普拉多4000和2700区别)

    全新普拉多是一款极具魅力的SUV,它不仅在外观方面进行了翻新,更在功能和安全性能上得到升级。我们将从多个方面详细阐述全新普拉多的变化,包括外观、内饰、功能和安全性能。 普拉多4000和2700动力肯定是最大的区别,霸道4000搭载的是4.0L 型号1GR-FE发动机,而霸道2700搭载的是2.7L型号2TR-FE发动机,动力性能有所下降,不过也足够应付日常使…

    2023年6月18日
    0
  • 芯片短缺,丰田限制雷克萨斯9款车型订单量

    据外媒报道,因业内预计车用半导体等零部件的短缺将持续到2023年,丰田汽车正在日本限制其雷克萨斯豪华汽车的订单,并且对各经销商的订单数量设置了上限。 据悉,丰田在日本对雷克萨斯品牌下的9款车型设定了订单限制,具体的限制数量因经销商规模而异,一旦销售一空,就不能接受更多订单。例如,畅销的雷克萨斯UX多用途SUV每个经销商只分配了几十辆。 至于雷克萨斯汽车的预计…

    2023年4月9日
    0
  • 黑芝麻智能与三一专汽达成平台级战略合作 ,首款商用车2023年量产

    12月29日,黑芝麻智能科技有限公司宣布,与三一专用汽车有限责任公司(以下简称“ 三一专汽”)达成平台级战略合作。黑芝麻智能由此成为三一专汽本土首家车规级高性能自动驾驶芯片供应商,搭载黑芝麻智能华山二号®A1000自动驾驶芯片的商用车将于2023年量产。 根据协议,黑芝麻智能提供以华山二号A1000芯片平台为核心的商用车中央域控解决方案,满足商用车和特种车辆…

    2023年4月4日
    0