美国研究人员解决博弈困境,可更好地推理无人驾驶汽车等自动系统

盖世汽车讯 为理解自动驾驶汽车如何在复杂道路上行驶,研究人员经常会使用一种数学模型——博弈论,此种模型代表了理性的代理人为实现目标而采取的战略行为。

Dejan Milutinovic教授(图片来源:加州大学圣鲁克兹分校)

据外媒报道,美国加州大学圣鲁克兹分校电子与计算机工程系教授Dejan Milutinovic长期以来一直与同事们研究博弈论的复杂子集——微分博弈论,该理论与运动中的游戏玩家有关。其中一种游戏名为贴墙追踪游戏,是一种相对简单的游戏模式,即速度较快的追踪者的目标就是抓住速度较慢的逃跑者,而逃跑者被限制必须贴着墙移动。

自从该游戏在60年前被人首次阐释以来,游戏中一直有一个困境——游戏中一组位置被认为并非是最优解的位置。不过,现在,Milutinovic教授与同事发表了一篇新论文证明该长期存在的困境实际上并不存在,还介绍了一种新分析方法,证明贴墙追踪游戏总会有一种确定的解决方案。该发现为解决微分博弈领域中存在的其他类似挑战打开了大门,还能够让人们更好地推理无人驾驶汽车等自动驾驶系统。

博弈论被用于对经济学、政治学、计算机科学和工程学等各种领域内的行为进行推理。在博弈论中,纳什均衡是被最普遍认可的概念之一。该概念由数学家约翰纳什提出,定义了博弈中所有参与者以最少的遗憾完成博弈的最优策略。不选择最优策略的任何玩家最终都会后悔,因此,理性的玩家都会积极选择均衡策略。

该概念适用于贴墙追踪游戏,经典的纳什均衡策略恰好用于游戏中的两个玩家,追踪者与逃跑者,描述了双方几乎在所有位置上的最佳策略。不过,在追踪者与逃跑者之间有一组位置,在经典的分析中并没有得出最优的博弈策略,从而出现了困境。该组位置被称为奇异曲面,多年来,研究界都接受了该困境是真实存在的。

不过,Milutinovic与同事不愿意接受这一点。他表示:“这让我们感到困扰,因为我们认为如果逃跑者知道有一个奇异曲面,就可能去到该奇异曲面并错用了该面。逃跑者能够迫使你去到你不知道如何采取最佳行动的奇异曲面,那么大家就不知道在更复杂的游戏中此种情况会有什么影响。”

因此,Milutinovic与同事想出了一种新方法来解决该问题。他们采用了一种贴墙追踪游戏出现时并不存在的数学概念。通过使用Hamilton–Jacobi–Isaacs方程的粘性解,并引入求解奇异曲面的损失率分析,他们发现一个在游戏所有环境下都可以确定的最优解,从而解决了该困境。

偏微分方程的粘性解是一个数学概念,直到20世纪80年代才出现,提供了一个Hamilton–Jacobi–Isaacs方程解的独特推理线。众所周知,该概念与最优控制和博弈论问题的推理有关。

使用粘性解,也就是函数,来解决博弈论问题涵盖用微积分来求此类函数的导数。当与游戏相关的粘性解具有定义良好的导数时,很容易就能找到最佳博弈解决方案。但在贴墙追踪游戏中,情况并非如此,没有定义良好的导数导致了该困境。

通常而言,当困境存在时,一个实用的方法是玩家随机选择一种可能出现的行动,并接受此类决定带来的损失。但是出现了一个问题:如果出现了损失,每个理性的玩家都会希望将损失降至最小。

因此,为了找出玩家如何将损失最小化,研究人员分析了Hamilton-Jacobi-Isaacs方程在导数未明确定义的奇异曲面周围的粘性解。然后,在方程的奇异曲面状态上引入损失率分析。他们发现,当每个参与者都将自己的损失降至最低时,他们在奇异曲面上的行动就会有明确的博弈策略。

研究人员发现,此种将损失最小化的行为不仅定义了奇异曲面的最佳博弈行动,也与经典分析中找到的每种可能状态下的最优博弈行动相一致。

Milutinovic与同事还对探索拥有奇异曲面的其他博弈论问题感兴趣,在此类情况下他们的新方法能够得到应用。

免责声明:本文由用户上传,如有错误请指正,如有侵权,请联系删除!

(0)
上一篇 2023年3月28日 16:03
下一篇 2023年3月28日 16:03

相关推荐

  • 取消超声波雷达 改款Model Y会再降价吗?

    在第369批《道路机动车辆生产企业及产品公告》变更扩展公示中,特斯拉Model Y无雷达版曝光。早在去年10月,特斯拉就开始对欧洲、北美、中东地区交付的Model 3/Y移除超声波雷达传感器,与其“纯视觉”的自动驾驶方案相契合。 据推测,特斯拉“减配超声波雷达”,大概率是因为换装了HW4.0的硬件,也可能是为了节约成本、加快生产速度,或许改款Model Y有…

    汽车资讯 2023年3月28日
    0
  • 上海车展新看点:能力迁移与跨界融合 全面革新座舱体验

    对汽车人来说,“软件定义汽车”已是老生常谈。在这次上海车展上,由能力迁移与跨界融合带来的中间件,让这个观点焕发出新活力。尤其是在智能座舱领域,带来了更多可能性,有望全面革新驾乘体验。 在4月18日的当虹科技展台上,一款名为“All-in-one沉浸式视听娱乐中间件”的应用引起现场媒体驻足观看。“他就像一位调色师。”现场一位产品负责人指着变幻的氛围灯说,这款中…

    2023年4月28日
    0
  • 捷德中国为赛力斯汽车提供新一代数字钥匙解决方案,率先支持多协议融合

    北京,2023年4月20日 —— 捷德公司宣布为赛力斯的AITO问界M5智驾版提供新一代数字钥匙系统服务DCK2.0。它以UWB数字钥匙、多协议融合为特征,从安全技术、解决方案,到基础设施与服务等各个方面为赛力斯汽车提供支持。AITO问界M5智驾版于本月17日正式亮相,再度见证了赛力斯与华为的深度合作。 多年智能汽车数字钥匙商用项目的经验累积,加上持续不断的…

    2023年4月28日
    0
  • 汽车保险什么时候续保最好

    现如今,汽车保险都是一年一缴费的,但是很多车主都会遇上保险脱保的一个情况,即由于某些原因,未能在保险截止日期前进行续保。那么汽车保险什么时候续保最好呢? 以上就是给各位带来的关于汽车保险什么时候续保最好的全部内容了。

    2023年4月23日
    0
  • 复盘2022 | 自动驾驶累计融资125起,都有哪些“资本宠儿”?

    2022年,全球经济增速显著放缓,资本寒冬成为普遍共识,自动驾驶也受到了一定程度的波及。 据盖世汽车统计,2022年国内自动驾驶领域累计披露了125起融资(完整表单见文末),虽然与2021年基本持平,不过在累计披露的融资总额方面,由于大额融资数量有所降低,出现了较大幅度的下滑。 从融资趋势来看,去年资本市场聚焦量产落地的趋势十分明显。在披露的22起重点面向乘…

    2023年4月8日
    0