美国研究人员解决博弈困境,可更好地推理无人驾驶汽车等自动系统

盖世汽车讯 为理解自动驾驶汽车如何在复杂道路上行驶,研究人员经常会使用一种数学模型——博弈论,此种模型代表了理性的代理人为实现目标而采取的战略行为。

Dejan Milutinovic教授(图片来源:加州大学圣鲁克兹分校)

据外媒报道,美国加州大学圣鲁克兹分校电子与计算机工程系教授Dejan Milutinovic长期以来一直与同事们研究博弈论的复杂子集——微分博弈论,该理论与运动中的游戏玩家有关。其中一种游戏名为贴墙追踪游戏,是一种相对简单的游戏模式,即速度较快的追踪者的目标就是抓住速度较慢的逃跑者,而逃跑者被限制必须贴着墙移动。

自从该游戏在60年前被人首次阐释以来,游戏中一直有一个困境——游戏中一组位置被认为并非是最优解的位置。不过,现在,Milutinovic教授与同事发表了一篇新论文证明该长期存在的困境实际上并不存在,还介绍了一种新分析方法,证明贴墙追踪游戏总会有一种确定的解决方案。该发现为解决微分博弈领域中存在的其他类似挑战打开了大门,还能够让人们更好地推理无人驾驶汽车等自动驾驶系统。

博弈论被用于对经济学、政治学、计算机科学和工程学等各种领域内的行为进行推理。在博弈论中,纳什均衡是被最普遍认可的概念之一。该概念由数学家约翰纳什提出,定义了博弈中所有参与者以最少的遗憾完成博弈的最优策略。不选择最优策略的任何玩家最终都会后悔,因此,理性的玩家都会积极选择均衡策略。

该概念适用于贴墙追踪游戏,经典的纳什均衡策略恰好用于游戏中的两个玩家,追踪者与逃跑者,描述了双方几乎在所有位置上的最佳策略。不过,在追踪者与逃跑者之间有一组位置,在经典的分析中并没有得出最优的博弈策略,从而出现了困境。该组位置被称为奇异曲面,多年来,研究界都接受了该困境是真实存在的。

不过,Milutinovic与同事不愿意接受这一点。他表示:“这让我们感到困扰,因为我们认为如果逃跑者知道有一个奇异曲面,就可能去到该奇异曲面并错用了该面。逃跑者能够迫使你去到你不知道如何采取最佳行动的奇异曲面,那么大家就不知道在更复杂的游戏中此种情况会有什么影响。”

因此,Milutinovic与同事想出了一种新方法来解决该问题。他们采用了一种贴墙追踪游戏出现时并不存在的数学概念。通过使用Hamilton–Jacobi–Isaacs方程的粘性解,并引入求解奇异曲面的损失率分析,他们发现一个在游戏所有环境下都可以确定的最优解,从而解决了该困境。

偏微分方程的粘性解是一个数学概念,直到20世纪80年代才出现,提供了一个Hamilton–Jacobi–Isaacs方程解的独特推理线。众所周知,该概念与最优控制和博弈论问题的推理有关。

使用粘性解,也就是函数,来解决博弈论问题涵盖用微积分来求此类函数的导数。当与游戏相关的粘性解具有定义良好的导数时,很容易就能找到最佳博弈解决方案。但在贴墙追踪游戏中,情况并非如此,没有定义良好的导数导致了该困境。

通常而言,当困境存在时,一个实用的方法是玩家随机选择一种可能出现的行动,并接受此类决定带来的损失。但是出现了一个问题:如果出现了损失,每个理性的玩家都会希望将损失降至最小。

因此,为了找出玩家如何将损失最小化,研究人员分析了Hamilton-Jacobi-Isaacs方程在导数未明确定义的奇异曲面周围的粘性解。然后,在方程的奇异曲面状态上引入损失率分析。他们发现,当每个参与者都将自己的损失降至最低时,他们在奇异曲面上的行动就会有明确的博弈策略。

研究人员发现,此种将损失最小化的行为不仅定义了奇异曲面的最佳博弈行动,也与经典分析中找到的每种可能状态下的最优博弈行动相一致。

Milutinovic与同事还对探索拥有奇异曲面的其他博弈论问题感兴趣,在此类情况下他们的新方法能够得到应用。

免责声明:本文由用户上传,如有错误请指正,如有侵权,请联系删除!

(0)
上一篇 2023年3月28日 16:03
下一篇 2023年3月28日 16:03

相关推荐

  • 本田xrv报价及图片(xrv本田报价)

    我们将介绍一款备受欢迎的SUV车型,本田XRV。其动感十足的外观设计和优秀的性能,深受消费者的喜爱。 2023款本田XR-V推出全新车型,官方指导价:13.29-15.29万,预估2023款本田XR-V落地价范围:14.97-17.17万之间,不同地区经销商也会有不一样的优惠幅度。 2023款 1.5L CVT热潮版 官方指导价:14.59万 参考落地价:1…

    2023年6月11日
    0
  • 小鹏汽车发布「扶摇」技术架构,重新定义高端智能电动汽车标准

    4月16日,「行云直上」小鹏汽车2023技术架构发布会于上海举办,正式发布了实现无人驾驶前的高端智能电动汽车终极技术架构——SEPA 2.0 「扶摇」全域智能进化架构。 「扶摇」架构是小鹏汽车经过5年探索,累计研发投入超百亿积淀而成,在行业中保持3年的技术领先性。「扶摇」架构将从产品开发、技术迭代、体系建设上引领智能电动汽车变革,加速小鹏汽车体系化造车的二次…

    2023年4月21日
    0
  • 智行者获猛士科技917车型高阶自动驾驶量产定点

    4月13日,北京智行者科技股份有限公司(以下简称“智行者”)宣布,其已获得东风旗下豪华电动越野品牌猛士科技量产项目定点,此次合作车型预计2024年第三季度实现量产。 本次项目合作中,智行者提供软硬件一体的L2+自动驾驶系统。该方案包含城市领航、高速领航、记忆泊车、自主代客泊车等25项功能,是目前行业内功能最完备的量产自动驾驶方案;同时,架构最高可支持L3级别…

    2023年4月20日
    0
  • 生活回归正常,但汽车市场却回不去了….

    据汽车新闻报道,虽然疫情政策改变后生活正在正常化,但汽车制造商面临着一系列挑战。市场与新冠疫情前的时代相比仍然是天壤之别。 市场正以三年前很少有人能想象的速度从汽油产品向电动汽车过渡。 2019年,全电动汽车和插电式混合动力汽车的年销量为120万辆,占新车总销量的4.7%。 而根据中国汽车工业协会的数据,去年中国售出的电动汽车和插电式混合动力汽车约为690万…

    汽车资讯 2023年3月25日
    0
  • 激光雷达成不了AEB的“救星”

    20世纪中期,一名叫Nathaniel Korman的工程师提交了一份关于用雷达控制车速的系统专利。这应该是AEB最早的雏形。后来人们发现雷达的用处越来越多,世界上首个用于汽车的雷达制动系统亦随之问世。据称,该系统的一部分创作灵感来自糟糕的大雾天气。 时至今日,AEB已经成为ADAS核心且最基本的功能,无论是传统车企还是造车新势力,都在加快上车步伐。有数据显…

    汽车资讯 2023年3月28日
    0