美国研究人员解决博弈困境,可更好地推理无人驾驶汽车等自动系统

盖世汽车讯 为理解自动驾驶汽车如何在复杂道路上行驶,研究人员经常会使用一种数学模型——博弈论,此种模型代表了理性的代理人为实现目标而采取的战略行为。

Dejan Milutinovic教授(图片来源:加州大学圣鲁克兹分校)

据外媒报道,美国加州大学圣鲁克兹分校电子与计算机工程系教授Dejan Milutinovic长期以来一直与同事们研究博弈论的复杂子集——微分博弈论,该理论与运动中的游戏玩家有关。其中一种游戏名为贴墙追踪游戏,是一种相对简单的游戏模式,即速度较快的追踪者的目标就是抓住速度较慢的逃跑者,而逃跑者被限制必须贴着墙移动。

自从该游戏在60年前被人首次阐释以来,游戏中一直有一个困境——游戏中一组位置被认为并非是最优解的位置。不过,现在,Milutinovic教授与同事发表了一篇新论文证明该长期存在的困境实际上并不存在,还介绍了一种新分析方法,证明贴墙追踪游戏总会有一种确定的解决方案。该发现为解决微分博弈领域中存在的其他类似挑战打开了大门,还能够让人们更好地推理无人驾驶汽车等自动驾驶系统。

博弈论被用于对经济学、政治学、计算机科学和工程学等各种领域内的行为进行推理。在博弈论中,纳什均衡是被最普遍认可的概念之一。该概念由数学家约翰纳什提出,定义了博弈中所有参与者以最少的遗憾完成博弈的最优策略。不选择最优策略的任何玩家最终都会后悔,因此,理性的玩家都会积极选择均衡策略。

该概念适用于贴墙追踪游戏,经典的纳什均衡策略恰好用于游戏中的两个玩家,追踪者与逃跑者,描述了双方几乎在所有位置上的最佳策略。不过,在追踪者与逃跑者之间有一组位置,在经典的分析中并没有得出最优的博弈策略,从而出现了困境。该组位置被称为奇异曲面,多年来,研究界都接受了该困境是真实存在的。

不过,Milutinovic与同事不愿意接受这一点。他表示:“这让我们感到困扰,因为我们认为如果逃跑者知道有一个奇异曲面,就可能去到该奇异曲面并错用了该面。逃跑者能够迫使你去到你不知道如何采取最佳行动的奇异曲面,那么大家就不知道在更复杂的游戏中此种情况会有什么影响。”

因此,Milutinovic与同事想出了一种新方法来解决该问题。他们采用了一种贴墙追踪游戏出现时并不存在的数学概念。通过使用Hamilton–Jacobi–Isaacs方程的粘性解,并引入求解奇异曲面的损失率分析,他们发现一个在游戏所有环境下都可以确定的最优解,从而解决了该困境。

偏微分方程的粘性解是一个数学概念,直到20世纪80年代才出现,提供了一个Hamilton–Jacobi–Isaacs方程解的独特推理线。众所周知,该概念与最优控制和博弈论问题的推理有关。

使用粘性解,也就是函数,来解决博弈论问题涵盖用微积分来求此类函数的导数。当与游戏相关的粘性解具有定义良好的导数时,很容易就能找到最佳博弈解决方案。但在贴墙追踪游戏中,情况并非如此,没有定义良好的导数导致了该困境。

通常而言,当困境存在时,一个实用的方法是玩家随机选择一种可能出现的行动,并接受此类决定带来的损失。但是出现了一个问题:如果出现了损失,每个理性的玩家都会希望将损失降至最小。

因此,为了找出玩家如何将损失最小化,研究人员分析了Hamilton-Jacobi-Isaacs方程在导数未明确定义的奇异曲面周围的粘性解。然后,在方程的奇异曲面状态上引入损失率分析。他们发现,当每个参与者都将自己的损失降至最低时,他们在奇异曲面上的行动就会有明确的博弈策略。

研究人员发现,此种将损失最小化的行为不仅定义了奇异曲面的最佳博弈行动,也与经典分析中找到的每种可能状态下的最优博弈行动相一致。

Milutinovic与同事还对探索拥有奇异曲面的其他博弈论问题感兴趣,在此类情况下他们的新方法能够得到应用。

免责声明:本文由用户上传,如有错误请指正,如有侵权,请联系删除!

(0)
上一篇 2023年3月28日 16:03
下一篇 2023年3月28日 16:03

相关推荐

  • 谁最会赚钱?跨国车企2022年财报盘点

      近段时间,国外各大车企陆续公布了2022年财报或业绩报告。尽管2022年在疫情反复、需求收缩、芯片短缺等压力的冲击下,部分车企仍然赚得盆满钵满,当然也有利润暴跌陷入困境的企业;还有的车企在悄然成长,更有掉队跟不上步伐的。   在公布财报的主流跨国车企中,特斯拉净利润增幅领先,另外还有3家企业的利润增幅达到了百分比两位数。值得关注的是,随着汽车电动化、智能…

    汽车资讯 2023年3月27日
    0
  • 佑驾创新推出行泊一体智驾前视一体机

    1月6日,智能驾驶解决方案研发商深圳佑驾创新科技有限公司(又名“MINIEYE”,以下简称“佑驾创新”)宣布推出两款搭载地平线征程®芯片的智能驾驶产品:基于征程®5的智能驾驶域控制器D3t、基于征程®3的智能驾驶前视一体机D2。 D3t是佑驾创新自主设计的高性能域控制器,搭载征程®5,算力高达128TOPS。D3t支持11路高清摄像头(最高支持800万像素)…

    汽车资讯 2023年4月6日
    0
  • 交强险赔偿包括哪些项目

    我们在购买汽车之后,都需要购买国家强制要求购买的汽车交强险,可能还会购买一些其他的商业险。那么交强险赔偿包括哪些项目呢? 以上就是给各位带来的关于交强险赔偿包括哪些项目的全部内容了。

    2023年4月22日
    0
  • 领克08官图发布,与魅族联合发布深度合作

    3月13日消息,领克汽车和魅族在其各自社交平台宣布:智行合一,互联无界。领克和魅族作为深度融合的战略生态合作伙伴,将共同打造强大的智行无界互联出行体验。同时,领克还发布了领克08的首张官图,新车将于3月30日正式发布。 同日,领克汽车发布了一组领克08的官方预告图,新车延续了 The Next Day 设计语言,定位中型 SUV;采用 CMA 2.0 架构,…

    汽车资讯 2023年3月28日
    0
  • 特斯拉3(特斯拉3:未来汽车之光)

    摘要: 特斯拉3是特斯拉公司在2017年发布的新一代纯电动汽车,引起了全球消费者的极大关注。本文将从四个方面对特斯拉3进行详细阐述:设计特点、纯电动驱动、高度自动驾驶、节能环保。通过深入探讨,帮助消费者更好地了解特斯拉3的重要特点和优点。 一、设计特点 特斯拉3的造型十分简洁,风阻系数仅为0.23,创造了同级车型的新纪录。一改特斯拉早期车型的翘嘴设计,特斯拉…

    2023年5月24日
    0