发布时间:2023-12-04 09:30
羊犬博弈
由于用机器学习方法求解诸如最优控制、微分对策这样具有连续 动作和状态的问题时,效率(效果/算力)较低,特殊的微分对策问题将是测试机器学习方法的竞争案例。
一个古老的羊-犬博弈问题:羊在半径为 R 的圆形圈内具有定常速率 v 和满足以下限制的任意转弯能力:逃逸路径上每一点与圆心的距离随时间单调不减。羊逃出圆形圈则胜。犬沿着圆周以定常速率 V 围
堵以防止羊逃逸,任何时刻具有选择圆周的两个方向之一的能力。
任务:
1.通过运动学精确建模求解犬的最优围堵策略;
2.假设犬以最优策略围堵,基于精确建模求解羊可以逃逸胜出的条件;
假设羊理解自己的能力、限制和躲避犬围堵而逃逸的目标,但不具备基于运动学的最优化决策知识,假设 2 中羊可以逃逸的条件被满足,给出一种机器学习方法,使得羊通过学习训练后实现逃逸;
设计一套评价体系,定量评价 3 中给出的机器学习方法的学习能力;
提出并定量评价更多的羊逃逸机器学习方法。
完整论文20+页 matlab代码 需要私