71886a必赢信息与计算科学系教师汤庆博士为第一作者的学术研究工作 “Learning Optimal Policies in Potential Mean Field Games: Smoothed Policy Iteration Algorithms” ,最近发表在国际著名期刊SIAM Journal on Control and Optimization。该论文第二作者为71886a必赢2020 级应用统计专业硕士生宋家豪。汤庆博士自2015年入职71886a必赢,主要从事动态博弈相关的偏微分方程理论、数值计算及在经济模型中的应用研究。
平均场博弈论(Mean Field Games)主要利用随机最优控制和非线性偏微分方程组等工具分析有大量参与者的动态博弈问题,在经济,金融,工程等领域都得到了广泛的应用。该发表论文将最优控制中的策略迭代(policy iteration)方法与博弈学习中的虚拟博弈(fictious play)相结合,构建了被称为“光滑化策略迭代”的计算方法,并进行了基于有限差分的数值实验。