![博弈学习通信抗干扰理论与方法](https://wfqqreader-1252317822.image.myqcloud.com/cover/414/44819414/b_44819414.jpg)
3.2.2 博弈均衡分析与求解
1.下层子博弈
在3.2.1节建模的抗干扰Stackelberg功率控制博弈中,干扰作为跟随者需要估计用户的发射功率策略,不精确的估计可能产生观测误差。与文献[25]类似,干扰的观测误差可定义为ε=|P~-P|/P,其中P~表示干扰对用户发射功率的观测值。干扰追求自身效用的最大化,考虑到发射链路信道增益α和干扰功率代价Cj的不确定性,干扰的优化问题可建模为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_40_5.jpg?sign=1739273553-kbZsxpobsmfaFYFmqEaLfmQj2sc6yJHQ-0-b26f3014de7f9d0a11734368e814cd5d)
式中, JM为干扰的最大干扰功率。根据上述优化问题,最佳干扰功率为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_40_6.jpg?sign=1739273553-TModU7seCEnd8jt7pYDK21pOKud7Fn1K-0-5f5c12a150b51e0018893acdbce7f133)
对于干扰来说,假设随机变量α和Cj相互独立。随机变量α的 M 个状态分别是α1,…,αm,…,αM,其概率分布为φ1,…,φm,…,φM,并满足。随机变量Cj的W个状态分别是Cj1,…,Cjw,…,CjW,其概率分布为к1,…,кw,…,кW,并满足
。
通过求解式(3-5)和式(3-6)构成的优化问题,干扰可以获得推论3.1所示的最佳功率策略。
推论3.1:干扰的最佳功率策略为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_1.jpg?sign=1739273553-uudoI2Qx0oODNWTgB5LABl4sByfGvPjV-0-882f2ec25181a539d0d07a6fbc58cf5a)
其中,(.)+□max(.,0)。如果用户的发射功率太小(例如,,那么干扰功率为0,不再进行干扰。
证明:根据文献[24-25]中的论述,由于满足
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_3.jpg?sign=1739273553-oCaT13oDpAQdTkOwQSS0cjzkiR59LXWN-0-f6cd9f9af01aa51ac078f79a4dec7e21)
因此,干扰的效用函数是干扰功率J的凹函数,式(3-5)和式(3-6)组成的优化问题为一个凸优化问题。基于对偶优化理论[46-147-149],可以得到最佳干扰策略。首先,通过引入非负对偶变量λ,式(3-5)和式(3-6)所组成优化问题的拉格朗日函数为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_4.jpg?sign=1739273553-F20boLRo77fHdSTMsS2MQNjbB22tzZBw-0-ad9db78ff75ea0fa4b5faf1b9d87b583)
拉格朗日对偶函数为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_5.jpg?sign=1739273553-syZRzjaOMqEKL0ZLt0lShvA6JfuKKu5y-0-24f5573c7cf64cc1f30b7683920229ad)
相应的对偶问题为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_6.jpg?sign=1739273553-2AjMZxR2NDDukkryvcAKFw4BJ5FnHFtQ-0-1b2a6832bb3d85ef5d9ccdd97f9a0a17)
根据库恩-塔克(Karush-Kuhn-Tucker,KKT)条件,可得
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_41_7.jpg?sign=1739273553-vEMF2pg7Pqs4vCYGFiiQY1oFRrV87YNS-0-33ca23ecaec3f941058287cff156a86d)
根据式(3-13),可以得到。由于式(3-5)和式(3-6)组成的优化问题是一个凸优化问题,强对偶条件成立。因此,对偶间隙为零,对偶问题的最优解即为原问题的最优解。
证毕。
2.上层子博弈
考虑到干扰链路信道增益β和用户发射功率代价Cs的不确定性,用户的最佳功率策略可以通过求解下面的优化问题得到。
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_1.jpg?sign=1739273553-RNYMYu2BBorRd8qPfKgtVA42L79aM9CI-0-80a465d1f3cb913ef57f009f0677a4b3)
其中, PM表示用户的最大发射功率, J (P)如式(3-8)所示。用户的最佳发射功率为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_2.jpg?sign=1739273553-3eWm1UKbKHkYPY9Vyr8hNrgpLvYZF5Zy-0-1eef3689d9b9be272f62c5b297e46f36)
对于用户来说,假设随机变量β和Cs相互独立。随机变量β的 R 个状态分别为β1,…,βr,…,βR,其概率分布为ρ1,…,ρr,…,ρR,并满足。随机变量Cs的H个状态分别为Cs1,…,Csh,…,CsH,其概率分布为g1,…,gh,…,gH,并满足
。
推论3.2:用户的最佳功率策略为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_5.jpg?sign=1739273553-OGUcxT40PK2f4SCMT414dfoWCi8Pfaq9-0-f52118bf482a63df9dd998fde2da7a71)
其中,。
证明:将式(3-8)代入式(3-3),可以得到
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_42_7.jpg?sign=1739273553-uCP522epcy36QnYZc29MvQdI5qatfnXY-0-3de7d1a4bd88ce6273d96d1810e20ca2)
其中,。
根据式(3-18),当满足条件P≤Λ时,用户的效用函数是发射功率P的线性函数。当满足条件P>Λ时,由于满足
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_1.jpg?sign=1739273553-LiDVZx5jrO2tz4CoWSjxwjWP1UlZQleH-0-2de8c8e396b189b4045c9e82b9107183)
因此,用户的效用函数是发射功率P的凹函数。
通过引入非负对偶变量μ,式(3-14)和式(3-15)所组成优化问题的拉格朗日函数为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_2.jpg?sign=1739273553-UosZeNDDobdZFqGI4Psxcec0UgFGZUWb-0-f7efe846621b5ad372eb83fb89f19d37)
类似于下层子博弈的分析过程,可得用户的最佳发射功率为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_3.jpg?sign=1739273553-UvZgSTZE6FYJu3rIvmoTELq6rSd31sDo-0-ddb74e81d5c2c208d5bd5253664f0d96)
根据式(3-18),可分以下几种情况进行讨论:
情况1:。
在这种情况下,满足条件Λ≤Popt。用户效用函数时获得最大值。
情况2:。
在这种情况下,满足条件Λ>Popt。用户效用函数时获得最大值。
情况3:。
在这种情况下,满足条件P≤Λ,用户效用函数是发射功率P的单调递减函数。用户效用函数
时获得最大值。
证毕。
对偶变量λ和μ可通过次梯度法进行更新。
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_43_11.jpg?sign=1739273553-4ur1hf6zDuARV7bRgtPshciNT1yllScK-0-9b3fa19cf479e4cb62ed95aa9045b275)
式中,n为迭代次数;和
均为迭代步长。
3.Stackelberg均衡分析
根据文献[44],Stackelberg均衡可定义如下。
定义3.1:如果对于P≥0和J≥0,满足条件
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_44_1.jpg?sign=1739273553-yugNHPiSLYrlN1ea0f1gZVziByblk9D2-0-615a01b1c99a3b97c9f684c12b495f8a)
那么最佳策略集合( P*, J*)构成所提博弈的 Stackelberg 均衡(Stackelberg Equilibrium,SE)。
推论3.3:所提抗干扰贝叶斯Stackelberg博弈总是存在一个SE解。
证明:给定一个用户的发射功率策略P,则有以下两种情况。
(1)干扰的策略空间{J∶0≤J≤J M}是欧式空间上的非空凸紧子集。
(2)效用函数是干扰功率J的连续凹函数。
基于文献[150]中的论述,在下层子博弈中存在一个 NE 解,NE(P)表示在给定用户发射功率P时的最佳响应。定义3.1中的SE可等价定义为
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_44_3.jpg?sign=1739273553-oIFNIv6IbfGODYx9rtScYJVeVZ9x8ypj-0-02b37ae59f7b7d1d84853743077e8725)
因此,存在P*满足
![](https://epubservercos.yuewen.com/07EB73/23949980909652506/epubprivate/OEBPS/Images/43063_44_4.jpg?sign=1739273553-wOcRYE863Pu39ldoxx4Gcyvob36nkgw9-0-9a4a2218ca4afe239f4ae9d0bb38723b)
因而,所提抗干扰贝叶斯Stackelberg博弈总是存在SE解。
证毕。
推论3.4:所提抗干扰贝叶斯Stackelberg博弈存在唯一的SE解。
证明:根据式(3-9),满足条件。在给定用户发射功率 P 的条件下,干扰的效用函数
是干扰功率J的凹函数。因此,干扰存在唯一的最佳策略NE(P*)。
根据推论 3.2,用户存在唯一的最佳发射功率策略P*。因此,所提的抗干扰贝叶斯Stackelberg博弈存在唯一的SE解。
证毕。