Lecture 6 - Limit Behaviour & Ergodic Theory
[!tldr] Syllabus + 正常返 + 遍历定理 + 不变分布的存在性与唯一性
本节课接着常返性的内容,考虑\(n\to\infty\) 的情形,继续研究随时间推移,Markov链转移的规律。由上一节课中Corollary 5.12,若状态\(j\) 是暂留的,那么对任意状态
所以本节课我们只考虑常返状态。
弱遍历定理
平均返回时间和正常返
假设状态\(i\)是常返的,那么\(f_{ii}=\sum\limits_{n=1}^{\infty}f_{ii}^{(n)}=1\),把\(\left\{ f_{ii}^{(n)} \right\}\)看成\(\mathbb{N}^{+}\)上的一个分布,我们可以定义返回状态\(i\)的平均转移次数
[!NOTE] Definition 6.1(平均返回时间) 对于常返状态\(i\)的平均返回时间定义为
\[\mu_{ii}\overset{\Delta}{=}\sum\limits_{n=1}^{\infty} nf_{ii}^{(n)}\]
利用平均返回时间可以进一步对常返状态分类
[!NOTE] Definition 6.2(正常返) 假设状态\(i\)常返,如果它的平均返回时间是有限的,也就是\(\mu_{ii}<\infty\),就称状态\(i\)是正常返的(Positive recurrent),否则,\(M_{ii}=\infty\),我们则称\(i\)为零常返(Null recurrent)
弱遍历定理
[!tip] Theorem 6.3(弱遍历定理) 设\(\left\{ X_{n} \right\}\)是不可约常返Markov链,那么对\(\forall i,j\)状态
\[\lim\limits_{ n \to \infty } \frac{1}{n}\sum\limits_{k=0}^{n-1} P_{ij}^{(k)}= \frac{1}{\mu_{jj}}\]
Proof.
先给出一个引理(不加证明)
[!NOTE] Lemma 6.4(Hardy&Littlewood) 设\(\forall n ,a_{n}\geqslant 0\),记幂级数\(A(z)\)为\(\sum\limits_{n=0}^{\infty}a_{n}z^{n},0\leqslant z<1\) 则有
\[\lim\limits_{ n \to \infty } \frac{1}{n}\sum\limits_{k=0}^{n-1} a_{k}=\lim\limits_{ z \to 1^{-} }(1-z)A(z)\]
设\(P_{ij}(z)\overset{\Delta}{=}\sum\limits_{n=0}^{\infty}P_{ij}^{(n)}z^{n}\),由引理得
回顾Theorem 5.11的证明中
设\(F_{ij}(z)\overset{\Delta}{=}\sum\limits_{n=1}^{\infty}f_{ij}^{(n)}z^{n}\),当\(i\neq j\)时,由Abel定理可得
所以
当\(i=j\)时,直接有
无论是否有\(i=j\),即\(\forall i\)都有
由Abel定理(结合上面的所有等式可得)
注. \(\dfrac{1}{n}\sum\limits_{k=0}^{n-1}P_{ij}^{(k)}\) 具有明确的概率含义(概率转化为示性函数的期望),
其中#A表示集合A中元素的个数。所以\(\dfrac{1}{n}\sum\limits_{k=0}^{n-1}P_{ij}^{(k)}\)表示在\(n-1\)步转移中,处于状态\(j\)的次数与记录状态总数\(n\) 的比值。
正常返的简单性质
和常返性一样,正常返也具有类的性质,即下面命题:
[!NOTE] Proposition 6.5 若\(i\)正常返,\(i\to j\),那么\(j\) 也正常返。
Proof
由于\(i\to j\),那么存在\(m\),使得\(P_{ij}^{(m)}>0\) ,由CK方程,
不等式两端对\(l\)求和平均,
两端同时令\(n\to\infty\)取极限,利用弱遍历定理:
故\(\mu_{jj}<\infty\),所以\(j\)正常返。
进一步,如果Markov链的状态是有限的,和常返性一样,有下面结论:
[!NOTE] Proposition 6.6 有限状态Markov链必然存在正常返态
Proof
反证法,若命题不成立。设状态空间\(E=\{1,2,\ldots,N\}\),则所有状态都是暂留的或者零常返的。固定状态\(i\),对任意\(j\),由弱遍历定理,
那么对有限的N,
然而,由概率转移矩阵的性质:对任意\(k\),\(\sum\limits_{j=1}^{N}P_{ij}^{(k)}=1\)
矛盾(按假设应当趋于0)!故命题成立。
注.结合推论6.5可知,状态有限的不可约Markov链,所有状态都是正常返态。
不变分布的存在唯一性
基本问题
本节我们利用弱遍历定理回答关于不变分布的问题:
1.如果不变分布存在,什么条件下具有唯一性?
便于研究随机动力系统
2.不变分布在什么条件下存在?
3.如果存在且唯一那么那个Markov链的收敛速度有多快?如何刻画这个速度?(Next Lecture)
不变分布的唯一性
首先回答第一个问题,即下面定理(仍然研究不可约常返的Markov链)
[!NOTE] Theorem 6.7 设\(\{X_n\}\) 是不可约常返的Markov链, \(\pi\)是\(P\)的一个不变分布,即满足不变方程\(\pi=\pi P\),则对任意状态\(j\),都有\(\pi_j>0\),且
\[\pi_j=\frac{1}{\mu_{jj}}\]
Proof.
先给出一个引理-有界收敛定理(实际是控制收敛定理的一个特例,M也就是控制函数,控制收敛定理可以在实变函数中得到证明,但有界收敛定理只需要初等概率论的知识)
[!NOTE] Lemma 6.8(有界收敛定理) 设\(X_{1},X_{2},\ldots\).为随机变量序列,依概率收敛于\(X\)。若存在\(M>\) 0,使得对任意\(n\geq1\),\(P(|X_n|\leq M)=1\),那么
\[\lim\limits_{n\to\infty}\mathbb{E}[X_n]=\mathbb{E}[\lim\limits_{n\to\infty}X_n]=\mathbb{E}[X]\]依概率收敛,记为\(X_n\stackrel{\mathrm{P}}{\longrightarrow}X\),如果对于\(\varepsilon>0\)
\[\mathrm{P}(\omega:|X_n(\omega)-X(\omega)|>\varepsilon)\to0,n\to\infty.\]
Proof
首先,由于\(X_{n}\) 依概率收敛于\(X\) ,且\(P(|X_{n}|\leq M)=1\) ,所以对任意\(\epsilon>0\)
即\(P(|X|\leq M)=1\) .其次,对任意\(\varepsilon>0\)
最后,令\(n\to\infty\) 可得,
再令\(\varepsilon\rightarrow0\) 即证。
回到原命题,对任意状态\(i\),由于\(\sum\limits_{s\in E}\pi_{s}=1\),所以存在\(j\in S\),使得\(\pi_j>0\)。对于任意状态\(i\),由于\(\{X_n\}\) 不可约,所以\(j\to i\),故存在\(n\) ,使得\(P_{ji}^{(n)}>0\),那么根据不变方程:
命题第一部分得证(\(\forall i,\pi_{i}>0\))。
不妨考虑\(\{X_{n}\}\)初始分布为\(\pi\),由于\(\pi\)是不变分布,所以对任意\(k\), \(P(X_{k}=j)=\pi_{j}\) ,那么
由于\(0\leqslant\dfrac{1}{n}\sum\limits_{k=0}^{n-1}P_{ij}^{(k)}\leqslant 1\),所以由有界收敛定理+弱遍历定理
注.上面的命题表明,对于不可约常返Markov链,不变分布如果存在,则是唯一的,并\(\exists\pi_{j}=\frac{1}{\mu_{jj}}>0\) ,那么对任意状态\(j\)
这说明:如果不变分布存在,就有所有状态都是正常返的。
下面我们证明其逆命题,也就是若\(\mu_{jj}<\infty\) ,令\(\pi_{i}=\frac{1}{\mu_{jj}}\) ,则\(\pi\) 就是不变分布,这回答了:不变分布在什么条件下存在?
不变分布的存在性
[!NOTE] Theorem 6.9 不可约正常返的Markov链存在平稳分布。
Proof
由弱遍历定理,对不可约正常返Markov链中的任意状态\(i,j\)
我们下面证明\(p=(p_{0},p_{1},\ldots)\) 为一个不变分布,即满足不变方程\(p=pP\) ,且是一个概率分布。
先证不变方程\(p=pP\) 成立。由C-K方程
由于\(\frac{1}{n}(P_{ij}^{(n)}-P_{ij}^{(0)})\to0\) \(n\to\infty\)
由于\(0\leqslant\frac{1}{n}\sum\limits_{k=0}^{n-1}P_{ij}^{(k)}\leqslant1\) ,所以由有界收敛定理
即得不变方程
再证\(p\)是一个概率分布,即\(\sum_{l\in E}p_{l}=1\) .由于对任意\(k\)
所以
由于\(0\leq\frac{1}{n}\sum_{k=0}^{n-1}P_{ij}^{(k)}\leq1\) ,所以由有界收敛定理
所以\(\sum\limits_{l\in E}p_{l}=1\)
弱遍历定理的另一形式
我们已经知道了弱遍历极限和不变分布的关系,可以得到弱遍历定理的另一个形式
[!NOTE] Theorem 6.10(弱遍历定理) 设\(\{X_{n}\}\) 是不可约正常返的Markov链,\(\pi\) 是不变分布,那么对任意状态\(i,j\),
\[\lim\limits_{n\to\infty}\frac{1}{n}\sum\limits_{k=0}^{n-1}P_{ij}^{(k)}=\pi_j\]
平均遍历定理
更一般地,可以得到下面的(平均)遍历定理(证明比较复杂课上略过)
[!NOTE] Theorem 6.11(遍历定理) 设\(\{X_n\}\) 是不可约常返的Markov链, \(\pi\)是不变分布, \(f\)是\(E\)上的函数,满足\(\sum\limits_{i\in E}\pi_{i}|f(i)|<\infty\),则
\[\lim\limits_{n\to\infty}\frac{1}{n}\sum\limits_{k=0}^{n-1}f(X_k)=\sum\limits_{i\in E}\pi_if(i)\]
Proof
参考《应用随机过程》,陈大岳、章复熹,北京大学出版社,2023,P118,P124-P128.
注1.遍历定理说明了长时间尺度下,函数\(f\)的时间平均,等于在空间上平均。这意味着系统的长期统计行为可以由其稳态分布完全描述。此外,在计算数学中,经常会处理高维空间上积分计算的问题,即\(E\)是高维空间,那么由遍历定理,即可通过构造随机动力系统(遍历的Markov过程),通过计算时间上的一维积分,取极限得到高维积分的结果。
Addition:刘军 -《科学计算中的蒙特卡洛策略》- 科学出版社
注2.遍历定理可以视为大数定律在Markov依赖结构下的推广。大数定律适用于独立同分布的随机变量,表明样本均值收敛到期望:而遍历定理适用于具有Markov性的序列,表明时间平均收敛到平稳分布下的期望。两者都揭示了“平均行为的稳定性”,但遍历定理处理的是更一般的Markov依赖的情况。
回顾大数定律:
强遍历定理
常返性和弱遍历定理虽然给出了随Markov链转移状态的渐近规律,但是当\(n\rightarrow\infty\)时,转移概率\(P_{ij}^{(n)}\)的极限情况我们仍然不清楚。先看一个例子。
[!example] Example 6.12(两状态的Markov链III) 考虑Markov链,状态空间为\(\{0,1\}\) ,转移矩阵为
\[P=\left(\begin{array}{cc}1-\alpha&\alpha\\\beta&1-\beta\end{array}\right)\]其中\(\alpha,\beta\in(0,1)\)
转移概率的极限:
即\(\lim\limits_{ n \to \infty }P_{ij}^{(n)}=\pi_{j}\).但是,如果\(\alpha=\beta=1\),即
计算容易发现规律
有
该Markov链正常返,平均返回时间为2。然而,\(\lim\limits_{ n \to \infty }P_{00}^{(n)}\) 和\(\lim\limits_{ n \to \infty }P_{11}^{(n)}\)都不存在
这个例子说明了弱遍历性无法得到\(P_{ij}^{(n)}\) 的极限性质,即
也就是说,对于正常返的Markov链,\(P_{ij}^{(n)}\) 的极限也可能不存在。事实上,状态的周期性对于转移概率的极限是否存在起着关键作用。
这个定理的证明将使用到概率论中的耦合方法(Very Important)
[!NOTE] Theorem 6.13(强遍历定理) 设\(\{X_{n}\}\) 是不可约非周期的Markov链,若\(\pi\)是\(P\)的不变分布, 那么
\[\lim\limits_{n\to\infty}\sum\limits_{j\in E}\lvert P_{ij}^{(n)}-\pi_{j}\lvert=0,\quad\forall i\in E.\]那么自然有
\[\lim\limits_{n\to\infty}P_{ij}^{(n)}=\pi_j\]
Proof
设\(\{X_{n}:n\geqslant0\}\)和\(\{Y_{n}:n\geqslant0\}\)是\(E\) 上以\(P\) 为转移矩阵的相互独立的Markov链,初分布分别为\(\mu\)和\(\nu\)令
Remark:\(Y_{n}\)的存在性需要保证,但是存在性证明比较复杂所以跳过
下面这个构造方法叫做耦合方法(概率论研究的常用方法):
则它为\(E\times E\) 上以\(\mu\times\nu\)为初分布的马氏链,转移矩阵记为
Remark:\(\mu \times \nu\)是乘积测度(Measure Theory)
其中\(\otimes\)表示Kronecker积,即
自行验证\(\overline{P}_{(i,j)(k,l)}^{(n)}=P_{ik}^{(n)}P_{jl}^{(n)}\)
Step1. 证明\(Z_{n}\)不可约非周期
由于\(P\)不可约,所以存在\(N_{1},N_{2}\),使得\(\forall(i,j)(k,l)\in E\times E\)
当\(n>\max\{N_{1},N_{2}\}\)时,
即\(\overline{P}\)不可约。
由于\(P\) 非周期,所以对任意\(i,j\in E\)
那么
即\(\bar{P}\) 非周期。
Step2. \(\overline{P}\)的不变分布为
不难自行验证。
Step3. 证明\(\{X_{n}:n\geqslant0\}\)与\(\{Y_{n}:n\geqslant0\}\)迟早相遇。
因为\(P\)不可约且存在不变分布,那么\(Z_{n}\) 是常返的。令
它是\(\{X_{n}:n\geqslant0\) 与\(\{Y_{n}:n\geqslant0\}\) 的相遇时刻,即\(\{Z_{n}:n\geqslant0\}\)首达对角线
的时间,他不会超过\(Z_{n}\)首达某个具体状态\((i,i)\) 的时间,即
由于\(Z_n\)常返,所以
那么\(P(\tau<\infty)=1\)
Step4. 证明在\(\{X_{n}:n\geqslant0\}\)与\(\{Y_{n}:n\geqslant0\}\)相遇之后,它们有同样的分布(unbelievable),即
假设\(\{X_{n}:n\geqslant0\}\) 与\(\{Y_{n}:n\geqslant0\}\) 在时刻\(m\) 相遇于状态\(i\)。
直观上,那么从时刻\(m\)开始重新计时的话,它们都是从\(i\)出发以\(P\) 为转移矩阵的马氏链,从而它们在任何时刻有相同的分布。严格的证明如下:
注意到
把\(m\)视为现在的时间,由\(Z_{n}\)的Markov性
所以
同理,
因此\(P(X_{n}=j,\tau\leqslant n)=P(Y_{n}=j,\tau\leqslant n).\)
Step5. 注意到
于是
特别地,取\(X_{n}\)和\(Y_{n}\)的初分布分别为\(\mu=\delta_{i}(Dirac\ mass)\)和\(\nu=\pi\),那么
定理即证。
注1.不可约Markov链中,非周期正常返的状态称为遍历态(Ergodic state)
注2.这里构造\(Z_{n}\) 的方法称为耦合方法(Coupling Method),是概率论中非常重要的证明方法,由于\(X_{n}\) 和\(Y_n\) 是独立的,这种特殊的耦合称为独立耦合。一般地,两个概率分布\(\mu\) 和\(\nu\)的耦合(Coupling)定义为同一个概率空间上的一对随机变量\((X,Y)\) ,满足
注3.还可以通过更新定理证明,参考《随机过程及其应用》,陆大䋮,张颢,清华大学出版社 定理7.3。
定理6.13讨论了正常返、非周期情形\(P_{ij}^{(n)}\)的极限,对于其他情况可以总结为下面定理。
[!NOTE] Theorem 6.14 \(\{X_{n}\}\) 是不可约常返的Markou链,那么
(1)若j是零常返状态,则
\[\lim_{n\to\infty}P_{ij}^{(n)}=0;\](2)若\(j\) 是正常返周期状态,周期为\(d_{j}\) ,则
\[\begin{aligned}\lim_{n\to\infty}P_{ij}^{(nd_j)}=\frac{d_j}{\mu_{jj}}\end{aligned}\]其中\(\mu_{jj}\triangleq\sum\limits_{n=1}^{\infty}nf_{ij}^{(n)}\) 为平均返回时间。
书上的例子留作阅读学习作业。
不可约Markov链的分类总结如下:
- 不可约
- 常返
- 正常返\(\iff\)有不变分布
- \(P_{ij}^{(n)}\to \pi_{j}\)(非周期)
- \(\frac{1}{n}\sum\limits_{k=0}^{n}P_{ij}^{(k)}\to \pi_{j}\)(周期)
- 零常返:\(P_{ij}^{(n)}\to 0\)
- 正常返\(\iff\)有不变分布
- 非常返:\(P_{ij}^{(n)}\to 0\)
- 常返