Lecture 4 - Discrete-time Markov Chains¶

约 2162 个字预计阅读时间 7 分钟

Syllabus

Markou链
Chapman-Kolmogorou方程
不变分布

HW2

Sheldon Ross 2.5 2.8 2.17 2.20 2.29 2.36

离散时间Markov链¶

Defnition4.1 (离散时间Markov链)

设\(E\) 是一个可数集合，不妨为\(\mathbb{N}^{+}=\{1,2,\ldots\}\) 。称状态空间为\(E\) 的离散时间随机过程\(\{ X_{n}\), \(n= 0, 1, 2, \ldots \}\) 为一个(离散时间)Markou链，如果对于任意\(n\geq0\) ，任意状态\(i_0,i_1,\ldots,i_{n-1},i,j\in E\) ，有Markou性(4.1)：

\[ \begin{aligned} &P\{X_{n+1}=j|X_n=i,X_{n-1}=i_{n-1},\dots,X_1=i_1,X_0=i_0\}\\ =&P\{X_{n+1}=j|X_n=i\} \end{aligned} \]

成立。

称\(P(n,i;n+1,j)\) 为时刻\(n\)处于状态\(i\),时刻\(n+1\)转移到状态的转移函数。若它与\(n\) 无关，则记为\(P_{ij}\) ，此时称\(\{X_n\}\) 为一个时齐Markou链，矩阵\(P=(P_{ij})_{i,j\in E}\) 称为一步转移矩阵。我们之后都考虑时齐Markou链。

注1.Markov性(4.1)等价于(4.2)

\[\begin{aligned} &P\{X_{n+1}=j,X_{n-1}=i_{n-1},\dots,X_{0}=i_{0}|X_{n}=i\}\\ =&P\{X_{n+1}=j|X_n=i\}\cdot P\{X_{n-1}=i_{n-1},\dots,X_0=i_0|X_n=i\} \end{aligned}\]

即验证：

\[P(C\mid BA)=P(C\mid B)\Leftrightarrow P(CA\mid B)=P(C\mid B)P(A\mid B)\]

其中A表示“过去”，B表示“现在”， \(C\) 表示“未来”，用条件概率的初等定义即可验证。

(4.2)说明Markov性等价于在已知“现在”的条件下，“过去”和“未来”是独立的。

注2.Markov性(4.1)还等价于(4.3)

\[P(X_0=i_0,X_1=i_1,\cdots,X_n=i_n)=P(X_0=i_0)\prod_{k=1}^nP(k-1,i_{k-1};k,i_k).\]

(4.3)有的地方称为链式法则(chainrule)。可以看出，Markov链的有限维联合分布由初始分布和转移函数决定，在时齐情形，

\[P(X_0=i_0,X_1=i_1,\cdots,X_n=i_n)=P(X_0=i_0)\prod_{k=1}^nP_{i_{k-1}i_k}.\]

注3.若矩阵\(P=(P_{ij})_{i,j\in E}\) 满足：

\[P_{ij}\geq0,\quad i,j\in E\]

\[\displaystyle\sum_{j\in E}P_{ij}=1,\quad\forall i\in E\]

则称\(P\) 为\(E\) 上的转移矩阵（transitionmatrix)/随机矩阵(stochasticmatrix，注意和randon matrix的区分).称\(P_{ij}\) 为从状态到的转移概率。

例子¶

Example4.2 (一维简单随机游走)

考虑一个在Z上运动的粒子，它每一次等可能地向左或向右移动一步，即

\[P_{i,i+1}=P_{i,i-1}=\frac{1}{2},\quad\forall i\in\mathbb{Z}.\]

粒子在Z上的位置为一个随机过程，称为一维简单随机游走。

我们也可以用独立地抛一枚公平的硬币的随机试验来刻画这个模型：每次抛到正面则让粒子往右走(位置加1)，抛到反面则让粒子往左走(位置减1)。

我们还可以用随机变量序列来进行刻画，假设\(\xi_{1},\xi_{2},\ldots\) .独立同分布于

\[P(\xi_1=1)=P(\xi_1=-1)=\frac{1}{2}.\]

假设\(S_{0}\) 为取整数值的随机变量，且它独立于\(\xi_{1},\xi_{2},\ldots\) ，令

\[S_n:=S_0+\xi_1+\cdots+\xi_n=S_{n-1}+\xi_n.\]

那么\(S_{n}\) 为从\(S_{0}\) 出发的一维简单随机游走。

\(\xi_{n}\) 可以服从更一般的分布，此时， \(S_n\) 称为一般随机游走。

Example4.3 (Ehrenfest模型)

在统计热力学的研究中，一个经典的模型是Ehrenfest模型，用来模拟气体分子在两个容器中的扩散过程。考虑甲乙两个容器，其中总共的气体分子为\(N\) 。假设单位时间内，有且只有一个分子在甲乙两个容器之间扩散，扩散的分子是随机选取的。

记n时间后甲容器内的气体分子数为\(X_{n}\) ，则\(X_{n}\)是一个状态空间为\(E=\{0,1,\ldots,N\}\) 的离散时间Markou链，转移概率为

\[P\left(X_{n+1}=j|X_n=i\right)=\left\{\begin{array}{cc}1-\frac{i}{N},&j=i+1\\\frac{i}{N},&j=i-1\\0,&|j-i|\ne1\end{array}\right.\]

直观上，如果一开始甲容器里没有气体分子，经过自由扩散，两个容器中的气体分子数量应该会趋于一致。这本质上是热力学第二定律描述的熵增现象，说明在封闭系统中，微观随机行为会导致宏观熵的增加。

Example4.4 (图上的随机游走)

设\(\mathcal{G}=(\mathcal{V},\mathcal{E})\) 为一个图，对于节点\(,j\in\mathcal{V}\) ，如果\((i,j)\in\) \(\varepsilon\) ，则称节点i， \(j\) 相邻，记为\(i\sim j\)

考虑一个位置位于图上节点的粒子，它每次随机地移动到相邻节点上。记\(X_{n}\) 为它在时刻\(n\) 所处的位置，则\(\{X_n\}\) 是一个状态空间为V的离散时间Markov链，转移概率为

\[P_{ij}=\begin{cases}\frac{1}{\deg(i)}&\text{if}j\sim i,\\[2ex]0&otherwise.\end{cases}\]

其中\(\deg(i)\) 为节点i的度（degree)，表示节点i相邻的节点的数目。

Chapman-Kolmogorov方程¶

记时齐Markov链的n步转移概率为

\[P_{ij}^{(n)}=P\{X_{n+m}=j|X_{m}=i\},\quad n\ge0,\quad i,j\ge0.\]

Proposition 4.5 (Chapman-Kolmogorov方程 CK-Equation)

对任意\(i,j\in E,m,n\geqslant0\)

\[P_{ij}^{(n+m)}=\sum_{k\in E}P_{ik}^{(n)}P_{kj}^{(m)}\]

注：实际是一个例子，由于重要性记为Prop.

Proof.

\[\begin{aligned} P_{ij}^{(n+m)}& =P\{X_{n+m}=j|X_{0}=i\} \\ &=\sum_{k\in E}P\{X_{n+m}=j,X_{n}=k|X_{0}=i\} \\ &=\sum_{k\in E}P\{X_{n+m}=j|X_{n}=k,X_{0}=i\}P\{X_{n}=k|X_{0}=i\} \\ &\overset{Markov}{=}\sum_{k\in E}P_{kj}^{(m)}P_{ik}^{(n)}. \end{aligned}\]

记\(P^{(n)}\) 为n步转移矩阵，则由Chapman-Kolmogorov方程

\[P^{(n+m)}=P^{(n)}\cdot P^{(m)},\]

其中\(\cdot\)为矩阵乘法，那么

\[P^{(n)}=P\cdot P^{(n-1)}=P\cdot P\cdot P^{(n-2)}=\cdots=P^{n}.\]

Example4.6 (两状态的Markov链 \(I\))

设离散时间Markov 链的样本空间只有两个状态。一步转移概率矩阵为

\[P=\left(\begin{array}{cc}1-\alpha&\alpha\\\beta&1-\beta\end{array}\right)\]

其中\(\alpha,\beta\in(0,1)\) 。

我们想要计算它的n步转移矩阵，由Chapman-Kolmogorou方程，只需要计算\(P^{n}\) 。做特征值分解,\(P\)的两个特征值为

\[\lambda_0=1,\quad\lambda_1=1-\alpha-\beta \]

可得

\[P=\frac{1}{\alpha+\beta}\left(\begin{array}{cc}1&\alpha\\1&-\beta\end{array}\right)\begin{pmatrix}1&0\\0&1-\alpha-\beta\end{pmatrix}\begin{pmatrix}\beta&\alpha\\1&-1\end{pmatrix}\]

那么

\[\begin{gathered} P^{n} =\frac{1}{\alpha+\beta}\left(\begin{array}{cc}{1}&{\alpha}\\{1}&{-\beta}\end{array}\right)\left(\begin{array}{cc}{1}&{0}\\{0}&{(1-\alpha-\beta)^{n}}\end{array}\right)\left(\begin{array}{cc}{\beta}&{\alpha}\\{1}&{-1}\end{array}\right) \\ =\frac{1}{\alpha+\beta}\left(\begin{array}{cc}\beta&\alpha\\\beta&\alpha\end{array}\right)+\frac{(1-\alpha-\beta)^{n}}{\alpha+\beta}\left(\begin{array}{cc}\alpha&-\alpha\\-\beta&\beta\end{array}\right) \end{gathered}\]

注意到，随着\(n\to\infty\), \(n\) 步转移概率存在极限

\[\lim\limits_{n\to\infty}P_{00}^{(n)}=\lim\limits_{n\to\infty}P_{10}^{(n)}=\frac{\beta}{\alpha+\beta}\]

\[\lim\limits_{n\to\infty}P_{11}^{(n)}=\lim\limits_{n\to\infty}P_{01}^{(n)}=\frac{\alpha}{\alpha+\beta}\]

这是我们之后要学习的遍历性。

思考

如果\(|1-\alpha-\beta|=1\) ，即\(\alpha=\beta=1\) 时会发生什么？

不变分布¶

之前我们关心Markov链的转移概率,但\(X_{n}\) 作为一个随机变量,我们也关心它分布的变化,设\(\{X_n\}\) 是一个转移矩阵为\(P\)的Markov链,初始分布为\(X_{0}\sim\mu\) ，则\(X_{1}\) 的分布列为

\[\begin{aligned} P(X_{1}=j) &=\sum_{k\in E}P(X_{0}=k)P(X_{1}=j|X_{0}=k) \\ &=\sum_{k\in E}\mu_{k}P_{kj},\quad j\in E \end{aligned}\]

把分布\(\mu\) 视为状态空间\(E\)上的行向量，那么\(X_{1}\) 的分布\(\mu_{1}\)为\(\mu P\),自然地,\(X_n\) 的分布为\(\mu P^{(n)}=\) \(\mu P^{n}\)

Definition4.7 (不变测度)

设\(\pi=\{\pi_{i},i\in E\}\) 为\(E\) 上的测度，若π满足不变方程

\[\pi_j=\sum_{k\in E}\pi_kP_{kj},\quad\forall j\in E\]

则称\(\pi\)为\(P\)的不变测度(inwariant measure)。进一步，若\(\sum\limits _{i\in E}\pi _{i}=1\)，则称\(\pi\)为不变分布。也称\(\pi\)为以\(P\)为转移矩阵的Markov链的不变测度。

这也可以理解为是收敛性的一种体现

注1．显然\(\pi_{i}=0,\forall i\in E\)是一个平凡的不变测度。若π是非平凡的，且\(\sum\limits_{i\in E}\pi_{i}<\infty\) 的不变测度，那么我们总可以将其归一化得到不变分布.

\[\frac{\pi_i}{\sum\limits_{k\in E}\pi_k},\quad i\in E\]

注2.设\(\pi\)为不变分布，如果\(X_0\sim\pi\),那么(4.4)

\[(X_0,X_1,\cdots,X_n)\overset{d}{=}(X_m,X_{m+1},\cdots,X_{m+n})\:,\quad\forall n,m\geqslant1.\]

满足(4.4)的随机过程称为平稳过程(Stationary Process)，即任何时刻\(m\)作为起点，相同时间间隔\(n\)随机过程的有限维分布都是相同的。因此不变分布π也被称为平稳分布(Stationary Distribution).

注意与平稳增量过程做对比(Stationary Crements)

注3．若E是有限的，把π视为行向量，不变分布π就是矩阵P的特征值为1的左特征向量，于是我们可以通过解线性方程组

\[\pi=\pi P\]

来求不变分布。

注4．一般而言，Markov链可以没有不变分布，例如一维简单随机游动（思考一下)；也可以有多个不变分布，例如以单位矩阵为转移矩阵的Markov链，或者一个非平凡的例子：转移矩阵为

\[P=\begin{pmatrix}0&1&0&0\\[1ex]1&0&0&0\\[1ex]0&0&0&1\\[1ex]0&0&1&0\end{pmatrix}\]

的Markov链，它的不变分布为

\[\begin{pmatrix}\frac{\alpha}{2},\frac{\alpha}{2},\frac{\beta}{2},\frac{\beta}{2}\end{pmatrix},\quad\alpha,\beta\geqslant0,\alpha+\beta=1\]

有无穷多个。

Markov链研究中的一个基本问题是确定所有的不变分布。

有下列几个自然的问题：
1.不变分布在什么条件下存在？
2.假设不变分布存在，那么它在什么条件下是唯一的？在什么条件下\(\mu\mathbf{P}^{n}\) 收敛到不变分布？
3.如果\(\mu\mathbf{P}^{n}\) 收敛到不变分布，那么收敛速度有多快(Design of algorithm)？

我们在后面的学习中会回答这些问题。

Example4.8(两状态的Markov链 \(II\))

考虑状态空间为\(\{0,1\}\) ，转移矩阵为

\[P=\left(\begin{array}{cc}1-\alpha&\alpha\\\beta&1-\beta\end{array}\right)\]

的Markov链，它的不变分布\(\pi\) 满足：

\[\begin{array}{c}\pi_0(1-\alpha)+\pi_1\beta=\pi_0\\ \pi_0\alpha+\pi_1(1-\beta)=\pi_1\end{array}\]

结合\(\pi_{0}+\pi_{1}=1\) ，可以解得

\[\pi_0=\frac{\beta}{\alpha+\beta},\pi_1=\frac{\alpha}{\alpha+\beta}.\]

思考

\[\lim\limits_{n\to\infty}P^{(n)}=\frac{1}{\alpha+\beta}\left(\begin{array}{cc}\beta&\alpha\\\beta&\alpha\end{array}\right)=\left(\begin{array}{c}\pi\\\pi\end{array}\right).\]

回顾转移概率的极限和不变分布之间有什么关系呢？

Recall: 与前文的两状态Markov链\(I\)中的不变分布的极限值相等，我们不免思考其中是否存在什么联系？

Lecture 4 - Discrete-time Markov Chains¶

离散时间Markov链¶

例子¶

Chapman-Kolmogorov方程¶

不变分布¶

评论