Lecture 4 - Discrete-time Markov Chains¶
约 2162 个字 预计阅读时间 7 分钟
Syllabus
- Markou链
- Chapman-Kolmogorou方程
- 不变分布
HW2
Sheldon Ross 2.5 2.8 2.17 2.20 2.29 2.36
离散时间Markov链¶
Defnition4.1 (离散时间Markov链)
设\(E\) 是一个可数集合,不妨为\(\mathbb{N}^{+}=\{1,2,\ldots\}\) 。称状态空间为\(E\) 的离散时间随机过程\(\{ X_{n}\), \(n= 0, 1, 2, \ldots \}\) 为一个(离散时间)Markou链,如果对于任意\(n\geq0\) ,任意状态\(i_0,i_1,\ldots,i_{n-1},i,j\in E\) ,有Markou性(4.1):
成立。
称\(P(n,i;n+1,j)\) 为时刻\(n\)处于状态\(i\),时刻\(n+1\)转移到状态的转移函数。若它与\(n\) 无关,则记为\(P_{ij}\) ,此时称\(\{X_n\}\) 为一个时齐Markou链,矩阵\(P=(P_{ij})_{i,j\in E}\) 称为一步转移矩阵。我们之后都考虑时齐Markou链。
注1.Markov性(4.1)等价于(4.2)
即验证:
其中A表示“过去”,B表示“现在”, \(C\) 表示“未来”,用条件概率的初等定义即可验证。
(4.2)说明Markov性等价于在已知“现在”的条件下,“过去”和“未来”是独立的。
注2.Markov性(4.1)还等价于(4.3)
(4.3)有的地方称为链式法则(chainrule)。可以看出,Markov链的有限维联合分布由初始分布和转移函数决定,在时齐情形,
注3.若矩阵\(P=(P_{ij})_{i,j\in E}\) 满足:
则称\(P\) 为\(E\) 上的转移矩阵(transitionmatrix)/随机矩阵(stochasticmatrix,注意和randon matrix的区分).称\(P_{ij}\) 为从状态到的转移概率。
例子¶
Example4.2 (一维简单随机游走)
考虑一个在Z上运动的粒子,它每一次等可能地向左或向右移动一步,即
粒子在Z上的位置为一个随机过程,称为一维简单随机游走。
我们也可以用独立地抛一枚公平的硬币的随机试验来刻画这个模型:每次抛到正面则让粒子往右走(位置加1),抛到反面则让粒子往左走(位置减1)。
我们还可以用随机变量序列来进行刻画,假设\(\xi_{1},\xi_{2},\ldots\) .独立同分布于
假设\(S_{0}\) 为取整数值的随机变量,且它独立于\(\xi_{1},\xi_{2},\ldots\) ,令
那么\(S_{n}\) 为从\(S_{0}\) 出发的一维简单随机游走。
\(\xi_{n}\) 可以服从更一般的分布,此时, \(S_n\) 称为一般随机游走。
Example4.3 (Ehrenfest模型)
在统计热力学的研究中,一个经典的模型是Ehrenfest模型,用来模拟气体分子在两个容器中的扩散过程。考虑甲乙两个容器,其中总共的气体分子为\(N\) 。假设单位时间内,有且只有一个分子在甲乙两个容器之间扩散,扩散的分子是随机选取的。
记n时间后甲容器内的气体分子数为\(X_{n}\) ,则\(X_{n}\)是一个状态空间为\(E=\{0,1,\ldots,N\}\) 的离散时间Markou链,转移概率为
直观上,如果一开始甲容器里没有气体分子,经过自由扩散,两个容器中的气体分子数量应该会趋于一致。这本质上是热力学第二定律描述的熵增现象,说明在封闭系统中,微观随机行为会导致宏观熵的增加。
Example4.4 (图上的随机游走)
设\(\mathcal{G}=(\mathcal{V},\mathcal{E})\) 为一个图,对于节点\(,j\in\mathcal{V}\) ,如果\((i,j)\in\) \(\varepsilon\) ,则称节点i, \(j\) 相邻,记为\(i\sim j\)
考虑一个位置位于图上节点的粒子,它每次随机地移动到相邻节点上。记\(X_{n}\) 为它在时刻\(n\) 所处的位置,则\(\{X_n\}\) 是一个状态空间为V的离散时间Markov链,转移概率为
其中\(\deg(i)\) 为节点i的度(degree),表示节点i相邻的节点的数目。
Chapman-Kolmogorov方程¶
记时齐Markov链的n步转移概率为
Proposition 4.5 (Chapman-Kolmogorov方程 CK-Equation)
对任意\(i,j\in E,m,n\geqslant0\)
注:实际是一个例子,由于重要性记为Prop.
Proof.
记\(P^{(n)}\) 为n步转移矩阵,则由Chapman-Kolmogorov方程
其中\(\cdot\)为矩阵乘法,那么
Example4.6 (两状态的Markov链 \(I\))
设离散时间Markov 链的样本空间只有两个状态。一步转移概率矩阵为
其中\(\alpha,\beta\in(0,1)\) 。
我们想要计算它的n步转移矩阵,由Chapman-Kolmogorou方程,只需要计算\(P^{n}\) 。做特征值分解,\(P\)的两个特征值为
可得
那么
注意到,随着\(n\to\infty\), \(n\) 步转移概率存在极限
这是我们之后要学习的遍历性。
思考
如果\(|1-\alpha-\beta|=1\) ,即\(\alpha=\beta=1\) 时会发生什么?
不变分布¶
之前我们关心Markov链的转移概率,但\(X_{n}\) 作为一个随机变量,我们也关心它分布的变化,设\(\{X_n\}\) 是一个转移矩阵为\(P\)的Markov链,初始分布为\(X_{0}\sim\mu\) ,则\(X_{1}\) 的分布列为
把分布\(\mu\) 视为状态空间\(E\)上的行向量,那么\(X_{1}\) 的分布\(\mu_{1}\)为\(\mu P\),自然地,\(X_n\) 的分布为\(\mu P^{(n)}=\) \(\mu P^{n}\)
Definition4.7 (不变测度)
设\(\pi=\{\pi_{i},i\in E\}\) 为\(E\) 上的测度,若π满足不变方程
则称\(\pi\)为\(P\)的不变测度(inwariant measure)。进一步,若\(\sum\limits _{i\in E}\pi _{i}=1\),则称\(\pi\)为不变分布。也称\(\pi\)为以\(P\)为转移矩阵的Markov链的不变测度。
这也可以理解为是收敛性的一种体现
注1.显然\(\pi_{i}=0,\forall i\in E\)是一个平凡的不变测度。若π是非平凡的,且\(\sum\limits_{i\in E}\pi_{i}<\infty\) 的不变测度,那么我们总可以将其归一化得到不变分布.
注2.设\(\pi\)为不变分布,如果\(X_0\sim\pi\),那么(4.4)
满足(4.4)的随机过程称为平稳过程(Stationary Process),即任何时刻\(m\)作为起点,相同时间间隔\(n\)随机过程的有限维分布都是相同的。因此不变分布π也被称为平稳分布(Stationary Distribution).
注意与平稳增量过程做对比(Stationary Crements)
注3.若E是有限的,把π视为行向量,不变分布π就是矩阵P的特征值为1的左特征向量,于是我们可以通过解线性方程组
来求不变分布。
注4.一般而言,Markov链可以没有不变分布,例如一维简单随机游动(思考一下);也可以有多个不变分布,例如以单位矩阵为转移矩阵的Markov链,或者一个非平凡的例子:转移矩阵为
的Markov链,它的不变分布为
有无穷多个。
Markov链研究中的一个基本问题是确定所有的不变分布。
有下列几个自然的问题:
1.不变分布在什么条件下存在?
2.假设不变分布存在,那么它在什么条件下是唯一的?在什么条件下\(\mu\mathbf{P}^{n}\) 收敛到不变分布?
3.如果\(\mu\mathbf{P}^{n}\) 收敛到不变分布,那么收敛速度有多快(Design of algorithm)?
我们在后面的学习中会回答这些问题。
Example4.8(两状态的Markov链 \(II\))
考虑状态空间为\(\{0,1\}\) ,转移矩阵为
的Markov链,它的不变分布\(\pi\) 满足:
结合\(\pi_{0}+\pi_{1}=1\) ,可以解得
思考
回顾转移概率的极限和不变分布之间有什么关系呢?
Recall: 与前文的两状态Markov链\(I\)中的不变分布的极限值相等,我们不免思考其中是否存在什么联系?