信源编码 | 无线通信基础知识

一、信源编码

目的：减少冗余，提高有效性
码的分类：非奇异码、惟一可译码、即时码(前缀码)
码树：如果所有叶子都用了，则有 $|\chi|-1$ 是 $D - 1$ 的整数倍， $|\chi|$ 为消息符号的个数，D为几元字母表，eg: $D={1,2,3},D=3$
Kraft不等式(对于即时码)：
对于D元字母表上的即使码，码字长度 $l_1,l_2....l_{|\chi|}$ 满足以下不等式：
$\sum_{i=1}^{|\chi|}D^{-l_i}\le1$
反之，若给定以上不等式的一组码字长度，存在相对应的即时码，码字长度是给定的长度。
Kraft不等式(对于非奇异码)
对于D元字母表上的即使码，码字长度 $l_1,l_2....l_{|\chi|}$ 满足以下不等式：
$\sum_{i=1}^{|\chi|}D^{-l_i}\le1$
怎么一样？？？
最优码
构建优化问题，目标函数是 $L=\sum p_il_i$ ，限制条件： $\sum D^{-l_I}\le1$ ，利用拉格朗日乘子法将带约束的最小化问题转换为求下式得最小化问题：
$J=\sum p_il_i+\lambda \sum D^{-l_i}$
对码字进行求导等于0：
$\frac{\partial J}{\partial l_i}=p_i-\lambda D^{-l_i}log_eD=0$
$D^{-l_i}=\frac{p_i}{\lambda log_eD} \Longrightarrow \lambda=\frac{1}{log_eD},p_i=D^{-l_i}$
则最优码长：
$l_i^*=-log_Dp_i$
若取码字长度为整数，此时希望的码长：
$L^*=\sum p_il_i=-\sum p_ilog_Dp_i=H_D(X)$
引出以下定理：随机变量X的任一D元即时码的期望长度必定大于或等于熵 $H_D(X)$ ，即 $\ge H_D(X)$ ，当且仅当 $p_i=D^{-l_i}$
最优码的边界：
定理：设 $l_1^*,l_2^*...l_{|\chi|}^*$ 是关于信源分布p和D元字母表的一组最优码长， $L^*$ 为最优码长期望的长度 $L^*=\sum p_il_i$ ，则：
$H_D(X) \le L^*HD(X)≤L∗<HD(X)+1$

note:+1是由于 $log_D{p_i}$ 并不总是整数造成的，可通过扩展将多字符进行分组编码缩减每个字符的附加位。

熵率
定义：当存在如下定义时，随机过程 ${X_i}$ 的熵率为： $H(\chi)=\lim_{n \to \infty} \frac{1}{n}H(X_1,X_2,....,X_n)$
若 ${X_i}$ 是独立同分布i.i.d.则有：
$H(\chi)=\lim_{n \to \infty} \frac{1}{n}nH(X_1)=\lim_{n \to \infty}H(X_1)$
若 ${X_i}$ 不是独立同分布，则有：
$H(\chi)=\lim_{n \to \infty}\frac{1}{n}\sum_{i=1}^nH(X_i)$

二、shannon第一定理 / 无失真信源编码

定义 $L_n$ 为输入字符期望码字长度，设 $l(x_1,x_2,...,x_n)$ 是与 $x_1,x_2,...,x_n)$ 相应的二级制码字长度，则有：
$L_n=\frac{1}{n}\sum p(x_1,x_2,...,x_n)l(x_1,x_2,...,x_n)=\frac{1}{n}E[l(x_1,x_2,...,x_n)]$
则有最优码的界应用此编码
$H(x_1,x_2,...,x_n)\le E[l(x_1,x_2,...,x_n)]\le H(x_1,x_2,...,x_n)+1$
由于 $x_1,x_2,...,x_n$ 是统计独立同分布的i.i.d，则有：
$H(x_1,x_2,...,x_n)=\sum H(x_i)=nH(X)\Rightarrow H(X)\le L_nH(x1,x2,...,xn)=∑H(xi)=nH(X)⇒H(X)≤Ln<H(X)+n1$

$n\to \infty$ 时，每字符期望长度趋于熵率 $H(\chi)$ .

三、Shannon码和Huffman码

Shnanon码
码字长度分配 $l(x)=\lceil log\frac{1}{q(x)}\rceil$ 关于p(x)的期望码长，满足
$H(p)+D(p||q)\le E_pl(x)H(p)+D(p∣∣q)≤Epl(x)<H(p)+D(p∣∣q)+1$
Huffman码
D元码要先验证信源数目是否充足，即 $|\chi|-1$ 是否为D-1的整数倍，要求 $\lceil \frac{|\chi|-1}{D-1}\rceil$ ，若不是整数倍，需要加一个虚拟符号

$\chi$ 是消息个数，D是D元码。

Huffman码的最优性
满足以下条件，即为最优码：

长度序列与按概率分布排列的次序相反，即若 $p_j>p_k$ ，则 $l_jlj<lk$

Shannon码的竞争最优性
设 $l (x)$ 为Shannon码的相应码字长度， $l^{'} (x)$ 表示其他唯一可译码的相应码字长度，则 $Pr(l(x)\ge l'(x)+c)\le\frac{1}{2^{(c-1)}}$
eg： $l^{'} (x)$ 比 $l (x)$ 短5bit，或更多的概率不超过 $\frac{1}{16}$
Shannon码长 $L_s$ 和Huffman码长 $L^*$ 关系
$H(X)\le L^*\le L_sH(X)≤L∗≤Ls<H(X)+1$

相关阅读:
✨✨✨if __name__ == “__main__“ 在 Python 中意味着什么？
什么是智能合约？新手入门指南
线程的创建方式4：使用线程池
【补充知识】生成模型（generative model）和判别模型（discriminative model）、贝叶斯学派和概率学派
三维模型3DTile格式轻量化压缩处理工具常用几款软件介绍
Qt creator生成动态库
SpringBoot读取配置的方式
C#编程模式之桥接模式(Bridge)
SpringCloud：Feign实现微服务之间相互请求
Leetcode-160 相交链表

原文地址：https://blog.csdn.net/Summer789111/article/details/132729507