常见分布

离散

连续

P-stable Distributions

p_stable distribution:随机变量 $\sum_i v_i X_i$ 、随机变量 $(\sum_i |v_i|^p)^{1/p} X$ 具有相同的分布

  • $v_1, v_2, \cdots, v_n$:任意实数
  • $X_1, X_2, \cdots, X_n$:独立同分布$D$随机变量
  • $X$:服从分布$D$随机变量
  • $\forall p \in (0, 2]$,稳定分布存在,但仅$p=1,2$时,有解析解

    • $p=1$:柯西分布

    • $p=2$:高斯分布

  • 可以从$[0,1]$上均匀分布获得稳定分布

    • 但是概率分布、密度函数没有解析解

性质、用途

  • 若向量 $a$ 中每个元素独立从 p-stable 分布中抽取,则 $|v|_p X = (\sum_i |v_i|^p)^{1/p} X$ 和 $$ 同分布
    • 可用较好计算的内积估计 $|v|_p$
    • 考虑到 $a(v_1 - v_2) = av_1 - av_2$,将内积和点之间 $L_p$ 范数距离 $|v_1 - v_2|_p$ 相联系

Exponential Family of Distributions

单变量指数分布概率密度/分布

  • $\eta(\theta)$:nutural parameter,自然参数
  • $h(x)$:underlying measure,底层观测值
  • $T(x)$:sufficient statistic,随机变量X的充分统计量
  • $A(\theta)$:log normalizer,对数规范化
  • $\eta(\theta), T(x)$:可以是向量,其内积仍为实数

  • $\eta(\theta) = \theta$时,称分布族为canonical形式

    • 总是能够定义$\eta = \eta(\theta)$转为此形式
  • 对数规范化$A(\theta)$使得概率密度函数满足积分为1

性质

  • 充分统计量$T(x)$可以使用固定几个值,从大量的独立同分布 数据中获取信息

    todo

Bernoulli分布

  • $h(x) = 1$
  • $T(x) = x$
  • $\eta = log \frac \theta {1 - \theta}$
  • $A(\theta) = ln(1+e^{\theta})$

Possion

  • $\theta = \lambda$
  • $h(x) = \frac 1 {x!}$
  • $\eta(\theta) = ln\lambda$
  • $T(x) = x$
  • $A(\theta) = \lambda$

Normal

  • $h(x) = \frac 1 {\sqrt{2\pi\sigma^2}} e^{-\frac {x^2} {2\sigma^2}}$
  • $T(x) = \frac x \sigma$
  • $A(\theta) = \frac {\mu^2} {2\sigma^2}$
  • $\eta(\theta) = \frac \mu \sigma$