• 随机变量是其值随机会而定的变量,一个随机试验有许多可能的结果,到底出现哪一个要看机会,有一定的概率,在试验前,我们不能预知它取何值,试验后,取值就定了

    • 实际上就是用随机变量来表示一个随机试验可能出现的结果
    • 比如:在某厂大批产品中随机抽出100个,其中所含废品数$X​$
    • 一个月内某交通路口的事故数$X$
    • 考虑一个打靶的试验,其命中位置由坐标($X,Y$)刻画,$X,Y$都是随机变量。而$(X,Y)$称为一个二维随机向量或者二维随机变量,多维随机向量$(X_1,X_2,…X_n)$ 的意义据此推广
  • 离散型随机变量:取有限或无限个值,但可以一个一个毫无遗漏,逐一排列出来

    • 在某厂大批产品中随机抽出100个,其中所含废品数$X
  • 连续型随机变量:可能取值无穷多,且不能一个一个毫无遗漏,逐一排列出来

    • 比如称重一个物体重量的误差,如果没有指定范围,则取值就是$(-\infty,+\infty)$
    • 电视机的寿命$(0,+\infty)$
    • 连续是一个数学上的抽象,实际上任何量都有一定单位,只能在该单位下量到一定程度,故必然是离散的,当单位极小时,在某一范围内可能会非常密集,不如视为连续量更好处理
  • 概率分布

    • 研究一个随机变量,不仅仅是看它能取哪些值,更要看取各种值的概率
    • 概率分布是指概率1在可能值集合$\{a_1,a_2,…\}$上的分布情况,称作随机变量$X$的概率分布
      • 也就是说概率分布描述了随机变量取各种值的概率
      • 有许多种表示概率分布的形式。比如分布律,概率分布函数,概率密度函数。不同类型变量采用不同的描述概率分布的形式,主要是怎么方便怎么来!关键是这些描述的都是概率分布!
  • 离散型随机变量:用分布律来表示,更方便的是概率分布函数$F(x)=P(X\le x)$

    • 二项分布$B(n,p)$
    • 泊松分布$P(\lambda)$
    • 超几何分布
    • 负二项分布
  • 连续型随机变量:变量的取值充满一个区间,无法一一排出,若指定一个数$a$ 则变量$X$恰好是$a$ 丝毫不差是不可能的,

    • 例在靶子上指定一个点,射击时恰好命中该点的概率是0!!

    • 刻画连续型随机变量概率分布最好用的就是概率密度函数

      • 概率密度函数$f(x)=F’(x)$
      • 概率密度函数可以用面积描述x落在某个区间的概率,而概率分布函数则不容易直观看出
    • 正态分布

      • 首先!正态分布是一种分布,刻画随机变量$X$取各种可能值的概率,也可以说是概率1在可能值集合上的分布情况。
      • 正态分布常用概率密度函数来描述!!
      • 如果说一个随机变量具有如下概率密度函数,那么我们就说这个$X$具有正态分布,或者说服从正态分布,记为$X\sim{N(\mu,\sigma^2)}$
    • 指数分布

    • 威布尔分布

    • 均匀分布

  • 多维随机变量(随机向量)

    • 设$X=(X_1,X_2,…,X_n)$ 为一个$n$维向量,其每个分量是一个一维随机变量,则$X$是一个$n$维随机变量(随机向量)
    • 多维离散型随机变量的分布
      • 多维离散型随机变量:每个分量是一维离散型随机变量
      • 多维离散型随机变量的概率分布:可以把所有情况列举出来即可
        • $P(X_1=2,X2=1)=1/3$, $P(X_1=2,X_2=2.5)=1/4$,$P(X_1=5,X_2=3)=5/12$
        • 上面这个就叫概率分布!!不用拘泥于形式!因为概率分布就是在描述随机变量取不同可能值的概率
      • 多项分布
    • 连续型随机向量的分布
      • 设$X=(X_1,X_2,…,X_n)$ 是一个$n$维随机向量,其取值可视为$n$维欧式空间$\mathbb{R}^n$ 中的一个点,如果X的全部取值能充满$\mathbb{R}^n$ 中的一个区域,则称它是连续型的。
      • 描述多维随机向量的概率分布,最方便是的概率密度函数,分布函数极少用
      • 二维正态分布
      • 几点事项:
        • 连续型的随机变量不能简单定义为分量是连续型,见书吧。先跳过
    • 边缘分布 和联合分布
      • 设$X=(X_1,…,X_n)​$ 为一个$n​$维随机向量,$X​$有一定的分布$F​$
        • 这个$F$指$X$在取各种情况时的概率
        • 这个$F$也被称作$X_1,…,X_n$ 的联合分布
      • $X$的每个分量$X_i$ 都是一维随机变量,故都具有各自的分布$F_i $
        • 这个$F_i$ 称作$X$或其分布$F$的边缘分布
      • 比如离散型变量的联合分布:$P(X_1=a,X_2=b)$,可以简记作$P(a,b)$
        • 其边缘分布为$P(X_1=a)$ 和$P(X_2=b)$
        • 一般说来:$\forall x\in X, P(X=x)=\sum_y P(X=x, Y=y)$
      • 连续型联合分布与边缘分布:概率密度函数$f(x_1,x_2)$ ,其边缘密度函数为$f_1(x_1)$ ,$f_2(x_2)$
        • 一般说来:$f_\mathbb{x}(x) = \int f(x,y)dy$
      • 注意:联合分布可以导出任一分量的(边缘)分布。但是即使知道了所有分量的分布,则不能决定联合分布。因为边缘分布只考虑单一分量的情况,未涉及分量之间的关系,这个信息是包含在联合分布之内的。
  • 条件概率分布

    • 一个随机向量或者变量的条件概率分布就是,在某种给定条件之下的$X$的概率分布
      • 条件概率分布可以帮我们去研究某个变量对另一个变量的影响,研究变量间的相依关系
    • 条件概率公式可以导出:(X,Y)的联合分布与条件概率分布的关系:$P(X=a,Y=b)=P(Y=b|X=a)P(X=a)$
    • 注意, 必须满足 $P(X=a)>0$, 否则对于永远不会发生的事情讨论条件概率无意义.
    • 基于条件概率, 任意多维随机变量的联合分布都可以写成其中任意一个随机变量的条件概率相乘的形式
    • 比如考虑一个三元分布

      • $P(a,b,c)=P(a|b,c)P(b,c)=P(a|b,c)P(b|c)P(c)$

      • 反正就一步步把这个多元分布分解就好!!!!!

      • $P(c):c$ 发生的概率, 通常已知.
        $P(b|c):c$ 发生的条件下, 观察到 $b$ 的概率, 通常从数据中挖出.

        $P(a|b,c):b,c$同时发生的条件下, 观察到 $a$ 的概率, 通常从数据中挖出.

  • 条件独立

    • 两个随机变量 $X,Y$ 相互独立的数学描述:$P(X, Y)=P(X) P(Y)$ 。记作:$X \perp Y$ 。

    • 两个随机变量 $X,Y$关于随机变量 $Z$条件独立的数学描述:$P(X, Y | Z)=P(X | Z) P(Y | Z)$ 。

      记作:$X \perp Y | Z$ 。