概率论
基本定义
- 样本点$\omega$的全体结果构成的集合成为样本空间,记为$\Omega$,即$\Omega=\lbrace \omega \rbrace$.
- 随机变量定义:在样本空间$\Omega$上的实值函数$X=X(\omega)$,$\omega\in \Omega$,称$X(\omega)$为随机变量,简记$X$
- 分布函数定义:对于任意实数x,记函数$F(x)={X\leq x},-\infty<x<+\infty$,称$F(x)$为随机变量$X$的分布函数
- 离散型随机变量:设离散型随机变量X的可能取值是$x_1,x_2,\cdots,x_n,\cdots$,$X$取各可能值的概率为:$$P{X=x_k}=p_k,k=1,2,\cdots$$
- 随机型随机变量:如果对随机变量$X$的分布函数$F(x)$,存在一个非负可积函数$f(x)$,使得对任意实数$x$,都有$$F\left ( x \right ) =\int_{-\infty}^{x} f\left ( t \right ) dt,-\infty < x<+\infty$$称$X$为连续型随机变量,函数$f(x)$为$X$的概率密度
方差
- 定义:设X是随机变量,如果数学期望$E{[X-E(x)]^2}E{[X−E(x)]2}$存在,则称之为X的方差,记作D(X),即 $$D(X)=E{[X-E(X)]^2}D(X)=E{[X−E(X)]^2}$$
- 方差计算公式:$D(X)=E(X^2)−[E(X)]^2$
- 设X是随机变量,a和b是常数,则有 $D(aX+b)=a^2D(X)$
- 设随机变量X和Y相互独立,则有 $D(X\pm Y)=D(X)+D(Y)$
正态分布
$X\sim N(\mu,\sigma^2)$,其分布函数为 $$F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int^x_{-\infty}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt$$
数理统计
基本定义
如果$X_1,X_2,\cdots,X_n$相互独立且都与总体X同分布,则称$X_1,X_2,\cdots,X_n$为来自总体的简单随机样本,简称为样本。$n$为样本容量,样本的具体观测值$x_1,x_2,\cdots,x_n$称为样本值,或称总体$X$的$n$个独立观测值
数字特征
设$X_1,X_2,\cdots,X_n$是来自总体X的样本,则称
- 样本均值 $\bar{X}=\frac{1}{n}\sum\limits^n_{i=1}X_i$
- 样本方差 $S^2=\frac{1}{n-1}\sum\limits^n_{i=1}(X_i-\bar{X})^2$(有些书认为这个是修正样本方差)
样本标准差 $S=\sqrt{\frac{1}{n-1}\sum\limits^n_{i=1}(X_i-\bar{X})^2}$ - 样本k阶原点距 $A_k=\frac{1}{n}\sum\limits^n_{i=1}X^k_i,k=1,2,A_1=\bar{X}$
- 样本k阶中心距 $B_k=\frac{1}{n}\sum\limits^n_{i=1}(X_i-\bar{X})^k,k=1,2,B_2=\frac{n-1}{n}S^2\neq S^2$
$\chi^2$分布
设随机变量$X_1,X_2,\cdots,X_n$相互独立且均服从标准正态分布$N(0,1)$,则称随机变量$\chi^2=X^2_1+X^2_2+\cdots+X^2_n$服从自由度为$n$的$\chi^2$分布,记作$\chi^2\sim\chi^2(n)$.性质有: - 设$\chi^2\sim\chi^2(n)$,对给定的$a(0<a<1)$,称满足条件 $$P{\chi^2>\chi^2_\alpha(n)}=\int^{+\infty}_{\chi^2_\alpha(n)}f(x)dx=\alpha$$的点$\chi^2_\alpha(n)$为$\chi^2(n)$分布上$\alpha$和$n$,$\chi^2_\alpha(n)$通常通过查表求得
- 设$\chi^2\sim\chi^2(n)$,则$E(\chi^2)=n,D(\chi^2)=2n$
- 设$\chi^2_1\sim\chi^2(n_1),\chi^2_2\sim\chi^2(n_2)$,且$\chi^2_1$和$\chi^2_2$相互独立,则$\chi^2_1+\chi^2_2\sim\chi^2(n_1+n_2)$
t分布
设随机变量X和Y相互独立,$且X\sim N(0,1),Y\sim \chi^2(n)$,则称随机变量$$T=\frac{X}{\sqrt{Y/n}}$$服从自由度为n的t分布,记作$T\sim t(n)$
- t分布的概率密度f(x)是偶函数,即f(x)=f(-x),且当n充分大时,t(n)分布近似于N(0,1)分布
F分布
设随机变量X和Y相互独立,且$X\sim \chi^2(n_1),Y\sim\chi^2(n_2)$,则称随机变量 $$F=\frac{X/n_1}{Y/n_2}$$服从自由度为$(n_1,n_2)$的F分布,记作$F\sim F(n_1,n_2)$,其中$n_1$和$n_2$分别称为第一自由度和第二自由度
如果$F\sim F(n_1,n_2)$,则$\frac{1}{F}\sim F(n_2,n_1)$,且有 $$F_{1-\alpha}(n_1,n_2)=\frac{1}{F_\alpha(n_2,n_1)}$$正态分布抽样
设总体$X\sim N(\mu,\sigma^2),X_1,X_2,\cdots,X_n$是来自总体的样本,样本均值为$\bar{X}$,样本方差为$S^2$ ,则有:
- $\bar{X}\sim N(\mu,\frac{\sigma^2}{n}),U=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)$
- $\bar{X}$与$S^2$相互独立,且$\chi^2=\frac{(n-1)^2S^2}{\sigma^2}\sim \chi^2(n-1)$
- $T=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1)$
- $\chi^2=\frac{1}{\sigma^2}\sum\limits^n_{i=1}(X_i-\mu)^2\sim \chi^2(n)$