总体与样本
总体与个体
总体: 统计问题中研究对象的全体. 通常为实际问题中研究的特定指标, 如全国大学生的身高. 只关心身高数据, 而不关心体重、成绩等.
个体: 构成总体的每个成员.
根据分布和元素个数对总体分类:
根据分布$\begin{cases} \t{正态分布总体}\\ \t{指数分布总体}\\ \vdots\\ \t{非参数总体 (分布未知)} \end{cases}$ 元素个数$\begin{cases} \t{有限总体}\\ \t{无限总体}\\ \end{cases}$
样本
样本: 从总体中随机抽取 $n$ 个个体, 记其指标值为 $x_1,x_2,\ldots,x_n$, 则称 $x_1,x_2,\ldots,x_n$ 为总体的一个(组)样本, $n$ 为样本容量, 简称为样本量, 样本中的个体称为样品.
样本二重性$\begin{cases} \t{随机变量} X_1,X_2,\cdots,X_n\\ \t{数据(样本值)} x_1,\cdots,x_n\\ \end{cases}$
本课程的样本均为简单随机样本.
简单随机样本$\begin{cases} \t{随机性: 每个个体被随机抽取的概率相等.} \\ \t{独立性: 每个个体的取值不受其它个体取值的影响.}\\ \end{cases}$
基本假设: 假设简单随机样本 $X_1,X_2,\ldots,X_n$ 是独立同分布的. 即这组样本可以用来刻画总体, 和总体的分布相同.
样本 $X_1,\ldots,X_n$ 的所有可能取值的全体构成样本空间, 记为 $\mathscr{X}=\{x_1,\ldots,x_n\}$.
设总体 $X$ 具有分布函数 $F(x)$, $x_1,x_2,\ldots,x_n$ 为取自该总体的样本, 则样本的联合分布函数为 $$\begin{aligned} F(x_1,x_2,\cdots,x_n) &\overset{\text{独立性}}{=} F_{x_1}(x_1)F_{x_2}(x_2)\cdots F_{x_n}(x_n)\\ &\overset{\text{同分布}}{=} F_X(x_1)F_X(x_2)\cdots F_X(x_n) \\ &=\prod\limits_{i=1}^n F_X(x_i). \end{aligned}$$
联合密度函数同理.