mirror of
https://github.com/Didnelpsun/Math.git
synced 2026-06-16 15:17:58 +08:00
更新
This commit is contained in:
Binary file not shown.
@@ -168,6 +168,8 @@ $\ln L(\lambda)=-n\ln2-n\ln\lambda-\dfrac{1}{\lambda}\sum\limits_{i=1}^n\vert x_
|
||||
|
||||
\section{置信区间}
|
||||
|
||||
\subsection{方差已知}
|
||||
|
||||
\textbf{例题:}一批零件的长度服从正态分布$N(\mu,\sigma^2)$,其中$\mu,\sigma^2$均未知。现从中随机抽取16个零件,测得样本均值$\overline{x}=20cm$,样本标准差为$s=1cm$,求$\mu$的置信水平为0.90的置信区间。
|
||||
|
||||
解:$\sigma$未知,所以使用$s$来求置信空间。
|
||||
@@ -178,8 +180,34 @@ $\ln L(\lambda)=-n\ln2-n\ln\lambda-\dfrac{1}{\lambda}\sum\limits_{i=1}^n\vert x_
|
||||
|
||||
所以置信空间为$\left(20-\dfrac{1}{4}t_{0.05}(15),20+\dfrac{1}{4}t_{0.05}(15)\right)$。
|
||||
|
||||
\subsection{方差未知}
|
||||
|
||||
\textbf{例题:}设某群人的年龄$X\sim N(\mu,\sigma^2)$,随机了解到五个人的年龄:39,54,61,72,59,求均值$\mu$的置信度为$0.95$的置信区间。
|
||||
|
||||
解:由于$\sigma$未知,所以使用样本方差,$\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)$。
|
||||
|
||||
其中置信区间为$\left(\overline{X}-\dfrac{S}{\sqrt{n}}t_{0.025}(n-1),\overline{X}+\dfrac{S}{\sqrt{n}}t_{0.025}(n-1)\right)$。
|
||||
|
||||
又$\overline{x}=\dfrac{1}{5}(39+54+61+72+59)=57$,$S=\sqrt{\dfrac{1}{n-1}\sum\limits_{i=1}^5(x_i-\overline{x})}=12$。
|
||||
|
||||
其中$t_{0.025}(n-1)=t_{0.025}(4)=2.7764$,所以代入得到$(42.13,71,87)$。
|
||||
|
||||
\section{假设检验}
|
||||
|
||||
\textbf{例题:}设考试成绩服从正态分布,随机抽取36位考生成绩,平均分为66.5分,标准差为15分。在显著性水平0.05下是否可以认为这次考试的平均水平为70分。
|
||||
|
||||
解:首先提出假设$H_0:\mu=70$,$H_1:\mu\neq70$。
|
||||
|
||||
将$X$使用样本标准差进行标准化:$T=\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)$。
|
||||
|
||||
给定显著性水平$0.05$,写出拒绝域$T<-t_{\frac{\alpha}{2}}(n-1)$或$T>t_{\frac{\alpha}{2}}(n-1)$。
|
||||
|
||||
代入计算统计量,$\vert T\vert=\left\vert\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right\vert=\left\vert\dfrac{66.5-70}{15/6}\right\vert=1.4$。
|
||||
|
||||
又$t_{\frac{\alpha}{2}}(n-1)=t_{0.05}(35)=2.0301>1.4$不在拒绝域内,所以接受原假设。
|
||||
|
||||
即可以认为平均水平为70分。
|
||||
|
||||
\textbf{例题:}已知某机器生产出来的零件长度$X$(单位:$cm$)服从正态分布$N(\mu,\delta^2)$,现从中随意抽取容量为16的一个样本,测得样本均值$\overline{x}=10$,样本方差$s^2=0.16$,$t_{0.025}(15)=2.132$。
|
||||
|
||||
(1)求总体均值$\mu$置信水平为0.95的置信区间。
|
||||
|
||||
Binary file not shown.
@@ -27,6 +27,14 @@
|
||||
% 超链接
|
||||
\usepackage{tikz}
|
||||
% 绘图
|
||||
\usepackage{multirow}
|
||||
% 合并单元格
|
||||
\newcommand{\tabincell}[2]{
|
||||
\begin{tabular}{@{}#1@{}}#2\end{tabular}
|
||||
}
|
||||
% 空格内换行
|
||||
\usepackage{graphicx}
|
||||
% 缩小表格
|
||||
\author{Didnelpsun}
|
||||
\title{标题}
|
||||
\date{}
|
||||
@@ -335,6 +343,14 @@ $0<\theta<\dfrac{1}{2}$,舍去正值,得到$\hat{\theta}=\dfrac{7-\sqrt{13}}
|
||||
|
||||
$ED=\sigma^2=kE(\sum\lim\limits_{i=1}^{n-1}(X_{i+1}-X_i)^2)=kE(\sum\limits_{i=1}^{n-1}(X_{i+1}^2-2X_iX_{i+1}+X_i^2))$。
|
||||
|
||||
已知样本方差$S^2=\dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2=\dfrac{1}{n-1}\left(\sum\limits_{i=1}^nX_i^2-n\overline{X}^2\right)$。所以为什么样本方差要除以$n-1$而不是$n$?可以利用无偏性来证明。
|
||||
|
||||
证明:根据方差$DX_i=EX_i^2-E^2X_i$,从而$EX_i^2=DX_i+E^2X_i=\sigma^2+\mu^2$,类似$D\overline{X}=E(\overline{X}^2)-(E\overline{X})^2$,$D\overline{X}=D\left(\dfrac{1}{n}\sum\limits_{i=1}^nX_i\right)=\dfrac{1}{n^2}\sum\limits_{i=1}^nDX_i=\dfrac{1}{n^2}n\sigma^2=\dfrac{\sigma^2}{n}$。
|
||||
|
||||
$\therefore E(\overline{X}^2)=D\overline{X}+(E\overline{X})^2=\dfrac{\sigma^2}{n}+\mu^2$。
|
||||
|
||||
所以对样本方差求期望:$ES^2=E\left(\dfrac{1}{n-1}\left(\sum\limits_{i=1}^nX_i^2-n\overline{X}^2\right)\right)=\dfrac{1}{n-1}\\\left(\sum\limits_{i=1}^nE(X_i^2)-nE(\overline{X}^2)\right)=\dfrac{1}{n-1}\left(n(\sigma^2+\mu^2)-n\left(\dfrac{\sigma^2}{n}+\mu^2\right)\right)=\sigma^2$。
|
||||
|
||||
\subsubsection{有效性}
|
||||
|
||||
也称为最小方差性。只有同样的无偏性才能比较有效性。
|
||||
@@ -353,6 +369,16 @@ $EX_i^2=EX_{i+1}^2=(EX_{i+1})^2+DX_{i+1}=\mu^2+\sigma^2$,$2EX_iE_{i+1}=2(EX_i)
|
||||
|
||||
\section{参数区间估计与假设检验}
|
||||
|
||||
% 正态分布的统计量分布($X\sim N(\mu,\sigma^2)$):
|
||||
|
||||
% \begin{enumerate}
|
||||
% \item $\overline{X}=\dfrac{1}{n}\sum\limits_{i=1}^nX_i\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$,$\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)$。
|
||||
% \item $\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)$。
|
||||
% \item $\dfrac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)$。
|
||||
% \end{enumerate}
|
||||
|
||||
区间估计和假设检验都是基于小概率事件基本上不可能发生的情况。
|
||||
|
||||
\subsection{区间估计}
|
||||
|
||||
区间估计是根据样本估计总体期望$\mu$所在的区间。有两个参数,一个是区间长度,一个是落入概率。
|
||||
@@ -363,9 +389,15 @@ $EX_i^2=EX_{i+1}^2=(EX_{i+1})^2+DX_{i+1}=\mu^2+\sigma^2$,$2EX_iE_{i+1}=2(EX_i)
|
||||
|
||||
\textcolor{violet}{\textbf{定义:}}$I=I(T,\theta)$,$T$为已知常量,$\theta$为未知参数,其分布$F$已知且与$\theta$无关,则$I$为\textbf{枢轴变量}。给定$1-\alpha$,确定$F$上的上$\dfrac{\alpha}{2}$分位数$Z-{\frac{\alpha}{2}}$,上$1-\dfrac{\alpha}{2}$分位数$Z_{1-\frac{\alpha}{2}}$,则$P\{Z_{1-\frac{\alpha}{2}}\leqslant I(T,\theta)\leqslant Z_{\frac{\alpha}{2}}=1-\alpha$。
|
||||
|
||||
即$(\underline{\theta},\overline{\theta})$是参数$\theta$的置信度为$1-\alpha$的区间估计,则区间$(\underline{\theta},\overline{\theta})$包含参数$\theta$的概率为$1-\alpha$。
|
||||
|
||||
\subsubsection{正态总体均值的置信空间}
|
||||
|
||||
假设$X\sim N(\mu,\sigma^2)$(若不服从正态分布就用中心极限定理来解决),则$\overline{X}\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$,$P\left(\left\vert\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\right\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$。记$\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}=Z$,则$Z\sim N(0,1)$。
|
||||
\paragraph{\texorpdfstring{估计$\mu$而$\sigma$已知}{}} \leavevmode \medskip
|
||||
|
||||
假设$X\sim N(\mu,\sigma^2)$(若不服从正态分布就用中心极限定理来解决)。则$\overline{X}\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$,$P\left(\left\vert\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\right\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$。记$\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}=Z$,则$Z\sim N(0,1)$。
|
||||
|
||||
其中置信区间为$(\mu-\Delta,\mu+\Delta)$。
|
||||
|
||||
$\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$,从而中间面积为$1-\alpha$,得到两端面积$\dfrac{\alpha}{2}$。
|
||||
|
||||
@@ -375,6 +407,8 @@ $\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$
|
||||
|
||||
这个$\mu$所处的区间就是\textbf{置信区间},区间上限就是\textbf{置信上限},区间下限就是\textbf{置信下限}。
|
||||
|
||||
\paragraph{\texorpdfstring{估计$\mu$而$\sigma$未知}{}} \leavevmode \medskip
|
||||
|
||||
当$\sigma$未知的时候就无法求出置信区间了,所以根据正态总体下的结论,用样本方差$S$代替方差$\sigma$,且$\dfrac{\sqrt{n}(\overline{X}-\mu)}{S}\sim t(n-1)$。
|
||||
|
||||
所以$P\left(\left\vert\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right\vert<\dfrac{\Delta}{S/\sqrt{n}}\right)=1-\alpha$,令$\dfrac{\overline{X}-\mu}{S/\sqrt{n}}=t$,所以$t\sim t(n-1)$。
|
||||
@@ -383,12 +417,15 @@ $\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$
|
||||
|
||||
代入:解得$\mu\in(\overline{X}-\Delta,\overline{X}+\Delta)=\mu\in(\overline{X}-t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}},\overline{X}+t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}})$。
|
||||
|
||||
综上:求置信空间的关键是求$\Delta$:
|
||||
综上:求置信空间的关键是求$\Delta$:\medskip
|
||||
|
||||
\begin{itemize}
|
||||
\item 当$\sigma$已知时,$\Delta=Z_\frac{\alpha}{2}\dfrac{\sigma}{\sqrt{n}}$。
|
||||
\item 当$\sigma$未知时,$\Delta=t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}}$。
|
||||
\end{itemize}
|
||||
\begin{tabular}{|c|c|c|}
|
||||
\hline
|
||||
参数 & 条件 & 置信区间 \\ \hline
|
||||
\multirow{2}{*}{$\mu$} & $\sigma$已知 & $\left(\overline{X}-\dfrac{\sigma}{\sqrt{n}}\mu_{\frac{\alpha}{2}},\overline{X}+\dfrac{\sigma}{\sqrt{n}}\mu_{\frac{\alpha}{2}}\right)$ \\ \cline{2-3}
|
||||
& $\sigma$未知 & $\left(\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1),\overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right)$ \\ \hline
|
||||
$\sigma$ & $\mu$未知 & $\left(\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right)$ \\ \hline
|
||||
\end{tabular}
|
||||
|
||||
\subsection{假设检验}
|
||||
|
||||
@@ -402,12 +439,51 @@ $\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$
|
||||
|
||||
若$\sigma$未知,则$\Delta=t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}}$,拒绝域一样。
|
||||
|
||||
设$\theta$为总体位置参数,$\theta_0$为已知常数,则假设检验类型:\medskip
|
||||
|
||||
\begin{tabular}{|c|c|c|c|}
|
||||
\hline
|
||||
\multicolumn{2}{|c|}{类型} & $H_0$ & $H_1$ \\ \hline
|
||||
\multicolumn{2}{|c|}{双边检验} & $\theta=\theta_0$ & $\theta\neq\theta_0$ \\ \hline
|
||||
\multirow{2}{*}{单边检验} & 右边 & $\theta\leqslant\theta_0$ & $\theta>\theta_0$ \\ \cline{2-4}
|
||||
& 左边 & $\theta\geqslant\theta_0$ & $\theta<\theta_0$ \\ \hline
|
||||
\end{tabular}
|
||||
|
||||
\subsubsection{正态总体下的六大检验与拒绝域}
|
||||
|
||||
\subsection{两类错误}
|
||||
|
||||
第一类错误(弃真):若$H_0$为真,按检验法则否定$H_0$。发生概率为$\alpha=P\{\text{拒绝}H_0|H_0\text{为真}\}$。
|
||||
显著性水平$\alpha$实际上是犯第一类错误的概率的上界。\medskip
|
||||
|
||||
第二类错误(存伪):若$H_0$为假,按检验法则接受$H_0$。发生概率为$\beta=P\{\text{接受}H_0|H_0\text{为假}\}=P\{\text{接受}H_0|H_1\text{为真}\}$。
|
||||
\begin{center}{
|
||||
\begin{tabular}{|c|c|c|}
|
||||
\hline
|
||||
类型 & 第一类错误 & 第二类错误 \\ \hline
|
||||
含义 & 若$H_0$为真,否定$H_0$(弃真)& 若$H_0$为假,接受$H_0$(存伪)\\ \hline
|
||||
发生概率 & $\alpha=P\{\text{拒绝}H_0|H_0\text{为真}\}$ & \tabincell{c}{$\beta=P\{\text{接受}H_0|H_0\text{为假}\}$\\$=P\{\text{接受}H_0|H_1\text{为真}\}$} \\ \hline
|
||||
说明 & \tabincell{c}{仅控制犯第一类错误的概率\\的检验称为显著性检验,\\概率为显著性水平} & \tabincell{c}{当样本容量固定,\\则$\alpha$和$\beta$中任意一个减少,\\则另一个必然增大,\\若要同时增大,\\则只能增大样本容量} \\ \hline
|
||||
\end{tabular}
|
||||
}\end{center} \medskip
|
||||
|
||||
\begin{center}
|
||||
\scalebox{0.8}{
|
||||
\begin{tabular}{|c|c|c|c|c|c|}
|
||||
\hline
|
||||
检验参数 & 条件 & 原假设$H_0$ & 备择假设$H_1$ & 检验法与统计量 & 拒绝域 \\ \hline
|
||||
\multirow{6}{*}{$\mu$} & \multirow{3}{*}{$\sigma=\sigma_0$} & $\mu=\mu_0$ & $\mu\neq\mu_0$ & \multirow{3}{*}{\tabincell{c}{$U$检验\\$U=\dfrac{\overline{X}-\mu_0}{\sigma_0/\sqrt{n}}\sim N(0,1)$}} & $\vert u\vert\geqslant u_{\frac{\alpha}{2}}$ \\ \cline{3-4} \cline{6-6}
|
||||
& & $\mu\leqslant\mu_0$ & $\mu>\mu_0$ & & $u\geqslant u_\alpha$ \\ \cline{3-4} \cline{6-6}
|
||||
& & $\mu\geqslant\mu_0$ & $\mu<\mu_0$ & & $u\leqslant u_\alpha$ \\ \cline{2-6}
|
||||
& \multirow{3}{*}{$\sigma$未知} & $\mu=\mu_0$ & $\mu\neq\mu_0$ & \multirow{3}{*}{\tabincell{c}{$T$检验\\$U=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}}\sim t(n-1)$}} & $\vert t\vert\geqslant t_{\frac{\alpha}{2}}(n-1)$ \\ \cline{3-4} \cline{6-6}
|
||||
& & $\mu\leqslant\mu_0$ & $\mu>\mu_0$ & & $t\geqslant t_\alpha(n-1)$ \\ \cline{3-4} \cline{6-6}
|
||||
& & $\mu\geqslant\mu_0$ & $\mu<\mu_0$ & & $t\leqslant t_\alpha(n-1)$ \\ \hline
|
||||
\multirow{6}{*}{$\mu$} & \multirow{3}{*}{$\mu$已知} & $\sigma^2=\sigma^2_0$ & $\sigma^2\neq\sigma^2_0$ & \multirow{3}{*}{\tabincell{c}{$\chi^2$检验\\$\chi^2=\dfrac{1}{\sigma^2_0}\sum\limits_{i=1}^n(X_i-\mu)^2$\\$\sim\chi^2(n)$}} & \tabincell{c}{$\chi^2\leqslant\chi^2_{1-\frac{\alpha}{2}}(n)$\\$\chi^2\geqslant\chi^2_{\frac{\alpha}{2}}(n)$} \\ \cline{3-4} \cline{6-6}
|
||||
& & $\sigma^2\leqslant\sigma^2_0$ & $\sigma^2>\sigma^2_0$ & & $\chi^2\geqslant\chi^2_\alpha(n)$ \\ \cline{3-4} \cline{6-6}
|
||||
& & $\sigma^2\geqslant\sigma^2_0$ & $\sigma^2<\sigma^2_0$ & & $\chi^2\leqslant\chi^2_{1-\alpha}(n)$ \\ \cline{2-6}
|
||||
& \multirow{3}{*}{$\mu$未知} & $\sigma^2=\sigma^2_0$ & $\sigma^2\neq\sigma^2_0$ & \multirow{3}{*}{\tabincell{c}{$\chi^2$检验\\$\chi^2=\dfrac{(n-1)S^2}{\sigma_0^2}$\\$\sim\chi^2(n-1)$}} & \tabincell{c}{$\chi^2\leqslant\chi^2_{1-\frac{\alpha}{2}}(n-1)$\\$\chi^2\geqslant\chi^2_{\frac{\alpha}{2}}(n-1)$} \\ \cline{3-4} \cline{6-6}
|
||||
& & $\sigma^2\leqslant\sigma^2_0$ & $\sigma^2>\sigma^2_0$ & & $\chi^2\geqslant\chi^2_\alpha(n-1)$ \\ \cline{3-4} \cline{6-6}
|
||||
& & $\sigma^2\geqslant\sigma^2_0$ & $\sigma^2<\sigma^2_0$ & & $\chi^2\leqslant\chi^2_{1-\alpha}(n-1)$ \\ \hline
|
||||
\end{tabular}
|
||||
}
|
||||
\end{center}
|
||||
|
||||
\end{document}
|
||||
|
||||
Reference in New Issue
Block a user