1
0
mirror of https://github.com/Didnelpsun/Math.git synced 2026-06-16 07:07:47 +08:00
This commit is contained in:
Didnelpsun
2021-11-07 22:52:46 +08:00
parent 7e193d1c05
commit 3b65f18688
4 changed files with 112 additions and 8 deletions

View File

@@ -168,6 +168,8 @@ $\ln L(\lambda)=-n\ln2-n\ln\lambda-\dfrac{1}{\lambda}\sum\limits_{i=1}^n\vert x_
\section{置信区间}
\subsection{方差已知}
\textbf{例题:}一批零件的长度服从正态分布$N(\mu,\sigma^2)$,其中$\mu,\sigma^2$均未知。现从中随机抽取16个零件测得样本均值$\overline{x}=20cm$,样本标准差为$s=1cm$,求$\mu$的置信水平为0.90的置信区间。
解:$\sigma$未知,所以使用$s$来求置信空间。
@@ -178,8 +180,34 @@ $\ln L(\lambda)=-n\ln2-n\ln\lambda-\dfrac{1}{\lambda}\sum\limits_{i=1}^n\vert x_
所以置信空间为$\left(20-\dfrac{1}{4}t_{0.05}(15),20+\dfrac{1}{4}t_{0.05}(15)\right)$
\subsection{方差未知}
\textbf{例题:}设某群人的年龄$X\sim N(\mu,\sigma^2)$随机了解到五个人的年龄3954617259求均值$\mu$的置信度为$0.95$的置信区间。
解:由于$\sigma$未知,所以使用样本方差,$\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)$
其中置信区间为$\left(\overline{X}-\dfrac{S}{\sqrt{n}}t_{0.025}(n-1),\overline{X}+\dfrac{S}{\sqrt{n}}t_{0.025}(n-1)\right)$
$\overline{x}=\dfrac{1}{5}(39+54+61+72+59)=57$$S=\sqrt{\dfrac{1}{n-1}\sum\limits_{i=1}^5(x_i-\overline{x})}=12$
其中$t_{0.025}(n-1)=t_{0.025}(4)=2.7764$,所以代入得到$(42.13,71,87)$
\section{假设检验}
\textbf{例题:}设考试成绩服从正态分布随机抽取36位考生成绩平均分为66.5分标准差为15分。在显著性水平0.05下是否可以认为这次考试的平均水平为70分。
解:首先提出假设$H_0:\mu=70$$H_1:\mu\neq70$
$X$使用样本标准差进行标准化:$T=\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)$
给定显著性水平$0.05$,写出拒绝域$T<-t_{\frac{\alpha}{2}}(n-1)$$T>t_{\frac{\alpha}{2}}(n-1)$
代入计算统计量,$\vert T\vert=\left\vert\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right\vert=\left\vert\dfrac{66.5-70}{15/6}\right\vert=1.4$
$t_{\frac{\alpha}{2}}(n-1)=t_{0.05}(35)=2.0301>1.4$不在拒绝域内,所以接受原假设。
即可以认为平均水平为70分。
\textbf{例题:}已知某机器生产出来的零件长度$X$(单位:$cm$)服从正态分布$N(\mu,\delta^2)$现从中随意抽取容量为16的一个样本测得样本均值$\overline{x}=10$,样本方差$s^2=0.16$$t_{0.025}(15)=2.132$
(1)求总体均值$\mu$置信水平为0.95的置信区间。

View File

@@ -27,6 +27,14 @@
% 超链接
\usepackage{tikz}
% 绘图
\usepackage{multirow}
% 合并单元格
\newcommand{\tabincell}[2]{
\begin{tabular}{@{}#1@{}}#2\end{tabular}
}
% 空格内换行
\usepackage{graphicx}
% 缩小表格
\author{Didnelpsun}
\title{标题}
\date{}
@@ -335,6 +343,14 @@ $0<\theta<\dfrac{1}{2}$,舍去正值,得到$\hat{\theta}=\dfrac{7-\sqrt{13}}
$ED=\sigma^2=kE(\sum\lim\limits_{i=1}^{n-1}(X_{i+1}-X_i)^2)=kE(\sum\limits_{i=1}^{n-1}(X_{i+1}^2-2X_iX_{i+1}+X_i^2))$
已知样本方差$S^2=\dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2=\dfrac{1}{n-1}\left(\sum\limits_{i=1}^nX_i^2-n\overline{X}^2\right)$。所以为什么样本方差要除以$n-1$而不是$n$?可以利用无偏性来证明。
证明:根据方差$DX_i=EX_i^2-E^2X_i$,从而$EX_i^2=DX_i+E^2X_i=\sigma^2+\mu^2$,类似$D\overline{X}=E(\overline{X}^2)-(E\overline{X})^2$$D\overline{X}=D\left(\dfrac{1}{n}\sum\limits_{i=1}^nX_i\right)=\dfrac{1}{n^2}\sum\limits_{i=1}^nDX_i=\dfrac{1}{n^2}n\sigma^2=\dfrac{\sigma^2}{n}$
$\therefore E(\overline{X}^2)=D\overline{X}+(E\overline{X})^2=\dfrac{\sigma^2}{n}+\mu^2$
所以对样本方差求期望:$ES^2=E\left(\dfrac{1}{n-1}\left(\sum\limits_{i=1}^nX_i^2-n\overline{X}^2\right)\right)=\dfrac{1}{n-1}\\\left(\sum\limits_{i=1}^nE(X_i^2)-nE(\overline{X}^2)\right)=\dfrac{1}{n-1}\left(n(\sigma^2+\mu^2)-n\left(\dfrac{\sigma^2}{n}+\mu^2\right)\right)=\sigma^2$
\subsubsection{有效性}
也称为最小方差性。只有同样的无偏性才能比较有效性。
@@ -353,6 +369,16 @@ $EX_i^2=EX_{i+1}^2=(EX_{i+1})^2+DX_{i+1}=\mu^2+\sigma^2$$2EX_iE_{i+1}=2(EX_i)
\section{参数区间估计与假设检验}
% 正态分布的统计量分布($X\sim N(\mu,\sigma^2)$
% \begin{enumerate}
% \item $\overline{X}=\dfrac{1}{n}\sum\limits_{i=1}^nX_i\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$$\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)$。
% \item $\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)$。
% \item $\dfrac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)$。
% \end{enumerate}
区间估计和假设检验都是基于小概率事件基本上不可能发生的情况。
\subsection{区间估计}
区间估计是根据样本估计总体期望$\mu$所在的区间。有两个参数,一个是区间长度,一个是落入概率。
@@ -363,9 +389,15 @@ $EX_i^2=EX_{i+1}^2=(EX_{i+1})^2+DX_{i+1}=\mu^2+\sigma^2$$2EX_iE_{i+1}=2(EX_i)
\textcolor{violet}{\textbf{定义:}}$I=I(T,\theta)$$T$为已知常量,$\theta$为未知参数,其分布$F$已知且与$\theta$无关,则$I$\textbf{枢轴变量}。给定$1-\alpha$,确定$F$上的上$\dfrac{\alpha}{2}$分位数$Z-{\frac{\alpha}{2}}$,上$1-\dfrac{\alpha}{2}$分位数$Z_{1-\frac{\alpha}{2}}$,则$P\{Z_{1-\frac{\alpha}{2}}\leqslant I(T,\theta)\leqslant Z_{\frac{\alpha}{2}}=1-\alpha$
$(\underline{\theta},\overline{\theta})$是参数$\theta$的置信度为$1-\alpha$的区间估计,则区间$(\underline{\theta},\overline{\theta})$包含参数$\theta$的概率为$1-\alpha$
\subsubsection{正态总体均值的置信空间}
假设$X\sim N(\mu,\sigma^2)$(若不服从正态分布就用中心极限定理来解决),则$\overline{X}\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$$P\left(\left\vert\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\right\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$。记$\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}=Z$,则$Z\sim N(0,1)$
\paragraph{\texorpdfstring{估计$\mu$$\sigma$已知}{}} \leavevmode \medskip
假设$X\sim N(\mu,\sigma^2)$(若不服从正态分布就用中心极限定理来解决)。则$\overline{X}\sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$$P\left(\left\vert\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\right\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$。记$\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}=Z$,则$Z\sim N(0,1)$
其中置信区间为$(\mu-\Delta,\mu+\Delta)$
$\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$,从而中间面积为$1-\alpha$,得到两端面积$\dfrac{\alpha}{2}$
@@ -375,6 +407,8 @@ $\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$
这个$\mu$所处的区间就是\textbf{置信区间},区间上限就是\textbf{置信上限},区间下限就是\textbf{置信下限}
\paragraph{\texorpdfstring{估计$\mu$$\sigma$未知}{}} \leavevmode \medskip
$\sigma$未知的时候就无法求出置信区间了,所以根据正态总体下的结论,用样本方差$S$代替方差$\sigma$,且$\dfrac{\sqrt{n}(\overline{X}-\mu)}{S}\sim t(n-1)$
所以$P\left(\left\vert\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right\vert<\dfrac{\Delta}{S/\sqrt{n}}\right)=1-\alpha$,令$\dfrac{\overline{X}-\mu}{S/\sqrt{n}}=t$,所以$t\sim t(n-1)$
@@ -383,12 +417,15 @@ $\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$
代入:解得$\mu\in(\overline{X}-\Delta,\overline{X}+\Delta)=\mu\in(\overline{X}-t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}},\overline{X}+t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}})$
综上:求置信空间的关键是求$\Delta$
综上:求置信空间的关键是求$\Delta$\medskip
\begin{itemize}
\item$\sigma$已知时,$\Delta=Z_\frac{\alpha}{2}\dfrac{\sigma}{\sqrt{n}}$
\item$\sigma$未知时,$\Delta=t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}}$
\end{itemize}
\begin{tabular}{|c|c|c|}
\hline
参数 & 条件 & 置信区间 \\ \hline
\multirow{2}{*}{$\mu$} & $\sigma$已知 & $\left(\overline{X}-\dfrac{\sigma}{\sqrt{n}}\mu_{\frac{\alpha}{2}},\overline{X}+\dfrac{\sigma}{\sqrt{n}}\mu_{\frac{\alpha}{2}}\right)$ \\ \cline{2-3}
& $\sigma$未知 & $\left(\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1),\overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right)$ \\ \hline
$\sigma$ & $\mu$未知 & $\left(\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right)$ \\ \hline
\end{tabular}
\subsection{假设检验}
@@ -402,12 +439,51 @@ $\therefore P\left(\vert Z\vert<\dfrac{\Delta}{\sigma/\sqrt{n}}\right)=1-\alpha$
$\sigma$未知,则$\Delta=t_\frac{\alpha}{2}(n-1)\dfrac{S}{\sqrt{n}}$,拒绝域一样。
$\theta$为总体位置参数,$\theta_0$为已知常数,则假设检验类型:\medskip
\begin{tabular}{|c|c|c|c|}
\hline
\multicolumn{2}{|c|}{类型} & $H_0$ & $H_1$ \\ \hline
\multicolumn{2}{|c|}{双边检验} & $\theta=\theta_0$ & $\theta\neq\theta_0$ \\ \hline
\multirow{2}{*}{单边检验} & 右边 & $\theta\leqslant\theta_0$ & $\theta>\theta_0$ \\ \cline{2-4}
& 左边 & $\theta\geqslant\theta_0$ & $\theta<\theta_0$ \\ \hline
\end{tabular}
\subsubsection{正态总体下的六大检验与拒绝域}
\subsection{两类错误}
第一类错误(弃真):若$H_0$为真,按检验法则否定$H_0$。发生概率为$\alpha=P\{\text{拒绝}H_0|H_0\text{为真}\}$
显著性水平$\alpha$实际上是犯第一类错误的概率的上界。\medskip
第二类错误(存伪):若$H_0$为假,按检验法则接受$H_0$。发生概率为$\beta=P\{\text{接受}H_0|H_0\text{为假}\}=P\{\text{接受}H_0|H_1\text{为真}\}$
\begin{center}{
\begin{tabular}{|c|c|c|}
\hline
类型 & 第一类错误 & 第二类错误 \\ \hline
含义 &$H_0$为真,否定$H_0$(弃真)&$H_0$为假,接受$H_0$(存伪)\\ \hline
发生概率 & $\alpha=P\{\text{拒绝}H_0|H_0\text{为真}\}$ & \tabincell{c}{$\beta=P\{\text{接受}H_0|H_0\text{为假}\}$\\$=P\{\text{接受}H_0|H_1\text{为真}\}$} \\ \hline
说明 & \tabincell{c}{仅控制犯第一类错误的概率\\的检验称为显著性检验,\\概率为显著性水平} & \tabincell{c}{当样本容量固定,\\$\alpha$$\beta$中任意一个减少,\\则另一个必然增大,\\若要同时增大,\\则只能增大样本容量} \\ \hline
\end{tabular}
}\end{center} \medskip
\begin{center}
\scalebox{0.8}{
\begin{tabular}{|c|c|c|c|c|c|}
\hline
检验参数 & 条件 & 原假设$H_0$ & 备择假设$H_1$ & 检验法与统计量 & 拒绝域 \\ \hline
\multirow{6}{*}{$\mu$} & \multirow{3}{*}{$\sigma=\sigma_0$} & $\mu=\mu_0$ & $\mu\neq\mu_0$ & \multirow{3}{*}{\tabincell{c}{$U$检验\\$U=\dfrac{\overline{X}-\mu_0}{\sigma_0/\sqrt{n}}\sim N(0,1)$}} & $\vert u\vert\geqslant u_{\frac{\alpha}{2}}$ \\ \cline{3-4} \cline{6-6}
& & $\mu\leqslant\mu_0$ & $\mu>\mu_0$ & & $u\geqslant u_\alpha$ \\ \cline{3-4} \cline{6-6}
& & $\mu\geqslant\mu_0$ & $\mu<\mu_0$ & & $u\leqslant u_\alpha$ \\ \cline{2-6}
& \multirow{3}{*}{$\sigma$未知} & $\mu=\mu_0$ & $\mu\neq\mu_0$ & \multirow{3}{*}{\tabincell{c}{$T$检验\\$U=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}}\sim t(n-1)$}} & $\vert t\vert\geqslant t_{\frac{\alpha}{2}}(n-1)$ \\ \cline{3-4} \cline{6-6}
& & $\mu\leqslant\mu_0$ & $\mu>\mu_0$ & & $t\geqslant t_\alpha(n-1)$ \\ \cline{3-4} \cline{6-6}
& & $\mu\geqslant\mu_0$ & $\mu<\mu_0$ & & $t\leqslant t_\alpha(n-1)$ \\ \hline
\multirow{6}{*}{$\mu$} & \multirow{3}{*}{$\mu$已知} & $\sigma^2=\sigma^2_0$ & $\sigma^2\neq\sigma^2_0$ & \multirow{3}{*}{\tabincell{c}{$\chi^2$检验\\$\chi^2=\dfrac{1}{\sigma^2_0}\sum\limits_{i=1}^n(X_i-\mu)^2$\\$\sim\chi^2(n)$}} & \tabincell{c}{$\chi^2\leqslant\chi^2_{1-\frac{\alpha}{2}}(n)$\\$\chi^2\geqslant\chi^2_{\frac{\alpha}{2}}(n)$} \\ \cline{3-4} \cline{6-6}
& & $\sigma^2\leqslant\sigma^2_0$ & $\sigma^2>\sigma^2_0$ & & $\chi^2\geqslant\chi^2_\alpha(n)$ \\ \cline{3-4} \cline{6-6}
& & $\sigma^2\geqslant\sigma^2_0$ & $\sigma^2<\sigma^2_0$ & & $\chi^2\leqslant\chi^2_{1-\alpha}(n)$ \\ \cline{2-6}
& \multirow{3}{*}{$\mu$未知} & $\sigma^2=\sigma^2_0$ & $\sigma^2\neq\sigma^2_0$ & \multirow{3}{*}{\tabincell{c}{$\chi^2$检验\\$\chi^2=\dfrac{(n-1)S^2}{\sigma_0^2}$\\$\sim\chi^2(n-1)$}} & \tabincell{c}{$\chi^2\leqslant\chi^2_{1-\frac{\alpha}{2}}(n-1)$\\$\chi^2\geqslant\chi^2_{\frac{\alpha}{2}}(n-1)$} \\ \cline{3-4} \cline{6-6}
& & $\sigma^2\leqslant\sigma^2_0$ & $\sigma^2>\sigma^2_0$ & & $\chi^2\geqslant\chi^2_\alpha(n-1)$ \\ \cline{3-4} \cline{6-6}
& & $\sigma^2\geqslant\sigma^2_0$ & $\sigma^2<\sigma^2_0$ & & $\chi^2\leqslant\chi^2_{1-\alpha}(n-1)$ \\ \hline
\end{tabular}
}
\end{center}
\end{document}