t分布(统计学术语)

2023-02-22 89阅读

温馨提示:这篇文章已超过507天没有更新,请注意相关的内容是否还可用!

t分布

统计学术语

在概率论和统计学中,学生t-分布(t-distribution),可简称为t分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。t分布曲线形态与n(确切地说与自由度v)大小有关。与标准正态分布曲线相比,自由度v越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v愈大,t分布曲线愈接近正态分布曲线,当自由度v=∞时,t分布曲线为标准正态分布曲线。

中文名t分布
外文名t-distribution
学科概率论和统计学
应用在对呈正态分布的总体

概述及历史

在概率论和统计学中,(Student'st-distribution)经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显着性测试的学生t测定的基础。t检定改进了Z检定(en:Z-test),不论样本数量大或小皆可应用。在样本数量大(超过120等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t检定。

当母群体的标准差是未知的但却又需要估计时,可以运用学生t-分布。

学生t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。

简介

u分布

正态分布(normaldistribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standardnormaldistribution),亦称u分布。

根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N(0,1)

t分布

由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t值的分布称为t分布。

假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为Z~t(n)。

特征

1.以0为中心,左右对称的单峰分布;

2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线。

t(n)分布与标准正态N(0,1)的密度函数

对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。

学生的t分布(或也t分布),在概率统计中,在置信区间估计、显着性检验等问题的计算中发挥重要作用。

t分布情况出现时(如在几乎所有实际的统计工作)的总体标准偏差是未知的,并要从数据估算。教科书问题的处理标准偏差,因为如果它被称为是两类:(1)那些在该样本规模是如此之大的一个可处理的数据为基础估计的差异,就好像它是一定的(2)这些说明数学推理,在其中的问题,估计标准偏差是暂时忽略的,因为这不是一点,这是作者或导师当时的解释。

表格

下表列出了自由度为1-30以及80、100、120等t-分布的单侧和双侧区间值。例如,当样本数量n=5时,则自由度v=4,就可以查找表中以4开头的行。该行第5列值为2.132,对应的单侧值为95%(双侧值为90%)。这也就是说,T小于2.132的概率为95%(即单侧),记为Pr(−∞<T<2.132)=0.95;同时,T值介于-2.132和2.132之间的概率为90%(即双侧),记为Pr(−2.132<T<2.132)=0.9。

这是根据分布的对称性计算得到的,Pr(T<−2.132)=1−Pr(T>−2.132)=1−0.95=0.05,

因此,Pr(−2.132<T<2.132)=1−2(0.05)=0.9.

注意关于表格的最后一行的值:自由度为无限大(n=120)的t-分布和正态分布等价。

相关研究

贝叶斯理论框架主要分为两个部分,一个是先验分布,一个是似然函数。目前反演中所用的先验分布基本聚焦在高斯分布、Huber分布、柯西分布以及改进柯西分布等,以此构建出的贝叶斯框架在特定地区反演效果较好,但其普适性较小。通过对多个地区的多口井数据进行提取统计,发现待反演参数基本满足t分布,而与高斯分布、柯西分布等存在较大误差。

鉴于此,构建了以t分布为先验函数的贝叶斯反演算法。该算法可以通过对自由度的选择来适应参数分布不同的多种地区,通过提高先验信息的吻合度,增加了后验函数的可信性,保证了反演的效果。模型试算表明,基于t分布为先验分布的贝叶斯反演方法具有较高的分辨率和较好的稳定性。实际资料的叠前弹性参数反演表明,该方法反演结果准确可靠。

参考资料

1.基于t分布为先验约束的叠前AVO反演·知网空间

目录[+]