生物统计(数理统计方法)

2023-04-14 85阅读

温馨提示:这篇文章已超过443天没有更新,请注意相关的内容是否还可用!

生物统计

数理统计方法

生物统计(shengwu tongji,biostatistics,biometry,biometrics)含义 应用于中的数理统计方法。即用数理统计的原理和方法,分析和解释生物界的种种现象和数据资料,以求把握其本质和规律性。

中文名生物统计
外文名shengwu tongji,biostatistics,biometry,biometrics
性质数理统计方法
时间1866年

正文

最早提出生物统计思想的是比利时数学家L.A.J.凯特莱,他试图把统计学的理论应用于解决生物学、医学和社会学中的问题。1866年,G.J.孟德尔揭示了遗传的基本规律,这是最早运用数理统计于生物实验的一个成功的范例(见孟德尔定律)。1889年,F.高尔顿在《自然的遗传》一书中,通过对人体身高的研究指出,子代的身高不仅与亲代的身高相关,而且有向平均值“回归”的趋势,由此提出了“回归”和“相关”的概念和算法,从而奠定了生物统计的基础。

高尔顿的学生K.皮尔逊进一步把统计学应用于生物研究,提出了实际测定数与理论预期数之间的偏离度指数即卡方差(x)的概念和算法,这在属性的统计分析上起了重要作用。1899年,他创办了《生物统计》杂志,还建立了一所数理统计学校。他的学生W.S.戈塞特对样本标准差作了许多研究,并于1908年以“Student”的笔名将t-检验法发表于《生物统计》杂志上。

此后,t-检验法就成了生物统计学中的基本工具之一。英国数学家R.A.费希尔指出,只注意事后的数据分析是不够的,事先必须作好实验设计。他使实验设计成了生物统计的一个分支。他的学生G.W.斯奈迪格把变异来源不同的均方比值称为F值,并指出当F值大于理论上5%概率水准的F值时,该项变异来源的必然性效应就从偶然性变量中分析出来了,这就是“方差分析法”。

上述这些方法对于农业科学、生物学特别是遗传学的研究,起了重大的推动作用,20世纪20年代以来,各种数理统计方法陆续创立,它们在实验室、田间、饲养和临床实验中得到广泛应用并日益扩大到整个工业界。70年代,随着计算机的普及,使本来由于计算量过大而不得不放弃的统计方法又获得了新的生命力,应用更为广泛,并在现代科技中占有十分重要的地位。

无分布法

大多数统计分析方法都建立在“数据为正态分布”这一基本假定之上,而许多生物学数据远非正态分布,采用无分布法可以绕过这一困难。这类方法往往比较直观,而且计算简便。有时,一部分(或全部)观测结果并不能直接用数据表示,只能用反映大小或程度的等级或秩次表示。例如,观测结果是“-”,“±”,“+”及“++”以上,排序后的等级便是1,2,3,4……。许多很有效的无分布法就是基于数据或观测结果的大小顺序的。由于无分布法通常并不涉及数据分布的参数(如平均数),所以有时也称为非参数方法。

生存分析

许多生物现象的动态观察结果都比一次性的横断面观察更能说明问题。例如:恶性肿瘤患者接受手术治疗的效果,要看他们术后经过一段时间的生存率,或者有必要描绘出在不同条件下的生存率曲线(以时间为横轴,生存率为纵轴),以便进行分析与比较;器官移植的效果,要看异体器官在体内正常工作和不被排斥的时间等。生存分析的用途是广泛的。

多元分析

又称多指标或多变量分析,是对多个观测指标同时进行综合性分析,所以比普通的一元统计分析更为全面、有效。这是40年代就已出现的一系列好方法。由于涉及较深的数学知识和很复杂的计算,妨碍了它们的普及,随着计算机和统计软件包的日益完善,预料多元分析不久将会成为生物科学研究的常规武器。

多重回归是指多个自变量和一个因变量的回归;而多元回归是指不止一个因变量的回归。但二者常被混淆使用。它们可用于预测、指标的综合或自变量的筛选。判别分析是利用形如多重回归方程的判别函数来进行个体种类的判断或诊断。聚类分析是将许多个体或指标按它们的相似程度来归类。对个体进行聚类称为Q型聚类;对指标进行聚类称为R型聚类。Q型聚类和判别分析是数量分类学的两种基本方法。

趋势面是以地理上的经、纬度为自变量的高次方程,可用于绘制研究对象在地理上的分布密度的等高线图,亦可用于预测。主成分分析的目的在于将许多彼此相关的指标变换成少数几个彼此独立的综合指标,而且它们包含了原来那些指标的几乎全部统计信息。因子分析的计算程序与主成分分析类似,但它不是研究指标的变换,而是分析个体间的内在联系,此法为心理学家所首创,也可用于研究复杂的疾病。

统计模型

几乎所有的统计方法都有一个数学模型作为背景。除了上述方法之外,在生物科学研究中用处较大的还有:捉放捉模型,用于个体总数的估计;对数线性模型,用于多维列联表(即按多个指标分组的计数资料)的分析;Logit模型,既可用来同时排除多个混杂因素的影响,又可用于处理定量的混杂变量与危险因子。如果所有指标都是定性的,Logit模型就成了对数线性模型的一个特例。

参考书目

杨纪珂等:《现代生物统计》,安徽教育出版社,合肥,1985。

汤旦林:《医用统计基础》,人民卫生出版社,北京,1989。

参考资料

1.概率统计研究室·中国科学院

目录[+]