Statistics

医学科研数据的统计分析处理

医学科研数据的统计分析处理

  在医学科研过程中经常要获得众多的观测数据,例如在对克山病区急性克山病患者和健康人血磷平均水平的对比研究中,就首先要分别测定若干个急性克山病患者和若干个健康人的血磷值,在此基础上求出两组人群各自的血磷平均值并加以比较。由于在实际工作中往往不可能或者没有条件进行普查性研究,只能做抽样研究。因此,研究所获得的观测数据多属于样本数据,根据它们所计算出来的平均值、有效率等都是样本统计量,其中包含着抽样误差。所以,不能根据所观测到的急性克山病患者的血磷平均值高于健康人就下结论:急性克山病患者的血磷平均水平较高。必须对这些观测数据进行统计学分析处理,分清在样本统计量之间表现出来的差别究竟是总体上的差别还是抽样误差造成的差别。只有在排除抽样误差带来差别的基础上,才能得出总体上有差别的结论。
  对医学科研数据的统计分析处理包括统计描述和统计推断。统计描述是指运用各种统计学手段(如统计表、统计图、统计指标等)对观测数据的数量特征进行客观如实地描述和表达。究竟采用哪种统计学手段,选用什么样的统计指标,应根据观测指标本身的性质来决定。例如,对定性观测得到的计数资料,可以用各种相对数来描述其数量特征;对定量测定获得的计量资料,则要同时用描述平均水平和集中趋势的平均指标,及描述离散程度和变异大小的变异指标,从两个不同角度去全面描述其数量特征。正确地选择统计描述手段和指标是科研工作者必须掌握的基本功之一。统计推断是指根据观测数据所提供的信息,对未知总体的情况作出具有一定概率保证的估计和推断,包括假设检验和参数估计两大内容。假设检验是指根据观测数据提供的信息,对从推断目的出发而提出的某种假设进行检验,得出这一假设是应当拒绝还是尚不能加以拒绝的统计结论。假设检验在医学科研中有着广泛的用途,可供选择的假设检验方法也很多。在实际应用中要根据推断目的、资料的性质、实验设计的类型以及样本的大小进行正确的选择。例如,对成组设计的两组计量资料的样本均数差别的比较最好选用t检验;对成组设计的三组以上计量资料的样本均数差别的比较则要选用F检验;对两组或两组以上计数资料的样本率差别的比较需选用χ2检验等。
  参数估计是指根据观测数据提供的信息,对反映总体数量特征的客观指标参数作出科学地估计和推断。例如,根据对若干例急性克山病患者血磷值的测定,估计推断所有急性克山病患者血磷的总体平均水平。具体的估计推断方法要根据估计的是哪个参数、总体的分布形式以及样本的大小进行合理的选择。无论是假设检验还是参数估计,都需要有一定数量的观测值作为基础。这是因为所有的医学现象,无论是健康现象还是疾病现象都存在着变异(即医学上所说的个体差异),只有通过一定数量的观测才能把隐藏在变异后面的客观规律显现出来。在一次研究中究竟观测多大的样本合适,可以根据观测数据的变异程度和对推断结论的具体要求(如最大允许误差、允许犯Ⅰ类错误的概率、允许犯Ⅱ类错误的概率等),按照一定的统计学公式计算出来。

刘勖 张卫国 许元生著
中华物理医学杂志1998年6月第20卷第2期