医学统计学名词解释、简答、问答

发布时间：2020-03-02 02:52:52 来源：范文大全收藏本文下载本文手机版

名词解释

1.总体：总体（population）是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。2.随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。3.变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。4.计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。5．概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P（A）= m/n。6.随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。7．系统误差：系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在真值的两侧，而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。8．随机变量：随机变量（random variable）是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布9．参数：参数（paramater）是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数10．统计量：统计量（statistic）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。11.频数表（frequency table）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2„个病人的天数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。12.算术均数（arithmetic mean）描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。13.几何均数（geometric mean）用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。14.中位数（median）Md将一组观察值由小到大排列，n 为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。15.极差（range）亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。16.百分位数（percentile）是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。17.四分位数间距（inter-quartile range）是由第3 四分位数和第1 四分位数相减计算而得，常与中位数一起使用，描述偏态分布资料的分布特征，较极差稳定。18.方差（variance）：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。19.标准差（standard deviation）是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为常用。20.变异系数（coefficient of variation）用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算：标准差/均数*100% 21.统计推断：通过样本指标来说明总体特征，这种从样本获取有关总体信息的过程称为统计推断（statistical inference）。22.抽样误差：由个体变异产生的，抽样造成的样本统计量与总体参数的差异，称为抽样误差（sampling error）。23.标准误及X s ：通常将样本统计量的标准差称为标准误。许多样本均数的标准差X s称为均数的标准误（standard error of mean，SEM ），它反映了样本均数间的离散程度，也反映了样本均数与总体均数的差异，说明均数抽样误差的大小。24.可信区间：按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间（confidence interval，CI）。它的确切含义是：可信区间包含总体参数的可能性是1- α ，而不是总体参数落在该范围的可能性为1-α 。25.参数估计：指用样本指标值（统计量）估计总体指标值（参数）。参数估计有两种方法：点估计和区间估计。26.假设检验中P 的含义：指从H0 规定的总体随机抽得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。27.I 型和II 型错误：I 型错误（type I error ），指拒绝了实际上成立的H0，这类“弃真”的错误称为I 型错误，其概率大小用α表示；II 型错误（type II error），指接受了实际上不成立的H0，这类“存伪”的误称为II 型错误，其概率大小用β表示。28.检验效能：1- β称为检验效能（power of test），它是指当两总体确有差别，按规定的检验水准a 所能发现该差异的能力。29.检验水准：是预先规定的，当假设检验结果拒绝H0，接受H1，下“有差别”的结论时犯错误的概率称为检验水准（level of a test），记为α 。 30..率（rate）又称频率指标，说明一定时期内某现象发生的频率或强度。计算公式为：发生某现象的观察单位数/可能发生某现象的观察单位总数*100%，表示方式有：百分率（%）、千分率（‟）等。31.构成比（proportion）又称构成指标，说明某一事物内部各组成部分所占的比重或分布。计算公式为：某一组 1

成部分的观察单位数/同一事物各组成部分的观察单位总数*100%，表示方式有：百分数等。32.比（ratio）又称相对比，是A、B 两个有关指标之比，说明A 是B 的若干倍或百分之几。计算公式为：A/B ，表示方式有：倍数或分数等。

33.非参数统计：针对某些资料的总体分布难以用某种函数式来表达，或者资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制，故称非参数统计法（non-parametric statistics），或称为不拘分布（distribution-free statistics）的统计分析方法，又称为无分布型式假定（aumption free statistics）的统计分析方法。34.参数统计：通常要求样本来自总体分布型是已知的（如正态分布），在这种假设的基础上，对总体参数（如总体均数）进行估计和检验，称为参数统计(parametric statistics)35.秩次：变量值按照从小到大顺序所编的秩序号称为秩次（rank）。

36.秩和：各组秩次的合计称为秩和（rank sum），是非参数检验的基本统计量。37.直线回归（linear regreion）建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种，故又称简单回归（simple regreion）。38.回归系数（regreion coefficient ）即直线的斜率(slope)，在直线回归方程中用b 表示，b 的统计意义为X每增（减）一个单位时，Y平均改变b 个单位。

39.相关系数r：用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。

简答题

1.医学统计工作的内容：1)实验设计2)收集资料3)整理资料4)分析资料2.资料的类型：1)计量资料2)计数资料3)等级分组资料。3.抽样包括四种特征：1)代表性2)随机性3)可靠性4)可比性。4.频数表的编制方法和应注意的问题：1)确定组数2)确定组距3)确定组限4)用手工编制划计表.5.正态分布的几个主要特征：1)正态分布以均值u为中心，左右对称。2)正态分布中曲线下面积集中以均值u为中心的中心部分，越远离中心曲线越接近X轴曲线下面积越小，超过一定范围以外的面积可以忽略。3)正态分布曲线下的面积分布有一定的规律。4)正态分布完全由参数u和6决定，当6一定后u增大，曲线沿横轴向右移动，反之u减小曲线沿横轴向左移动。6.总体均数的估计方法有两种：

1）点估计2）区间估计7.T分布的特点：分布曲线的形态变化与自由度V(V=N—1)有关，当自由度V逼近OO时，T分布趋向于标准正态分布。8.配对设计主要有三种情况：1）两种同质受试对象分别接受两种处理，如：把同窝同性别和体重相近的动物配成一对，或把同性别和年龄相近的相同病人配成一对。2）同一受试对象或同一样本的两个部分，分别接受两种不同处理。3）自身对比，即将同一受试对象处理前后的结果进行比较。9.总体方差具有齐性时的两独立样本T检验：两独立样本T检验的检验统计量在H0：即＝0的条件下为：。10.假设检验中的两类错误：1）型错误：指拒绝了实际上成立的H0即”弃真”的错误，其概率用表示。2）型错误：指接受了实际上不成立的H0即“存伪”的错误，其概率用表示。11.相对数常用的种类有：率构成比相对比12.相对数使用应注意的问题:1)不要把构成比与率相混淆。2）使用相对数时，分母不宜过小。3）要注意资料的可比性。4）要注意使用率的标准化。5）要考虑存在抽样误差。13.T分布图形特征：1）单峰分布：以0为中心，左右对称，类似于标准正态分布的单峰分布。2）T分布图形不是一条曲线，而是一族曲线其形态变化与自由度大小有关，自由度越小，则SX越大。T值越分散，曲线的峰部越矮尾部越粗，则T分布曲线越低。3）自由度V越大，T分布越接近于正态分布。14.方差分析的三种变异：1）总变异

2）组间变异3）组内变异自由度V=N-1 （例数）V=K-1 （组数） V=N-K（例数－组数）15.标准化的意义：是为了在比较两个不同人群的患病率发病率死亡率等资料时，消除其内部构成（如：年龄性别工龄病情长短等）的影响。16.常用疾病统计的指标：1）发病率：表示某一时期内某人群中患某病新病例的频率。2）患病率：表示某一时点某人群中患某病的频率。3）病死率：表示某期间内某病患者中因某病死亡的频率。4）治愈率：表示接受治疗的病人中治愈的频率。17.X的适用条件：1）当N 40有理论频数1 T 5时，须对X值进行连续性校正。 2）若遇到总倒数N 40或有理论频数T 1，即使采用校正公式计算的X值也会有偏差。因此，直接计算有利于拒绝H0的概率，以作出检验判断的方法。18.非参数检验方法适用于：1）总体分布为偏态或分布形态未知的计量资料2）等级资料3）个别数据偏大或数据的某一端无确定数值4）各组离散程度相差悬殊，即各总体方差不齐。如：有一题需列出：不满意满意很满意非常满意等，则选用非参数检验方法。19.非参数检验的优点为：适应性强缺点为：非参数检验方法犯第二类错误的可能性大于参数检验法，对于适合参数检验的资料最好还是用参数检验20.统计图通常由五部分组成：1）标题2）图域3）标目4）图例5）刻度21.统计图和统计表的作用：代替文字，以表或图的形式进行了阐述。22.怎样确定P值：

（1）当N 25时，可查T界值表，T越小P越小。当N 25时，无法查T界值表，可按近似正态分布用u检验（2）如果T值在查表界值内 0.05；如果T值在查表界值外 0.05.23.常用的统计图有：直系图百分系图圆图直方图构成图。

24.样本均数的抽样分布具有以下特点：1）各样本均数未必等于总体均数2）样本之间存在差异3）样本均数的分布很有规律，围绕着总体均数中间多两边少左右基本对称，也服从对称分布4）样本均数变异较原变量的差异大大缩小。25.直方图与直条图区别：1）直方图：适用于表示连续变量频数分布情况。2）直条图：适用于无连续关系，各自独立的统计指标。26.圆图与百分条图：1）圆图：是一种构成图，适用于构成比资料，在圆图中圆的总面积表示事物的全部，而圆内的各扇形面积用来表示全体中各部分所占的比。2）百分条图：也是一种构成图，用矩形条子的面积表示事物全部，而用其中各段表示各构成部分。27.方差分析的应用条件：各样本相互独立且均来自总体方差具有齐性的正态分布。问答题

1、标准正态分布（u分布）与t分布有何异同？

相同点：集中位置都为0，都是单峰分布，是对称分布，标准正态分布是t分布的特例（自由度是无限大时）

不同点：t分布是一簇分布曲线，t 分布的曲线的形状是随自由度的变化而变化，标准正态分布的曲线的形状不变，是固定不变的，因为它的形状参数为1。

3、简述直线回归与直线相关的区别。

1资料要求上不同：直线回归分析适用于应变量是服从正态分布的随机变量，自变量是选定变量；直线相关分析适用于服从双变量正态分布的资料。

2 两种系数的意义不同：回归系数是表明两个变量之间数量上的依存关系，回归系数越大回归直线越陡峭，表示应变

量随自变量变化越快；相关系数是表明两个变量之间相关的方向和紧密程度的，相关系数越大，两个变量的关联程度越大。

4、抽样中要求每一个样本应该具有哪三性？

从总体中抽取样本，其样本应具有“代表性”、“随机性”和“可靠性”。

（1）代表性: 就是要求样本中的每一个个体必须符合总体的规定。

（2）随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。

（3）可靠性: 即实验的结果要具有可重复性，即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多，可靠性会越大，但是例数增加，人力、物力都会发生困难，所以应以“足够”为准。需要作“样本例数估计”。

5、什么是两个样本之间的可比性？

可比性是指处理组（临床设计中称为治疗组）与对照组之间，除处理因素不同外，其他可能影响实验结果的因素要求基本齐同，也称为齐同对比原则。

6、什么叫医学统计学？医学统计学与统计学、卫生统计学、生物统计学有何联系与区别？医学统计学：是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学：是研究数据的收集、整理、分析与推断的科学。卫生统计学：是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。生物统计学：是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。

7、医学统计的资料主要来源于那些方面？有何要求？

医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据；现场调查资料主要来源于大规模的流行病调查获取的资料；医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等；报表有卫生工作基本情况年报表、传染年（月、日）报表、疫情旬（年、月、日）报表等；报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。这些资料的手机过程中，必须进行质量抗旨，包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。

8、医学统计学的资料类型有哪些？

（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、12体重(kg)、红细胞计数(10/L)、脉搏（次/分）、血压（KPa）等。

（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。

9、常见的三类误差是什么？应采取什么措施和方法加以控制？

常见的三类误差是：（1）系统误差：在收集资料过程中，由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因，可造成观察结果倾向性的偏大或偏小，这叫系统误差。要尽量查明其原因，必须克服。

（2）随机测量误差：在收集原始资料过程中，即使仪器初始状态及标准试剂已经校正，但是，由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如，实验操作员操作技术不稳定，不同实验操作员之间的操作差异，电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制，至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施，从而达到控制的目的。（3）抽样误差：即使在消除了系统误差，并把随机测量误差控制在允许范围内，样本均数（或其它统计量）与总体均数（或其它参数）之间仍可能有差异。这种差异是由抽样引起的，故这种误差叫做抽样误差，要用统计方法进行正确分析。

10、试述频数表的要素及用途。

要素：组段，频距。用途：① 描述资料的分布特征和分布类型。频数分布有两个重要特征：集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势，常用平均数指标来表示，各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少，称离散趋势，是个体差异所致，可用一系列的变异指标来反映。 ② 便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时，常先编制频数表，再进行统计计算。 ③ 发现特大、特小的可疑值。如果频数表的一端或两端出现连续几个组段的频数为零后，又出现少数几个特大值或特小值，使人怀疑其是否准确，需进一步检查和核对并做相应处理。 ④ 当样本含量比较大时，可用各组段的平率作为概率的估计值。

11、描述单变量资料的统计指标分哪两大类，分别是什么指标？分类：①描述数据分布集中趋势的指标：算术均数、几何均数、中位数。 ②描述数据分布离散程度的指标：极差、四分位数间距、方差、标准差、变异系数。

12、试述平均数、标准差、变异系数的含义及用途？

13、标准正态分布曲线下面积有何分布规律？

所有的正态分布曲线，在υ左右的相同倍数的标准差范围内的面积相同。并且，在υ±σ范围内的面积约为68.3%；在υ±1.96σ范围内的面积约为95%；在υ±2.58σ范围内面积约为99%。

14、同一资料的标准差是否一定小于均数？

均数和标准差是两类不同性质的统计指标.标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小.标准差可大于均数,也可小于均数。

15、标准差与标准误有何区别和联系？

•区别：1.含义不同:⑴sx）之间的变异度大小，s越大，变量值（x）越分散；反之变量值越集中，均数的代表性越强。⑵标准误是描述样本均数之间的变异度大小，标准误越大，样本均数与总体均数间差异越大，抽样误差越大；反之，样本均数越接近总体均数，抽样误差越小。2.与n的关系不同： n增大时，⑴sσ（恒定）。 ⑵标准误减少并趋于0（不存在抽样误差）。3.用途不同: ⑴s:表示x的变异度大小，计算cv，估计正常值范围，计算标准误等 ⑵ :参数估计和假设检验。•联系：二者均为变异度指标，样本均数的标准差即为标准误，标准差与标准误成正比。

16、简述Ⅰ型错误和Ⅱ型错误的区别和联系。

·区别：Ⅰ型错误（弃真）：拒绝实际成立的H0，型错误的概率记为α。（1－a）即置信度:重复抽样时，样本区间包含总体参数（μ）的百分数。当p≤α而拒绝H0时，只能犯Ⅰ型错误，不可能犯Ⅱ型错误。

Ⅱ型错误（存伪）：不拒绝实际不成立的H0，Ⅱ型错误的概率记为β。（1－β）即把握度（或检验效能：两总体确有差别，被检出有差别的能力。当p≥α而拒绝H0时，只能犯Ⅱ型错误，不可能犯Ⅰ型错误。

·联系：对同一资料，α与β反方向变化，若要同时减小α与β，唯一的办法是增加样本含量。

17、可信区间与参考值范围的不同点。

应注意：可信区间与参考值范围的意义、计算公式和用途均不同。1.从意义和用途来看95％参考值范围是指同质总体内包括95％个体值的估计范围，而总体均数95％可信区间是指按95％可信度估计的总体均数的所在范围。可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计变量值的分布范围，变量值可能很多甚至无限。2.从计算公式看：若指标服从正态分布，95％参考值范围的公式是：±1.96s。总体均数95％可信区间的公式是：

。前者用标准差，后者用标准误。前者用1.96，后者用α为0.05，自由度为v的t界值。

18、在统计推断中，如何区别单侧检验和双侧检验？

如果将拒绝性概率平分于理论抽样分布的两侧，称为双侧检验。例如选定显著性水平α= 0.05，双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边，每边占有 =0.025。双侧检验只强调差异是否显著而不强调方向性。如果将拒绝性概率置于理论抽样分布的一侧（左侧或右侧），称为单侧检验（右侧检验或左侧检验）。单侧检验强调差异的方向性。在具体的假设检验中，选择双侧检验或单侧检验可分为以下三种情况：第一种：H0：μ=μ0 ：μ≠μ0双侧第二种：H0：μ≥μ0 ：μ＜μ0单侧（左侧）第三种：H0：μ≤μ0 ：μ＞μ0单侧（右侧）

19、t检验、z检验的公式有那些类型，在应用上有何异同？

t检验：当样本例数n较小时，要求样本取自正态总体。 t检验的类型：单样本t检验，独立t检验，配对t检验z检验：样本例数较大，或n虽小而总体标准差已知。

20、假设检验和总体均数区间估计有何联系？

假设检验：是对总体做出某种假定，然后根据样本信息推断总体是否成立的一类统计学方法总称。假设检验有三个基本步骤：①建立假设和确定检验水准；②选择检验方法和计算检验统计量；③确定P值和做出统计推断结论。总体均数的估计：

1、点估计：样本统计量直接作为总体指标的估计值。它未考虑抽样误差的大小。

2、区间估计：按预先给定的概率(1-α)确定的包含未知总体参数的可能范围。

21、方差分析的基本思想是什么？

方差分析（analysis of variance，ANOVA ）的基本思想就是根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和（sum of squares of deviations from mean，SS）和自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个因素的作用（或某几个因素的交互作用）加以解释，如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小，借助F 分布作出统计推断，判断各因素对各组均数有无影响。

22、t检验和F检验的使用条件和应用范围有何异同？

t检验适用于两个样本均数的比较，F检验适用于多个样本的比较。t检验的应用条件：要求各样本来自相互独立的正态总体且各总体方差齐。方差分析的应用条件（1）各样本是相互独立的随机样本，且来自正态分布总体。（2）各样本的总体方差相等，即方差齐性。

23率的标准化的意义及基本思想。

当比较的两组资料内部各小组率明显不同，且各小组观测例数的构成比也明显不同时，直接比较两个合计率是不合理的。因为期内部构成比不同，往往影响合计率的大小，需要统一的内部构成进行调整后计算标准化率，使其具有可比性，这种方法称为率的标准化。率的标准化的基本思想：要比较两个总率时，发现两组资料的内部构成（如年龄、性别构成等）存在明显不同，而且影响到了总率的结果，这时就不宜再直接比较总率，而应考虑采用标准化法。标准化法的基本思想，就是采用统一的标准（统一的内部构成）计算出消除内部构成不同影响后的标准化率（调整率），然后再进行比较。

24常用相对数指标有哪些？它们在计算和意义上有何不同？

率（强度相对数，频率相对数）、构成比、相对比应用相对数时应注意的问题：⑴ 计算相对数的分母一般不宜过小。⑵ 分析时不能以构成比代替率。⑶ 不能用构成比的动态分析代替率的动态分析。⑷ 对观察单位数不等的几个率，不能直接相加求其总率。⑸ 在比较相对数时应注意可比性。⑹ 对样本率（或构成比）的比较应随机抽样，并做假设检验。

25卡方检验的使用范围和各个公式的适用条件是什么？

卡方检验用于：推断两个及两个以上总体率或构成比是否有差别，两个分类变量间有无相关关系，多个率的趋势检验，以及两个率的等效检验等。此外，也用于频数分布的拟合优度检验。

对不同的设计类型的资料，检验的应用条件不同：(1) 完全随机设计两样本率的比较1) 当n＞40，且T≥5时，用非连续性校正值；若所得P≈α，则改用四格表的确切概率法。2) 当n≥40，且有1≤T＜5时，用连续性校正值。3) n＜40，或有T＜1时，不能用检验，应当用四格表的确切概率法。 (2) 配对设计四格表1) 当b+c≥40，2) 当b+c

意义：由于抽样的原因所造成的样本率与总体率的不一致就是率的抽样误差。率的抽样误差的大小是用率的标准误来表示。用途：①表示抽样误差的大小，说明样本率的代表性、可靠性。②对总体率的可信区间进行估计

27、非参数统计方法的概念及适用范围。

概念：样本所来自的总体分布难以用某种函数式来表达，还有一些资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制，故称非参数统计法，或称为不拘分布的统计分析方法，又称为无分布型式假定的统计分析方法。它检验的是分布，而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。适用范围：（1）等级资料。（2）偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换，或虽经变量变换仍未达到正态或近似正态分布时，宜用非参数检验。（3）各组离散程度相差悬殊，即方差明显不齐，且不能变换达到齐性。（4）个别数据偏离过大，或资料为单侧或双侧没有上限或下限值。（5）分布类型不明。（6）初步分析。有些医学资料由于统计工作量大，可采用非参数统计方法进行初步分析，挑选其中有意义者再进一步分析(包括参数统计内容)。（7）对于一些特殊情况，如从几个总体所获得的数据，往往难以对其原有总体分布作出估计，在这种情况下可用非参数统计方法。

28、非参数检验的优缺点。优点：①非参数统计方法要求的假定条件比较少，因而它的适用范围比较广泛。 ②多数非参数统计方法要求的运算比较简单，可以迅速完成计算取得结果，因而比较节约时间。 ③大多数非参数统计方法在直观上比较容易理解，不需要太多的数学基础知识和统计学知识。 ④大多数非参数统计方法可用来分析如象由等级构成的数据资料，而对计量水准较低的数据资料，参数统计方法却不适用。 ⑤当推论多达3个以上时，非参数统计方法尤具优越性。缺点：①由于方法简单，用的计量水准较低，因此，如果能与参数统计方法同时使用时，就不如参数统计方法敏感。若为追求简单而使用非参数统计方法，其检验功效就要差些。这就是说，在给定的显著性水平下进行检验时，非参数统计方法与参数统计方法相比，第Ⅱ类错误的概率β要大些。 ②对于大样本，如不采用适当的近似，计算可能变得十分复杂。注意: 凡符合或经过变换后符合参数检验条件的资料，最好用参数检验。当资料不具备参数检验的条件时，非参数检验是一种有效的分析方法。

29、相关与回归的联系和区别。区别：

意义：相关反映两变量的相互关系，即在两个变量中，任何一个的变化都会引起另一个的变化，是一种双向变化的关系。回归是反映两个变量的依存关系，一个变量的改变会引起另一个变量的变化，是一种单向的关系。应用：研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。研究性质：相关是对两个变量之间的关系进行描述，看两个变量是否有关，关系是否密切，关系的性质是什么，是正相关还是负相关。回归是对两个变量做定量描述，研究两个变量的数量关系，已知一个变量值可以预测出另一个变量值，可以得到定量结果。相关系数r与回归系数b ：r与b的绝对值反映的意义不同。r的绝对值越大，散点图中的点越趋向于一条直线，表明两变量的关系越密切，相关程度越高。b的绝对值越大，回归直线越陡，说明当X变化一个单位时，Y的平均变化就越大。反之也是一样。联系：

2r与b值可相互换算；r与b正负号一致；r与b的假设检验等价；回归可解释相关。相关系数的平方r(又称决定系数)是回

归平方和与总的离均差平方和之比，故回归平方和是引入相关变量后总平方和减少的部分。

30、直线相关、秩相关的区别与联系。

区别：(1)资料要求不同：直线相关要求x、y是来自双变量正态总体的随机变量；秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。(2)相关意义不同：直线相关表示两变量的直线相关关系存在，秩相关表示两变量的相关关系。联系:相关系数的取值范围相同；秩相关将原始数据进行秩变换，以秩次计算直线相关系数。

31、统计表及统计图的制表原则和要求。

统计表：(1) 统计表的制表原则1) 应重点突出，即一张表一般只包括一个中心内容，内容较多时可以用多个表格表达不同指标和内容。2) 统计表要层次清楚，即标目的安排及分组符合逻辑，便于分析比较。主谓分明，通常主语放在表的左边，作为横标目；谓语放在右边，作为纵标目。由左向右读，构成完整的一句话。但若统计表的主语项目少而谓语项目多或主语项目多而谓语只有一项，亦可将纵标目作主语、横标目作谓语，阅读时从上至下。3) 统计表应简单明了，一切文字、数字和线条都应尽量从简。

(2) 制表要求：统计表通常由标题、标目、线条、数字4部分组成。表中数字区不插入文字，也不列备注项。必须说明者标“*”号等，在表下方说明。1) 标题：应高度概括表的主要内容，一般包括研究的时间、地点和研究内容，左侧加表号，置于表的上方。2) 标目：有横标目和纵标目，分别说明表格每行和每列数字的意义。横标目位于表头的左侧，代表研究的对象；纵标目位于表头右侧，表达研究对象的指标。注意标明指标的单位。3) 线条：力求简洁，多采用三条线，即顶线、底线、纵标目下横线。部分表格可再用短横线将“合计”分隔开，或用短横线将两重纵标目分割开。其它竖线和斜线一概省去。4) 数字：用阿拉伯数字表示。同一指标小数点位数一致，位次对齐。表内不留空项，无数字用“—”表示，缺失数字用“”表示，数值为0者记为“0”。统计图：①根据资料性质和分析目的正确选用适当的统计图。②除圆图外，一般用直角坐标系的第一象限的位置表示图域（制图空间），或者用长方形的框架表示。③

绘制图形应注意准确、美观，给人以清晰的印象。

32、常见的统计图有哪几种？它们的使用条件各是什么？

常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图、统计地图、箱式图等。·直条图：适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标。指标既可以是绝对数，也可以是相对数。·直方图：主要应用于频数分布资料，描述连续变量的频数分布。百分比条图和圆图：表示事物内部各构成部分所占的比重，适合描述分类变量的各类别所占的构成比。其中，百分比条图特别适合作多个构成比的比较。·线图：适合于描述某统计量随另一连续性数值变量的变化而变化的趋势，常用于描述统计量随时间变化而变化的趋势。普通线图描述的是绝对变化趋势，半对数线图描述的是相对变化趋势，特别适宜作不同指标或相同指标不同组别的变化速度的比较。·散点图：以直角坐标上点的密集程度和趋势来表示两个变量间的相关关系。·统计地图：以不同的颜色和花纹表示统计量的值在地理分布上的变化，适宜描述研究指标的地理分布。·箱式图：通过使用5个统计量（数据分布的中心位置、分布、偏度、变异范围和异常值）来反映原始数据的分布特征。特别适合多组数据分布的比较。

33普通线图和半对数线图的主要区别是什么？

从形式上看，二者的不同点在于纵坐标的尺度不同，普通线图的纵坐标为算术尺度，而半对数线图的纵坐标为对数尺度。从用途上看，普通线图描述的是统计量的绝对变化趋势，半对数线图描述的是相对变化趋势，特别适宜作不同指标或相同指标不同组别的变化速度的比较。

34四种基本抽样方法的概念、优缺点和应用条件是什么？

(1) 单纯随机抽样：是在总体中以完全随机的方法抽取一部分观察单位组成样本，其整个抽样过程，都体现了随机化的原则。单纯随机抽样的优点：简单直观，是最基本的概率抽样方法，也是其他概率抽样方法的基础。单纯随机抽样的缺点：当总体例数较多时，编号麻烦，实际工作中难以实施；样本分散，组织困难。单纯随机抽样方法多用于总体例数较少的情况。 (2) 系统抽样：是将总体的观察单位，按一定顺序号平均分成n个部分，每一部分抽取第k号观察单位组成样本，这里的k是随机确定的，其体现了系统抽样中的随机性。系统抽样的优点是：1) 易于理解，简便易行；

2) 容易得到一个按比例分配的样本；3) 一般情况下样本的观察单位在总体中分布均匀，其抽样误差小于单纯随机抽样。系统抽样的缺点是如果总体中观察单位按顺序有周期趋势或单调递增（减）趋势时，采用系统抽样可能产生明显的系统误差。系统抽样方法多用于观察单位具有现成且与试验无关的自然编号，同时观察单位在总体中分布均匀。 (3) 整群抽样：是先将总体按照某种与主要研究指标无关的特征划分为K个“群”，每个群包含若干观察单位，然后再随机抽取k个“群”，由抽取的各个群的全部观察单位组成样本。其随机性主要体现在“群”的抽取过程。整群抽样的优点是便于组织调查、易于质量控制和节省调查成本。整群抽样的缺点是当样本含量一定时，因为样本观察单位并非广泛散布于总体中，整群抽样的抽样误差一般大于单纯随机抽样。整群抽样较为常用，尤其当“群”间的个体变异较小时。

(4) 分层抽样：是先按对主要研究指标影响较大的某种特征，将总体分为若干类别（统计上称之为“层”），再从每一层内随机抽取一定数量的观察单位，合起来组成样本。其随机性体现在层内的抽样过程。分层抽样的优点是：1) 由于分层后增加了层内的同质性，观察指标变异减小，各层的抽样误差减小。2) 分层抽样便于对不同层采用不同的抽样方法。3) 分层抽样便于对各层独立进行分析。分层抽样的缺点是：层间变异较大，抽样误差较小；如果分层特征选择不当，层内变异较大，层间变异较小，抽样误差仍然较大，分层抽样就失去了意义。一般情况下，当样本含量一定，几种方法抽样误差大小的排序为：分层抽样≤系统抽样≤单纯随机抽样≤整群抽样。

35何谓调查研究和实验研究？各自的特点是什么？

调查研究：是指研究者通过客观地观察、描述调查对象来搜集资料，未加任何的干预措施。实验研究：是指研究者根据研究假设主动地对研究对象加以干预措施，并观察总结其结果，回答研究假设所提出的问题。

36何谓实验效应，对实验效应指标的要求是什么？

实验效应：指处理作用于实验对象的反应，一般是通过某些观察指标，定量或定性地反映实验效应。选择观察指标的基本原则：指标的选择必须与研究目的密切关联客观性尽可能选择客观指标，避免一些笼统的、不确切的指标。准确性选用的指标应尽量精确。灵敏性和特异性实验效应指标应当同时兼顾其灵敏性和特异性，尽量使灵敏性和特异性都高。

37实验研究中为什么要设立对照，常见的对照有几种，各自有何特点？

设立对照组的目的是衬托处理因素的效应。对照原则：所设立的对照组必须与实验组达到均衡可比。除干预措施外，组间其他影响结果的非处理因素等尽可能相同。对所研究疾病的易感度及发病机会相等。检测和观察方法及诊断标准必须一致。自身对照对照与实验在同一受试者身上进行，如用药前后作为对比。

空白对照对照组不施加任何处理因素。安慰剂对照主要目的是为了平衡对照组病人心理因素的影响。实验对照（阳性对照）对照组不施加处理因素，但施加某种实验因素。标准对照不设立专门的对照组，而是用现有标准值或正常值做对照。历史对照

38实验设计为什么要遵循重复原则，影响重复性的因素有哪些？

重复原则包含重现性和观察单位数量两方面的含义。可靠的实验结果应能在相同的条件下重现；可靠的实验结论也不能凭一次实验或3～5例结果获得，一定要有足够量的观察单位数。