您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 商务与经济统计关键术语与重要公式
关键术语统计学(Statistics)收收集、分析、表述和解释数据的艺术和科学。数据(Data)收被收集、分析和解释的事实与数字。数据集(Dataset)收一特定研究中所有收集的数据。个体(Elements)收从中收集数据的实体。变量(Variable)收个体的某种令人感兴趣的属性。观测值(Observation)收为单个个体获取的度量集。品质数据(Qualitativedata)收为一个体的性质提供标记或名称的数据。品质数据可能是非数值或数值型的。品质变量(Qualitativevariable)收有关品质数据的变量。数量数据(Quantitativedata)收表明某事多少的数据。数量数据总是数值型的。数量变量(Quantitativevariable)收有关数量数据的变量。截面数据(Cross-sectionaldata)收在同时或近似相同时点收集的数据。时间序列数据(Timeseriesdata)收在几个连续期间收集的数据。描述统计学(Descriptivestatistics)收用于汇总数据的表、图和数值方法。总体(Population)收一特定研究中所有感兴趣个体的集合。样本(Sample)收总体的一个子集。统计推断(Statisticalinference)收利用从一个样本获得的数据对总体性质进行估计或假设检验的过程。频数分布(Frequencydistribution)对一数据集的表格汇总法,显示若干无重叠组别中每一组的项目频数(或个数)。相对频数分布(Relativefrequencydistribution)一数据集的表格汇总法,显示在若干无重叠组别中每一组的项目总数的相对频数,即分数或比例。百分数频数分布(Percentfrequencydistribution)一数据集的表格汇总法,显示几个无重叠组别中每一组的项目总数的百分率。条形图(Bargraph)一种图形方法,描述在品质数据的频数分布、相对频数据分布或百分数频数分布中表示的信息。饼形图(Piechart)一种描述品质数据汇总的图形方法,建立于把一个圆细分成与每一组的相对频数相对应的扇型的基础上。直方图(Histogram)一种通过在横轴上放置组间隔,在纵轴上放置频数来描述数量数据的频数分布、相对频数分布或百分数频数分布。累积频数分布(Cumulativefrequencydistribution)对数量数据集的表格法汇总,显示数值小于或等于每一组组上限的项目数。累积相对频数分布(Cumulativerelativefrequencydistribution)对数量数据的表格法汇总,显示数值小于或等于每一组组上限的项目分数或比例。累积百分数频数分布(Cumulativepercentfrequencydistribution)对数量数据的表格法汇总,显示数值小于或等于每一组组上限的项目的百分率。组中值(Classmidpoint)每一组中在组下限和组上限正中间的值。茎叶显示(Stem-and-leafdisplay)一种同时排列数量数据顺序并提供分布形态的深入信息的探索性数据分析技术。交叉分组列表(Crosstabulation)对两个变量数据的表格汇总。一个变量的组用行来描述,另一变量的组用列来描述。散点图(Scatterdiagram)表示两个数量变量之间关系的图形方法。一个变量列在横轴上,另一个变量列在纵轴上。总体参数(Populationparameter)用来概括总体数据的量度的数值(如总体平均数,总体方差2,总体标准差)。样本统计量(Samplestatistic)用来概括样本数据的量度的数值(如样本平均数,样本方差s2,样本标准差s)。平均数(Mean)衡量数据集中心位置的量度。用所有数据值相加的和除以项数计算。中位数(Median)衡量数据集中心位置的量度。中位数的值将所有的数据分为两个相等部分,一部分的值都大于或等于它,而另一部分的值都小于或等于它。众数(Mode)用以衡量数据的位置的量度,定义为发生频数最高的数据值。百分位数(Percentile)至少有p%的数据项小于等于这个值,且至少有(100-p)%的数据项大于等于这个值。第50百分位数即为中位数。四分位数(Quartiles)第25、第50和第75百分位数分别即为第1、第2、第3四分位数。四分位数将数据集分为4个部分,每一部分含有25%的数据。临界点(Hinges)下端临界点约等于第1四分位数或第25百分位数。上端临界点约等于第3四分位数或第75百分位数。由于计算约定的不同,临界点的值与四分位数的值会稍有不同。全距(Range)用以衡量变异程度的量度,定义为最大值减最小值的差。四分位点内距(Interquartilerange,IQR)用以衡量变异程度的量度,定义为第3四分位数与第1个四分位数之差。方差(Variance)用以衡量数据集变异程度的量度,是建立在距平均数离差的平方值的基础上的。标准差(Standarddeviation)用以衡量数据集变异程度的量度,取方差的正的平方根。标准差系数(Coefficientofvariation)衡量数据集相对变异程度的量度,以标准差除以平均数再乘以100得到。Z分数(Z-score)以距平均数的离差除以标准差s所得的值。Z分数是标准化的数值,指数据值xi距离平均数的标准差的个数。切贝谢夫定理(Chebysher’stheorem)这一定理可以用于任何数据集,用来描述与平均数的距离在特定数目个标准差范围之内的数据项的百分比。经验法则(Empiricalrule)这一法则适用于山峰形或钟形分布的数据,用以描述与平均数的距离在1个、2个、3个标准差范围之内的数据项的百分比。异常值(outlier)异常大或异常小的数据值。五数概括法(Five-numbersummary)是一种探索性数据分析的技术。用五个数据值:最小值、第1四分位数、平均数、第3四分位数和最大值来概括数据集。盒形图(Boxplot)一种用图形概括数据的方法。用一个以第1和第3四分位数为边界的方盒来表明在中心位置的50%的数据。以一条横线(称为须线)从方盒两侧延伸以表明大于第3四分位数和小于第1四分位数的数据值的位置。所有异常值的位置也予以标明。协方差(Covariance)用以衡量两变量间线性相关关系的数值量度。正值表示正相关,负值表示负相关。相关系数(Correlationcofficient)用以衡量两变量间线性相关关系的数值量度。其取值从-1到+1。接近+1的值表示强的正线性相关,接近-1的值表示强的负线性相关,接近零的值表示几乎无线性相关关系。加权平均数(Weightedmean)将每一个数据值予以一个权重以反映其在数据集中的重要程度。由此获得的平均数即为加权平均数。分组数据(Groupeddata)将数据分为若干个组并配以频数分布,而不记录原始数据的个体值。概率(probability)衡衡量某一事件发生可能性的数值量度。试验(Experient)衡任何可以产生明确定义的结果的过程。试验结果用符号Ei表示。样本点(Samplepoint)衡单一的试验结果。样本空间(Samplespace)衡所有可能的样本点(试验结果)的集合。树形图(Treediagram)衡一种用于多步骤试验样本点的定义的辅助图形工具。概率的基本条件(Basicrequirementsofprobability)衡概率分配方式必须满足两个基本条件:a.对于任意一个试验结果Ei,必须有0≤P(Ei)≤1。b.所有的k个试验结果满足ΣP(Ei)=1。古典法(Classicalmethod)衡一种概率分配的方法,它假设试验结果都是等可能发生的。相对频数法(Relativefrequencymethod)衡一种以试验或历史数据为基础的概率分配方法。主观法(Subjectivemethod)衡一种以主观判断为基础的概率分配方法。事件(Event)衡一个样本点的集合。事件A的补(ComplementofeventA)衡由所有不包含在A的样本点构成的事件。文氏图(Venndiagram)衡一种抽象表明样本空间和事件运算的辅助图形工具。事件A和事件B的并(UnionofAandB)衡所有的属于A或B或同时属于二者的样本点构成的事件。A和B的并记作A∪B。事件A和事件B的交(IntersectionofAandB)衡同时属于A和B的样本点构成的事件。A和B的交记作A∩B。加法公式(Additionlaw)衡加法公式用于计算事件的并的概率,即P(A∪B)。公式为P(A∪B)=P(A)+P(B)-P(A∩B)。对于互斥事件,由于P(A∩B)=0,该公式简化为P(A∪B)=P(A)+P(B)。互斥事件(Mutuallyexclusiveevents)衡两个事件没有公共的样本点;即A∩B为空且P(A∩B)=0。条件概率(Conditionalprobability)衡给定其他事件发生的条件下某个事件发生的概率。给定事件B下A的概率为P(A|B)=P(A∩B)/P(B)。独立事件(Independentevents)衡两个事件A和B有P(A|B)=P(A)或P(B|A)=P(B);也就是说,事件间相互没有影响。乘法公式(Multiplicationlaw)衡用于计算两事件交的概率P(A∩B)的概率公式。可以写成P(A∩B)=P(A)P(B|A)或者P(A∩B)=P(B)P(A|B)。对于独立事件,简化为P(A∩B)=P(A)P(B)。先验概率(Priorprobabilities)衡事件的初始估计概率。后验概率(Posteriorprobabilities)衡根据另外的信息而得到的事件的修正概率。贝叶斯定理(Baye’stheorem)衡一种用来计算后验概率的方法。随机变量(Randomvariable)试试验结果的数值性描述。离散型随机变量(Discreterandomvariable)试可取一个有穷或无穷数列的值的随机变量。连续型随机变量(Continuousrandomvariable)试可取一个区间或一系列区间的任何值的随机变量。概率分布(Probabilitydistribution)试一个表示概率怎样在随机变量可能值间分布的描述。概率函数(Probabilityfunction)试一个函数,用f(x)标记,提供了离散型随机变量x取特定值的概率。离散均匀概率函数(Discreteuniformprobabilityfunction)试用来定义具有相等概率的离散型概率分布的函数。数学期望(Expectedvalue)试度量随机变量平均值或中心位置的量度。方差(Variance)试度量随机变量的差异性,或离散性的量度。标准差(Standarddeviation)试方差的正平方根。二项试验(Binomialexperment)试具有5.4节中4个属性的概率试验。二项概率分布(Binomialprobabilitydistribution)试表示二项试验中n次试验有x次成功的概率分布。二项概率函数(Binomialprobabilityfunction)试用来计算二项试验的概率的函数。泊松概率分布(Poissonprobabilitydistribution)试表示在一段特定时间或空间中一个事件发生x次的概率的概率分布。泊松概率函数(Poissonprobabilityfunction)试用来计算泊松概率的函数。超几何概率函数(Hypergeometricprobabilityfunction)试用来计算在各次试验非独立时,n次试验有x次成功的概率的函数。均匀概率分布(Uniformprobabilitydistribution)一一种连续型概率分布,其随机变量在等长度的每一区间上取值的概率都相同。概率密度函数(Probabilitydensityfunction)一定义连续型随机变量的概率分布的函数。正态概率分布(NormalProbabilitydistribution)一一种连续型概率分布,
本文标题:商务与经济统计关键术语与重要公式
链接地址:https://www.777doc.com/doc-7312483 .html