跟我学用OFFICE(24)——正态分布(Normdist)
034normdist
助记:英文的“normaldistribution”
类别:统计
语法:
normdist(x,mean,standard_dev,cumulative)
参数:4个参数
x要计算正态分布概率密度的数值
mean正态分布的算术平均值
standard_dev正态分布的标准偏差
cumulative逻辑值。如果为false返回概率密度函数,如果为true累积分布函数。
说明:
如果mean或standard_dev为非数值型,返回NUM!。
概率密度函数计算公式为:
其中,期望值μ决定了位置,其标准差σ决定了幅度
累积分布函数为从负无穷大到给定X处的积分。
用法:返回指定正态分布的概率密度函数。此函数在统计方面应用范围广泛(包括假设检验)。
下面我们学做正态分布曲线
1)新建一个工作表,在A~C列随机产生3组各500个身高数。A列使用“=randbetween(140,200)”并向下填充到A501,B列参数为(150,190),C列参数为(160,180)。
2)D列输入X的等差数列,从135~205,间隔为5。
5)其实,计算概率密度函数只需要两个参数即可。日常生活中由于数据量有限,用算术平均值作为期望值的近似,用样本标准差作为总体标准差的近似。从图中可以看出围绕中国成年男性平均身高170cm我们生成了三列随机数据,其分布并不满足理想的正态分布,但并不影响理想正态分布函数的计算。从图中可以看出样本标准差对正态分布图形的影响,值越大,数据分布范围越大,即离散度较大,曲线越平滑。反之亦然。
6)你可以在生成一列以中国成年女性平均身高为期望值的随机数,会影响正态分布峰值的位置,即正态分布图形峰值的左右移动。
7)我们将第4个参数改为true,重新填充一下E~G列的公式。如图表示正态分布曲线从负无穷到给定x值下的图形面积,即x值前面所有值概率的总和。
8)将两张图同时放在一起,便类似于质量管理上著名的“帕累托图”。一般是按照发生频率大小顺序绘制的直方图。对于这种非连续的离散计数型变量,频数或者频率可以使用累加公式“=sum($E$2:$E2)”进行计算。
(待续)
本文地址:https://yjs.zzxfkm.com.cn/220232220334.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
友情链接