机器学习评估方法——P值校验

目标

假设在α=0.05的情况下,根据舆情监测项目需求,查看召回率和准确率的置信区间,均值。

过程

1.输入数据,三列分别是precision,recall,f1-score,每一列分别计算,以此为例,一共四十行。即样本容量为40
这里写图片描述
2.计算标准差
STDEV(A2:A41)
计算出的标准差放在A43单元格
这里写图片描述
3.计算置信区间
3.1公式->插入函数->CONFIDENCE.NORMAL
CONFIDENCE.NORMAL(0.05,A43,40)这里写图片描述
【解释】

  • Alpha=0.05即说明置信区间的显著性水平,
    置信水平是指总体参数值落在样本统计值某一区内的概率,一般用1-α表示,即在这个区间内的可能性为1-0.05=0.95,即有95%的可能认为落在这个区间。
  • Standard_dev=A43即上一步骤算出的标准差,上一步的标准差存储在A43单元格
  • Size=40即样本容量为40

4.计算平均值
AVERAGE(A2:A41)
5.理论解释
这里写图片描述
6.操作动态图
这里写图片描述