为什么你的A/B测试结果总是不可靠?从p值陷阱到多重比较的统计困境

Ronny Kohavi在微软担任实验平台副总裁期间发现了一个令人不安的数据:在经过精心设计和执行的A/B测试中,只有约三分之一成功改善了目标指标。另外三分之一的实验没有任何显著差异,剩下的三分之一甚至产生了负面影响。 ...

14 min · 6517 words