ab-test-setup
A/B测试结构化指南:设立假设、指标与执行准备度的强制审查关卡。
作者
分类
商业分析安装
热度:12
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=sickn33-skills-ab-test-setup&locale=zh&source=copy
A/B Test Setup - 严谨的 A/B 测试设计与执行指南
技能概述
A/B Test Setup 是一套结构化的 A/B 测试设置指南,通过强制性的假设锁定、指标定义和执行就绪检查,确保每个实验在设计阶段就具备统计严谨性和可执行性,防止因设计缺陷导致的无效实验。
适用场景
核心功能
常见问题
A/B 测试需要多少流量才能进行?
所需流量取决于基线转化率和预期检测的最小效应。例如,如果基线转化率为 5%,希望检测到 10% 的相对提升(即绝对提升 0.5%),在 95% 置信水平和 80% 统计功效下,每个变体大约需要 3 万个样本。如果日访问量有限,可能需要延长测试周期或重新评估 MDE 的合理性。
实验过程中看到明显的好结果,可以提前停止吗?
不可以。提前停止会破坏实验的统计有效性,即使结果看起来很好也可能是虚假的正面结果。必须坚持在实验设计阶段预定的样本量完成测试,除非因护栏指标严重失败而提前终止。这一技能会明确提醒不要因"看起来不错"而提前停止。
什么是护栏指标,为什么重要?
护栏指标是实验过程中必须不能显著下降的关键指标,用于防止"局部优化"带来的系统性伤害。例如,一个提高点击率的改版可能导致用户留存下降或加载时间变长。如果护栏指标出现显著负面变化,即使主要指标获胜,也不应该推广该变体。这一技能要求在实验设计阶段就明确定义护栏指标,并在结果分析时给予其一票否决权。