它能为你做什么?

通过对来自 EconML 和其他地方的众多强大模型进行自动化搜索,你可以轻松完成以下操作

1. 按客户而非仅按平均值获取影响,助力 A/B 测试

通过利用客户特征丰富常规 A/B/N 测试的结果,并在所得数据集上运行 CausalTune,你可以获得作为客户特征函数的个体影响估计,从而在下一次迭代中实现基于影响的精确目标定位。CausalTune 也利用任何可用附加特征作为方差缩减方法。 示例笔记本

2. 持续测试与利用相结合:(动态)提升模型

即使 noisy,按客户计算的影响估计值也可用于对新客户实施逐个客户的 Thompson 抽样,使随机干预分配偏向于我们认为最可能有效的那些客户。由于我们仍然控制逐个客户的干预倾向性得分,因此可以应用上述相同方法来不断完善我们的影响估计。

因此,在使用测试结果(基于我们目前的了解)为每个客户分配最具影响力的干预之前,无需等待测试收集到足够的数据以获得显著性,也无需结束测试。

在这种情况下,每个客户的干预倾向性得分是已知的,我们允许显式提供它作为一列提供给估计器,而不是像其他情况下那样从数据中估计它。

3. 无需实际全随机测试组,即可估计更智能(但仍部分随机)分配相对于全随机分配的益处

上一节描述了如何使用因果估计器使干预分配偏向于我们认为最有可能对特定客户最有效的选择。

然而,事后我们想知道与完全随机分配相比,这样做的额外益处。ERUPT 技术示例笔记本对实际结果进行重新加权,以产生完全随机分配会产生的平均结果的无偏估计,无需任何实际的附加组。

4. 观察性推断

因果推断的传统应用。例如,估计我们回答客户查询所需时间对销量和流失可能性的影响。由于有支持查询的客户集很可能不是随机抽样的,因此需要进行混杂校正。

与其他用例一样,先进的因果推断模型允许将影响估计作为客户特征的函数,而不仅仅是平均值,假设所有相关的混杂因素都已被观察到

要使用此功能,在实例化 CausalTune 时,只需将 propensity_model 设置为所需分类器的一个实例,或者设置为 "auto" 如果你想使用 FLAML 分类器(默认设置为 "dummy",它假设随机分配并从数据中推断分配概率)。示例笔记本

如果你有理由认为存在未观察到的混杂因素,例如客户意图(客户是因为促销而产生大量交易量,还是他们本来就打算产生大量交易量所以才注册促销?),请考虑寻找一个工具变量来代替。

请注意,我们推导出的能量得分作为因果模型的有效样本外得分,严格来说并不适用于此用例,但在实践中似乎仍然工作得相当好。

5. IV 模型:客户选择使用某个功能的影响

工具变量(IV)估计,用于避免因未观察到的混杂因素导致的估计偏差。

IV 模型的一个自然用例是向客户提供某个功能或促销活动,并尝试衡量客户实际选择使用该功能的影响(提供该功能的影响可以使用上述第 1 和第 2 点解决)。

在此,我们将功能可用性作为工具变量(假设其分配是严格随机的),并在 EconML 中搜索 IV 模型来估计客户选择使用它的影响。为了对 IV 模型拟合进行样本外评分,我们再次使用能量得分示例笔记本

请注意,我们尚未在内部广泛使用 IV 模型拟合功能,因此如果你遇到任何问题,请报告!