论文笔记：LBCF: A Large-Scale Budget-Constrained Causal Forest Algorithm

论文原文：M. Ai et al., “LBCF: A Large-Scale Budget-Constrained Causal Forest Algorithm,” in Proceedings of the ACM Web Conference 2022, New York, NY, USA, 2022, pp. 2310–2319. doi: 10.1145/3485447.3512103.

Motivation

该工作以金币下发场景为背景，评估金币下发数量对用户观看时长的因果效应，并基于评估结果设计了个性化下发机制。

challenge：

大规模用户量；
multi-treatment；

contribution：

提出了LBCF方法解决了以上两个问题；
提出了新的模型效果评估指标；
在真实数据上进行了实验；

related work:
这一部分主要是围绕自己的challenge讲述了现有工作的不足，共分两类：

第一类：LBCF批评他们在进行决策时采用贪心策略，并且通过举例说明这类贪心策略无法达到treament effect的最优值【表1】
第二类：LBCF指出第二类虽然采用了优化算法来进行决策，但在面对大规模数据时性能表现不足，主要是：1. 他们只能做到cohort-level的优化，无法实现member-level的优化；2. 他们在解决multi-treatment时是构造了多棵causal forest，这样的话，不同forest所处的特征空间不同，那么评估出来的treatment effect也不可比。

Methodology

针对related work里的问题，LBCF提出了相应的解决方法，方法论主要分成两大部分：

第一部分是causal forest的构建，在这一部分的主要贡献就是提出了新的分裂标准，并将他们的森林起名为UDCF；
第二部分是优化问题的构造，在这一部分又提出了适用于大规模数据的优化算法，起名为DGB；

问题定义：
值得一提的是LBCF对multi-treatment下CATE的定义：
在这里插入图片描述
他们以Y(T=0)为基线，只考虑Y(T=j)到Y(T=0)的差值。

UDCF

作者针对multi-treatment问题，认为他们所构造的森林（即UDCF）需要满足如下两个要求：

Unified：是指，UDCF需要使得各个treatment的effect评估处于同一特征空间；
Discriminative ：是指，UDCF需要使得不同treatment对应的effect足够异质；

所以，UDCF的全称也就是Unified Discriminative Causal Forest。

为了满足上述两个要求，作者分别提出了两个新的分裂标准：

inter split：该标准是将GRF用于CATE的分裂标准进行了一点改动，使得CF能应用于multi-treatment的情形，满足了Unified特性，其形式化表达入如下：

不熟悉GRF的移步👉论文笔记：GRF
这个分裂标准延用了GRF的思想，是想要最大化子节点之间的异质性；
Intra split：该标准是针对Discriminative特性提出的【还附上了假设1】，其思想是最大化不同treatment之间的异质性，形式化表达如下：

基于以上两个分裂标准，作者提出了节点分裂的计算步骤：
1. 首先根据inter split标准筛选出m个候选者；
2. 再根据intra split标准筛选出最优分裂；

DGB

也是解决一个优化问题：
在这里插入图片描述
细节暂略

相关阅读:
页面的渲染流程
Kafka 安装与配置
Flask框架学习：模板渲染与Get，Post请求
Spring 手把手入门实例
jsp汽车销售管理软件Myeclipse开发mysql数据库web结构java编程计算机网页项目
AlphaFold2源码解析(1)--安装使用
第05篇:手写JavaRPC框架之执行层思路
Leo赠书活动-02期【信息科技风险管理：合规管理、技术防控与数字化】
向量检索/向量相似性计算方法（持续更新ing...）
springboot毕设项目大学生在线课堂系统a57e3（java+VUE+Mybatis+Maven+Mysql）

原文地址：https://blog.csdn.net/zyl_wjl_1413/article/details/125407379