又耽搁了一段时间,这篇是杨康之后的第一篇吧,也是2023年的第一篇,一下子感觉激情澎湃。
今天还是继续捣鼓escm2吧,看了前两篇的阅读量都达到近5000的阅读量,看来还是有人看的,so 我们继续。
今天的主题是研究论文里提出的无偏建模cvr的方法。我们先确定一个大的前提概念,就是escm2为了解决无偏估计是继续回到了点击空间建模,这个是与esmm全然不同的地方,也是我们在通篇阅读这篇论文始终铭记的点。
开始我们还是要唠嗑一下为什么说esmm全空间建模cvr不是个好方法吧!
上面这个公式就是理想的建模的公式,按这个套路,转化是要发生在点击之后的,但是吧真正在模型训练的时候并不是这样的。可以看下图,这里面第一个图里,r表示转化,但是o到r之间没有依赖关系。
esmm是使用P(r_{ui}=1)来代替P(r_{ui}=1|o_{ui}=1),那这样肯定是有问题,它有个假设前提就是独立同分布,但是从我们刚才的描述来看明显这个假设是不成立的,所以这就回答了在此之前的说法,esmm全空间建模并不是一个好方法。
这个错误的假设在论文里定义是PIP问题,如何解决这个问题?在上一篇文章其实讲解了IEB问题。
既然这个独立假设有问题,那么咱们给它挂一个依赖,就是图b显示的结果,这个是肯定容易想到的,现在又回到了点击空间建模,那么自然而然引入了样本选择偏差,esmm就是全空间建模来解决样本选择偏差,但是现在我们又要回归到问题的本质,点击空间建模才是最好的对cvr建模,此处就凸显了矛盾点。
那么P(r_{ui}=1|do(o_{ui}=1))诞生了,这个do的概念就是预估点击的概率,对于点击的样本肯定是毋庸置疑符合要求也好理解,但是对于未点击的样本呢?
文章里给出的解释是预估点击的概率有多大,就是假设你点击之后转化的概率的预估?emmm,这样看起来在线上推理的时候符合全空间的意思,因为你给用户推荐你也是要先预估用户点击的概率在考虑转化的概率。
但是这个是反事实的,因为并不是直接观测得到的,你观测的肯定是用户点击之后的转化数据,没有点击的也不存在转化。
到此,就开始讲解第一个解决方案IPS,这个方案的出发点还是在loss调权。
调权的变量参数就是ctr 网络输出的pctr的倒数作为调权的参数。可以见下图
具体的风险正则项公式如下所示,看到这么长的公式不要害怕,跟我们最相关 的就是公式的分母,分母就是我们ctr网络输出的pctr值,这个公式是对cvr loss调权,当O_{u,i}=1的时候那么就是点击的样本,分母的预估如果偏小,说明模型预估不准,那么倒数就会提权调整模型训练方向,如果预估接近1也是情理之中。O_{u,i}=0这个公式就等于0,对应的就是没有点击的样本,loss为0 ,也不会影响模型参数的更新。
从前面的描述来看其实是差不多可以理解这个ips是怎么玩的,如果需要完备的理论去论证这个公式是如何解决IEB和PIP问题的,还需要公式推导一番。