搜广推战略产物:灰盒“look alike”战略在微信看一看上的利用(下篇)
若何通过RALM模子框架实现种子人群扩展的思惟,达成“准而全”的营销投放述求呢?本文做者通过微信看一看告白资本位场景下的实例,对“Look alike”战略停止了阐发,一路来看一下吧。
若何通过RALM模子框架实现种子人群扩展的思惟,达成“准而全”的营销投放述求呢?本文做者通过微信看一看告白资本位场景下的实例,对“Look alike”战略停止了阐发,一路来看一下吧。
上篇讲完“look alike”常见的机器进修深度进修战略,我们今天找个详细在微信看一看告白资本位场景下的实例,愈加深切感触感染一下look alike的战略,若何通过RALM模子框架实现种子人群扩展的思惟,若何达成“准而全”的营销投放诉求。
一、RALM模子框架在微信看一看中的利用
RALM模子框架阐明
大致的过程次要分红三个模块,别离是最下层的离线操练、到在线异步处置,再到在线办事。
展开全文
1. 离线操练
离线操练架构图
离线操练,次要包罗representation learning(用户表达进修)和look alike learning(用户类似性进修),停止完 look alike learning 之后,能够把 user 颠末全毗连层的 user 表达 Eu缓存起来。全量用户,有10多亿,能够 catch 到 KV 中。能够提赐与在线办事做缓存,线上不消做实时全量传布。
1)representation learning(用户表达进修)
用户表达进修
那个模子有点类似典范的Youtube 的 DNN双塔模子,左侧下班部门是用户的各类Feature,通过embeding lookup 然后再pooling,最初把所有的特征做合成,过一个全毗连层就输出了User emedding;右边则是感兴致的item,也会做embedding生成。最初要揣测内容:用户在点击了那么多 item 之后,下一个要点击的 item,最初要揣测的就是表达用户兴致的 embedding。(每个域表达一个行为散布,例如电商下单行为、公家号阅读行为)
2)Look-alike learning(用户类似性进修)
用户类似性进修
一个种子用户需要包罗的信息,能够先做假设,种子用户的表达= 共性信息+个性信息。
每个用户都有本身的兴致,但对整个群体的人群信息存在差别的奉献度,我们称为群体的共性信息:global info。共性信息和目标用户无关,只和用户群体本身有关。
种子用户群体的个性信息。种子群体中必然存在一小部门用户和 target 用户兴致类似,那时,当 target 人群改变时,信息会改变,称为 local info。
获取global info的用户的embedding,起首用 global attention,只和 user 相关,和 attention merge 的办法类似,也是一个 self-attention。感化是把种子用户乘以矩阵转换,再乘以种子用户本身,所做的就是捕获用户群体本身内部的兴致散布。
local info呢,它的公式是把种子用户的矩阵乘以 w,再乘以 target user 的 embedding,再做一层 softmax,再乘以种子用户本身,那是一个典型的乘法 attention。它的感化是提取种子用户群体中和 target user 相关的部门,捕获种子用户的 local info。是一个用公式得到的那两种 local global embedding 之后,停止加权和,那就是种子用户群体的全数信息。
2. 在线异步处置
在线异步处置架构图
离线操练完毕后,是在线异步处置,次要感化是某些能够离线且和线上恳求无关的计算,能够先计算完,如更新种子用户。每个 item 候选集城市对应一个种子用户列表,更新种子用户列表,能够每一分钟更新一次,那和拜候用户无关,只和候选集的 item 有关。能够实时拉取用户的点击日记,更新点击某个候选集的种子列表,包管种子用户实时性。
能够把 global embedding 估量算 ( gl 只和种子用户有关,是 self-attenion,可在线做异步处置,如每隔一分钟算一次 )。
计算 k-means 聚类中心,也是只和种子用户有关,能够提早计算好,如推到选举系统内存中。
所有的工具都是按时更新,不需要线上实时计算。
在线办事阐明
线上把聚类中心、global embedding 和所有用户的 embedding 都已缓存好,只需要拉取 user embedding,和候选集的 global embedding 和聚类中心。线上只需要计算 local embedding,是 target user 到种子用户的 attention,那需要根据线上恳求的 urn 来实时计算。再计算一次 cosine,就能够得到类似度,那个计算量很小。
4. 最初尝试成果
在微信看一看上的尝试成果
算出 look alike 类似度之后,类似度的分数,可间接给到排序办事,做曝光根据。那是其时原文做者写论文之前做的在线方案 AB testing成果,比照的是用户画像婚配推送的战略,上线之后,在扩展曝光规模的前提下,CTR 根本正向不变+1.09%(阐明获取到了更多相关性的流量),品种丰富性+8.435%,标签丰富多样性+15.938%,阐明在扩展过程中同时也获得了更多多样性展开的流量。
二、关于look-alike定向战略总结与根究
Look-alike战略RALM模子的在微信看一看战略大致如上,整体上的构想从用户兴致特征动身,往探究用户的个性兴致和人群共性兴致往摸索种子人群的鸿沟,而且在上线尝试中也获得了明显的收益效果,通过离线+在线计算的体例包管了种子人群的实时性和效果。
业界还有十分多关于Look alike的论文,我在那里就纷歧一列举了,像是阿里妈妈目标人群扩展战略、网易云音乐种子人群扩展战略等等。
和各人一路在战略产物道路上“日拱一卒,功不唐捐”,搀扶帮助你成为极具职场壁垒的战略产物,假设有搀扶帮助到各人欢送点赞、收躲以及评论一下。
做者:战略产物Arthur,5年大厂战略产物专家。
本文由 @战略产物Arthur 原创发布于人人都是产物司理,未经答应,制止转载
题图来自 Unsplash,基于 CC0 协议