GG谷歌独立站优秀案例.Jeffrey - 全天在线渠道

前言这一小节,我们先介绍下什么是SSP,ADX,DSP,后面在了解下广告链路中的算法。什么是SSP?互联网中的SSP就是媒体服务平台,英文全称为sell-sild platform。简单的说,互联网ssp就是利用网络平台向特定的平台发送广告

广告归因架构设计之五广告链路中的算法技术

前言

这一小节,我们先介绍下什么是SSP,ADX,DSP,后面在了解下广告链路中的算法。

什么是SSP?

互联网中的SSP就是媒体服务平台,英文全称为sell-sild platform。简单的说,互联网ssp就是利用网络平台向特定的平台发送广告新闻,然后提升广告价值获取收益。

SSP(Sell-Side Platfrom)供应方平台,是站长服务平台。媒体方可以在SSP 上管理自己的广告位,控制广告的展现。SSP能够让媒体方也介入广告交易,从而使它们的库存广告可用。媒体方希望通过SSP让其的库存广告可以获得最高的有效每千次展示费用,而不必以低价销售出去。

SSP的概念起源:

这一概念是伴随着互联网和广告业的飞速发展而来的,SSP,与DSP、Ad Exchange和RTB一起迅速崛起于欧美,属于新兴的网络展示广告领域。供应方平台能够让出版商也介入广告交易,从而使它们的库存广告可用。通过这一平台,出版商希望他们的库存广告可以获得最高的有效每千次展示费用。

RTB=实时竞价

利用第三方技术针对每一个用户展示行为进行评估以及出价的竞价技术,即广告主对广告进行出价,出价越高,曝光机会越多,同时这一购买方式能比较开放、透明。

什么是ADX?

ADX是英文Ad Exchange英文首字母的缩写,中文翻译为互联网广告交易平台,它联系着DSP(买方平台)和SSP(卖方平台),通过接入SSP汇集大量媒体流量,从而收集处理属于广告目标客户的数据,Ad Exchange是实现精准营销的交易场所。Ad Exchange是互联网广告交易平台,和股票交易平台类似的是,Ad Exchange平台的竞价机制也是竞价获得,如果竞价一样的话,先到先得,即RTB广告模式。

当一个用户访问广告位页面时,SSP端向Ad Exchange发出访问讯号,告知有一个访问请求,SSP把广告位的具体信息,例如所属站点、最低出价以及通过DMP分析匹配后的用户属性信息打包发送给各个DSP,DSP端开始对这个广告展现进行竞价,竞价获胜者就能够让自己的广告展现这个广告位上,进而让用户看到。下图描述的例子是一个对汽车感兴趣的用户访问站点,DSP端各个汽车厂家对这个用户展开争夺的过程。

什么叫DSP?

互联网广告 DSP是一个系统,它服务于广告商,帮助广告商在互联网上进行广告投放。

和常规的广告平台相比DSP广告不是从主流的媒体购买广告位,而是通过RTB(实时竞价)的方式来展现广告的,而还有PD,PDB另外的两种流量购买方式。

DSP能为广告主提供不同的媒体平台,可以按照用户日常的浏览兴趣行为来进行精准的广告投放,找到符合广告主的人群,提高转化率同时又可以为广告主节约成本。

下面是用户的一次访问流程:

首先,用户会点击网站、APP、视频等媒体,产生一个网络请求;媒体收到网络请求后,会将请求转发给负责整合流量的SSP供应方;SSP将请求信息交给ADX,ADX就是广告交易中心;ADX通知所有负责广告主的DSP进行出价;因为广告主会在DSP当中投放广告,并且投放任务当中会设置广告出价,各个DSP在收到请求之后,会选择一个出价最高的广告主,并且以出价第二高的价格加0.1元进行计算,然后出价最高的广告会原路返回给用户,并展示给用户。到此为止,一个广告的交易流程就基本结束了。

整个过程经历了很多个服务器,比如说SSP、ADX、DSP,然后是媒体,再到用户,这个过程是非常复杂的,但是整个流程一般会控制在100毫秒左右。其中涉及的所有数据都会存储在DMP当中,DMP是把分散的各方数据整合到一个统一的技术平台中,对用户进行标准化和细分后,进行营销环境的使用。

对广告而言,大致经历了检索、召回、特征抽取,模型预估,最后展示给用户。其中有两个最重要的模型,一个是点击率预估模型,一个是转化率预估模型。

广告链路中的算法

DSP进行竞价时最重要的公式就是ECPM公式,其等于广告主的出价price乘以pctr乘以pcvr再乘以1000,最终ECPM高者竞价成功,最后展示给用户。

其中,pctr是点击率预估模型预估出来的概率,pcvr是转化率预估模型预估出来的概率。

在点击率预估模型中主要用到的数据是广告的曝光数据和点击数据,这两种数据在广告平台侧都是具备的。

有了这个数据之后,经过数据预处理、特征工程、模型训练以及评价指标AUC,最终发布上线。

所使用的特征大概有以下几类:用户特征、广告特征、上下文特征、High Level特征(泛化能力比较强)和Low Level特征(自解释能力比较强)。使用以上的特征再加上标签数据(是否点击),实现模型的训练和推理。

转化率预估模型是大家所说的金牌模型,用到的数据主要是更后端的数据,因为用户发生的转化行为是广告链路中比较深的一个链路,用到的是点击数据和转化数据,其中转化数据包括下载、激活、注册、付费等行为。

在广告行业背景介绍中,我们介绍了转化数据是怎么来的,是依据现有的转化跟踪技术,通过广告主或者媒体嵌入广告投放平台的SDK或者API接口,实现将后端的数据给到平台,以此实现任务和标签的关联。

如果转化跟踪技术出现了问题,或者转化跟踪突然不能用了,转化率预估模型是没办法完成训练的,因为后端的数据广告主没有给到平台。在此场景下,我们就需要使用纵向联邦学习来解决这个问题。

参考:

https://zhuanlan.zhihu.com/p/558684266

https://aistudy.baidu.com/okam/pages/article/index?categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&ch=54&srcid=10004&strategyId=127952899225762&source=natural

https://www.youhuaxing.cn/seojianzhan/17937.html

https://zhuanlan.zhihu.com/p/692188972

https://cloud.tencent.com/developer/article/2222045

广告归因架构设计之五广告链路中的算法技术