发布时间:2024年11月06日 17:54:12分享人:莫忧伤来源:互联网19
这篇文章发表在KDD2011上,文章是几个在雅虎实验室的中国人写的,读起来比较易懂。文章里要解决的问题并不一定是做DSP、AdX的人关心的,但里面提到的技术方法,是比较实在的。这篇文章被列为DSP的必读文章。 对于互联网的展示广告(Displayadvertising),一般通过两种售卖方式,一种是通过买卖双方签订合同的方式售卖,即保证交付(guaranteeddelivery);另外一种是通过在广告交易市场中通过实时购买的方式售卖,即非保证交付(Non-guaranteeddelivery)。所谓竞价愿景预测(bid landscapeforecasting)是指对于给定的一个广告计划,预测出不同价格能够竞价到的流量的分布。这个功能对于广告主和媒体都是有很大帮助的。这里面的一个问题是一个广告计划的定向属性经常是变化的,如果直接针对一个广告计划进行预测,那么当广告计划定向属性变化了之后,没法从新预测,而且对于一个新的广告计划,也很难直接预测。于是,文章中并不直接对广告计划进行预测,而是预测每一个定向属性值的组合向量的bidlandscape。每一个唯一的定向属性值的组合向量称作一个样例(sample)。例如,一个广告计划有三个定向维度,媒体(P1,P2),用户性别(male,female),用户年龄(18-23,23-30),那么<P1,male,18-23>就构成了一个样例。 因此,要预测广告计划的bidlandscape可以通过以下三步来解决:1) 将每一个广告计划给予定向属性分解成多个样例。2)在样例粒度上进行预测。3)将样例粒度上的预测聚合到广告计划粒度上。整个系统的实现可以分为在线和离线两部分。离线部分,进行数据处理、特征抽取、历史索引建立和预测模型训练;在线部分,进行广告计划样例分解,检索样例的预测值和聚合估计。 广告定向特征通常有url, 媒体,广告位置,用户信息,地理位置信息等,通常有大量的特征,文章中采用Fast-Correlation BasedFilter方法进行特征选择,这种方法能够给出每一个特征的权重。(个人感觉在实际应用中这个用处不大,直接把各种能想到的特征都加到里面就好了) 通过这些特征分解出很多的样例之后,在样例上,报价通常都是一个长尾的分布,对bid进行log处理之后,假定它的分布式正态分布。那么对于每个样例里,样例的历史均值和方差是两个预测的重要特征。由于样例的数量是各个特征叉乘后的结果,数量非常大,必然存在着数据稀疏性的问题,文章中提出了一种"BidStarTree"的方法。具体做法是,对每一个特征加入一个新的值"*",这个值用语匹配所有数据,如果一个维度的某个值下的数据比较少,直接聚集到"*"这个值上。这样就可以解决数据稀疏性的问题。而且这样可以去掉大量长尾的样例,极大的降低存储。 通过上面的方法,当一个特征向量来时,可以匹配上多个样例,那么究竟用哪一个样例下的均值和方差呢?文章提出了一种利用模板进行查找的方法。说白了就是实现定义好一套模板结构。比如说先用这个特征向量直接去查,如果没查到,在舍弃某些不重要的特征再去查。文章中使用一种简单的贪心算法通过线下训练的方式离线训练好一套模板结构。 接下来两个问题是在样例粒度上如何预测,文章使用了Gradient Boosting DecisionTree的回归算法进行的预测。将样例粒度聚合到广告计划粒度上,由于样例粒度上的分布式正态分布,这就变成了一个有限正态分布混合模型的问题,比较容易求解。 其他的就不说什么了。文章中提到的"bidstar tree"的方法对于解决稀疏性的问题有很大帮助。bidlandscape对于广告主估计预算和广告效果应该还是有比较大的帮助的。
爱华网本文地址 » http://www.413yy.cn/a/25101011/48066.html
更多阅读
相机内存卡读不出来怎么办——简介相机无法识别存储卡怎么办?相机存储卡是相机功能的重要组成部分,如果相机无法识别内存卡,则相机的功能无法得到正常发挥。当出现相机无法识别内存卡时,可以按如下方法进行处理解决。相机内存卡读不出
覃有两个读音,不同的读音代表不同的意思,从而有不同的用法,下面分别就这两种读音和用法进行简单的说明;第一种读音:和“谈话”中的“谈”读音一样,拼音写作tan,第二声。这种读音的覃,你可以将之理解为“长”、“宽”、“广”等意思,通常用
为什么手机内存卡在电脑上读不出来 精——简介手机作为便携式电话,一直受到了用户的亲睐,本来手机只是作为通讯工具,打打电话发发短信而已,随着手机功能的越来越多,尤其是手机内存卡得增大,许多用户已经把手机作为数据储存的工具,很多时候
如何提高U盘的读写速度——简介为了让U盘速度读写的更快,用户可以在Windows7系统将U盘的读写策略更改“NTFS”格式如何提高U盘的读写速度——工具/原料win7系统如何提高U盘的读写速度——方法/步骤如何提高U盘的读写速度 1、点击桌
在网上选购硬盘时,上面都标有惹人眼球的信息,如下图SATA 6Gb/s=6x1024/8=768MB/s,市面上的固态硬盘才500MB/s左右的速度,你觉得机械硬盘可能达到这个速度吗?/修正上面斜体这一部分,关于SATA 6Gb/s这部分指的是硬盘接口的速度,而非硬盘