内容理解在新浪微博广告中的应用

10
发表时间:2020-09-18 00:26

  1.微博广告系统各方利益诉求


微博广告


  微博广告投放实践上是广告主、广告途径以及用户三方利益分配的问题,因为需求平衡三方的利益诉求,所以广告途径的中心使命是如安在尽量不打扰用户正常的内容消费流程下达到尽可能多的广告主投放ROI。


  2.广告投进中心使命


微博广告


  简略来讲,微博广告投进中心使命是让用户在合适的时刻看到合适的广告。咱们能够拆解成三个部分,分别是:


  谁在看:对用户的寻找,对用户的历史数据收集及各种用户画像的开掘;


  看的是什么:了解当下用户在途径上消费/交互过的内容;


  合适看什么:依据上面两部分加上其他信息,会针对该用户当下合适看什么广告进行投放。


  3.非内容场景

微博广告


  在微博中,非内容场景首要是重视流/抢手流。它首要的特色是内容多样,上下关联性弱。在这样的场景下,用户关于流内内容没有太多的预判,广告也不一定需求和紧挨着的天然内容有联络,所以这种情况下广告投放更倾向于选人。


  4.内容场景


  与非内容场景对应的是内容场景,首要包含正文页、评论和查找等场景,用户经过对特定内容消费进去该场景。在这样的场景下,投进微博广告对内容的相关性有要求,所以内容了解对这类场景下广告投进的影响更为明显。


  02内容了解才华缺少引发的问题


  1.问题及难点:针对单一内容


  首要,针对单一内容/单一广告因为内容了解才华的缺少会引发以下几个问题:


  营销内容监管:用户有时会抱怨途径的广告太多。经过日志分析,咱们发现除了经过广告系统投进出去的广告外,曝光记载中还包含用户重视账号自行发布的营销目的较明显的"天然博文",所以这个时分用户刷微博的时分会以为这些都是广告,比方下图左边中某明星在双十一发布了一篇天然博文就带有明显营销特色。咱们的解决方案是将非广告营销内容经过模型自动辨认出来,而这方面的难点就是每天发博量太大,并且缺少标明。


  内容展现时机掌握:这个首要体现在相邻天然内容传递的情感不一定合适做营销内容展现,比方下图中心上下两条天然内容都是关于某品牌的概念机,但上面一条说它"没有实用价值",是一条负面的博文,而下面是一条正面的博文。假定下面是一条商业推行的微博广告,则当下并不是一个好的展现时机。咱们的解决方案是对天然内容进行情感分析和实体标明,在广告投进是进行躲避。难点是微博会"创造"新的表达方法,比方2018年的"锦鲤"事件。


  作用点评中的噪声:假定不对特定内容进行辨认,那么构思方法引起的特定目标体现"虚高"或"虚低"。比方下图右侧上方是一条"骗点击"的广告资料(CTR虚高),而下方是一条经过内容内嵌导流信息(CTR虚低)。咱们的解决方案是辨认/标明特定内容方法,其间难点首要是广告主会对构思进行不断迭代,咱们也需求对模型进行不断的迭代。


  2.问题及难点:非单一内容


  其次,针对非单一内容因为内容了解才华的缺少会引发以下几个问题:


  营销内容同质化:首要的问题是违规内容暴力闯审,频控/负反馈失效,比方下图左边中的两个营销内容,乍看一眼两个微博广告是相同的(发布视频相同,文字类似),可是发布营销内容是不同账号的,这样用户对一个广告点了不感兴趣,仍是会刷到类似的广告。咱们的解决方案是辨认标明相同/类似营销内容,而难点是在不同场景下面相同/类似的界说是不同的。


  天然/营销内容不完全匹配:微博中文娱明星/诙谐搞笑/时事新闻是每日天然内容曝光大头,这样商业特色并不明显,比方下图中心是微博的热搜榜,这些天然内容所对应的标签是很难进行广告投进。咱们的解决方案是构建共同的商业内容标签系统,对天然内容进行商业特色开掘,并且依据这个进行广告投进。这儿的难点是缺少标明,覆盖率低。


  优质内容出产门槛约束中长尾广告:中长尾的广告主缺少相应才华/资金创建高质量营销内容,关于任何途径来说广告收入首要来源于一小部分头部广告主这是不安全的,所以一般情况是要拉进来中长尾的广告主。咱们的方案依据过往作用好的微博广告,智能生成/举荐构思内容,而难点就是现有模型才华与实践运用是有距离的。


  03构建内容了解才华以及具体商业运用


  1.内容了解使命


  内容了解使命的界说:关于给定内容(文本/图片/视频),经过算法完成几类的作业:


  分词/实体辨认:底子的分词和实体辨认(人名、地名、品牌等);


  情感分析:辨认内容中的正负面情感,针对负面内容还需求进一步的断定,例如关于全局负面(空难、事端…)是否出广告,针对特定品牌负面内容不合适出特定品牌的广告,但不影响出其它品牌的广告;


  类似断定:给定两篇内容,断定是否类似,或许给定一篇内容和查找规划,返回这个候选规划与之类似的内容;


  内容分类:构建一套商业的标签系统,依据不同的内容类型练习分类模型,其间文本的分类和图片的分类最终效果交融是一个难点。例如卖手机壳和卖手机的广告在图片上面是很难差异的,所以需求搭配着案牍进行差异;


  特定内容辨认与生成:包含关键词辨认、构思方法辨认、智能构思生成和依据微博内容构建明星品牌常识图谱。


  2.依据内容的微博广告投进


  依据内容的广告投进是针对内容场景,除了在已有人群定向之外,增加使用内容了解的方法进行广告投进和优化的才华,首要分为:


  标签构建:在标签构建中需求有差异度将内容分隔,并且需求合适的颗粒度来确保标签不会太细导致投进无法产生满意的曝光;


  对内容进行标明:有了上面的标签系统之后,需求对内容进行标明,咱们现在有两个模型:


  1.快速照应模型:依据揭穿语料来作词向量和倒排索引来应对查找或新发抢手博文等;


  2.深度模型:依据Bert经过微博语料进行分类使命的fine-tune,可是因为功用的问题无法满意直接用于线上inference的延时需求,但能够经过高速KV存储构建缓存,将深度模型的效果倒入线上投进;


  依据内容微博广告投进:将内容的标签打好之后,能够依据内容进行广告的投进:


  1.隐式优化:在满意广告主人群定向的条件下,依据其时的内容进行广告的优化,比方一个用户身上有两个标签(轿车和数码3C),当用户刷到了轿车相关的内容,在这个场景下面投进轿车相关的广告作用会更好;


  2.显式优化:翻开内容标签给广告主,将广告投进在选定内容标签对应的内容相关广告位,这时并不关心其时央求对运用户画像标签特色。


  上图是咱们内容定向的简略流程图。


  3.明星品牌常识图谱构建及运用


  关于为什么要做明星品牌常识图谱,首要原因是文娱明星是微博内容的护城河,而品牌微博广告是微博收入的中心,所以期望使用微博数据开掘明星和品牌之间的商业联络,更好的将这两者结合在一起。


  构建明星品牌常识图谱的几个方面:


  实体:包含明星(性别/年岁/别号)、著作(年代/分类/粉丝)、品牌(别号/作业/粉丝)等实体;


  联络:包含明星"代言"品牌、明星"参演"活动、品牌"赞助"活动等等;


  运用:有了上面的实体和联络,咱们会依据Neo4j/CQL树立在线查询服务,对明星/影视著作相关内容进行商业拓宽,并针对类似账号进行投进举荐。


  上图是咱们明星/品牌常识图谱的一部分,咱们看下上面能够怎样进行运用。


  针对输入的query"朱一龙",咱们能够经过上图左边的图谱定位到朱一龙"代言"味全酸奶,假定味全酸奶在微博投进广告就会出相关的微博广告,不然能够依据味全酸奶对应作业信息出类似的广告。


  另一方面实体还能够有比赛联络,例如上图右侧的图谱,宝马跟其他轿车的实体存在"比赛"联络,宝马假定期望对投进内容进行"竞品"扫除,能够依据图谱,防止宝马广告出现在提及其他"竞品"的内容对应广告位。


  04总结与展望


  在微博商业化中,咱们对内容了解有以下几方面运用:


  构建共同内容分析/表达才华:针对文本/图片/视频这些内容运用算法进行分析/标明,例如分词、关键词辨认、文本向量化等等;


  共同向量标明:依据特定微博广告使命进行向量fine-tune来取得文本/图片/视频的向量化标明,并将这些向量化进行交融;


  供应根底内容了解服务:依据获取的共同向量标明能够完成对微信朋友圈广告根底内容的了解,比方类似性断定、内容分类等等;


  活络支撑各种商业场景:依据上面的根底内容了解服务,咱们能够活络支撑上层各种的商业场景,例如隐式内容优化、显式内容售卖。


     联系电话:
15807157429
手机/微信
 
 

开户/代运营:

18871871197


开户/代运营:

15807157429