`
julyflame
  • 浏览: 12030 次
  • 性别: Icon_minigender_1
  • 来自: 大连
文章分类
社区版块
存档分类
最新评论

商业P4P引擎架构

阅读更多
P4P的关键参数
PV(pageView):页面浏览量,也就是流量。
CTR(click through rate):点击率,一般的竞价排名都是按点击收费。
cov:覆盖率,页面中付费广告的比值。
PPC(pay per click):每次点击扣费,一般按照第二价格扣费,想了解详细可以搜索第二价格拍卖。
这些关键参数影响了竞价排名的收入。
说完了关键参数,接着介绍P4P的架构。

一般的P4P引擎由以下部分组成:
Blender:负责将外部查询语句改为内部查询语句(扩展加词,加密)。
Merger:负责分发,合并,排序,cache。
Searcher:提供索引查询服务,分词,排序。
Cm:负责blender,merge,search的调度;监听服务器load,cpu等参数。
Dispath&lsupdate:接受外部消息。
Click:记录,分析点击。
Fullbuild:从DB中dump数据,建立索引。

可以看出一般的p4p搜索引擎架构如下:
1定时通过爬虫/数据库获取数据,建立索引。
2实时获取数据,建立增量索引。
3用户输入查询信息。
4对用户的查询语句进行转化(扩展,加密等)
5通过负载均衡和分发服务分发给不同服务器。
6查询服务器进行分词,检索出结果,排序。
7合并服务对查询结果进行汇总,排序。
8监控服务负责对服务器进行监控。
9点击系统记录,分析用户点击信息。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics