`

图解Google搜索技术(续)

阅读更多

原文 http://server.51cto.com/NGDC-221158_3.htm

 

搜索结果将如何被优化?

1、对查询结果按权威性和PageRank进行排序,重复的查询结果被剔除。此时的查询结果已接近最终形态,在这一基础上,有两个进程将分开进行--查询结果优化和为其匹配相应的广告。我们先来看查询结果优化。

搜索结果将如何被优化?
图11对查询结果进行过滤处理

2、对查询结果进行过滤处理。包括以下几点:

2.1、对通常的查询,谷歌会把相关的专题性垂直搜索结果(比如新闻、购物、视频、书籍、地图等)也加到返回的查询结果中。

2.2、个性化,用户访问过的网站在查询结果列表中会更靠上

2.3、大量使用锚点的网站有可能被从查询结果中删除

2.4、如果网页被其他高PageRank的网站引用,则网页的重要性会大大提高。

2.5、趋势分析:对搜索流量爆增或有大量新闻的搜索关键词,谷歌会在新的查询结果中增加额外的PageRank权值。

2.6、同一个域名下的多个网页如果具有相同的PageRank会被归为一组。

2.7、查询结果最终形成(将与广告一同显示)

 

搜索结果与广告

搜索结果如何与广告相结合?
图12 用户所搜索的内容如何与广告相结合?

1、Google根据关键词、广告类型、用户所处位置找出相关的被竞价拍卖的关键词广告

1.1、关键词广告必须遵守当地法律条文。广告业主的非法广告将被取缔,如果关键词的搜索流量过低或关键词广告点击量偏低,则会被自动禁用,出于商业策略,像亚马逊这样的客户会给予优惠折扣。

1.2、关键词相关广告按收益潜力排序。

1.3、对广告业主来说广告内容一般是固定的,但有时使用动态关键词使关键词广告与搜索关键词相关度更高。一些广告允许增加附属信息,比如网站链接、电话号码、产品链接、地址等。

1.4、如果广告拥有相当高的点击率,则会显示在搜索结果列表的上方,以使其更显眼。

1.5、其余的广告依序显示在页面右侧

经过上述一系列复杂的信息处理过程,最终返回给用户的是一个个性化的、具备地理位置特征的、布局简洁的查询结果页面,当然还精确匹配了广告,所有这些步骤在总共不到1秒的时间内完成,每天3亿次的点击量给Google带来了超过200亿美元的年收入

关于精确广告匹配的小例子,请看下图:

搜索结果如何与广告相结合?
图13思科路由器的广告北京搜索结果

搜索结果如何与广告相结合?
图14思科路由器的广告广州搜索结果

海芯博业的广告下面标注了北京市三个字,可见这是一个地区性的广告推广,在广州搜索结果中不可见。

 

谷歌官方对其搜索技术的叙述

我们搜索技术的后端软件会在服务器侧触发一系列执行时间不到1秒的并行计算,谷歌问世前的传统搜索引擎的搜索结果严重依赖于关键词在页面上出现的频 度,我们使用了200多个指标信号(其中包括我们拥有专利的PageRank页面等级加权算法)用来检查万维网的链接结构并决定网页的重要程度。

我们假定一个网页的重要程度取决于别的页面对它的引用,就像学术论文中的引用指数一样,重要的论文总是会被很多其他论文引用。然后我们再根据搜索条 件进行超文本匹配分析(对"爬虫"抓取的页面内容进行关键词倒排索引检索)确定跟搜索请求最相关的网页。综合最重要的网页和跟搜索请求最相关的网页两个方 面,我们就能按重要程度和用户搜索请求相关程度把查询结果排序后呈现给我们的用户。

附:Googlegraphic原图。

谷歌官方对其搜索技术的叙述
图15 Googlegraphic原图

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics