职业发展
浅谈互联网页面价值 |
| 发布时间:2012/3/22 8:34:36 |
搜索引擎每天处理着数以亿计的查询请求,每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候,通过查询返回的网页结果,这些需求被满足了,我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言,页面的价值是指什么,我们为什么要研究页面价值,技术上怎样判断页面的价值呢?本文将逐一回答这些问题。 一、 什么是页面价值 前面我们说了,某个页面满足了某一用户的特定需求,就体现了这个页面对用户的价值。那么对搜索引擎而言,价值体现在哪些方面呢?一个简单的推论,所有可能会对用户产生价值的页面都是对搜索引擎有价值的,将这些页面建入搜索引擎的索引中能够满足最终检索到它们用户的需求,我们称这种价值为检索价值。只要是能解决某个用户信息需求的,并且是可以通过某些正常检索需求到达的,那么就是有检索价值的。 小学生张三喜欢在qzone上写日记,写他前天吃了什么,今天玩了什么。这些内容,是有价值的。它们对张三的家长、同学、老师,以及其他小学生,和对小学生日记感兴趣的人来说,都是有价值的。对于这个信息体来说,“张三”这个名字是检索的“key”。 有一些信息单元,只有“浏览”价值,而没有到达该信息的检索途径,那么该资源可能是有价值的,但检索价值就很低。比如一张百度大厦附近的地图,从浏览角度,是有价值的;但是如果没有任何周边文字说明,只有一张光秃秃的地图,就没有检索价值。所以一个页面是否有检索价值,应该取决于两点:
二、 如何判断页面价值 一个页面的检索价值,大致受以下四个要素的影响:
这四种要素,简称受众,稀缺,质量和时效性。
1. 受众 受众群体的大小,即代表了用户检索需求的大小。评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。 (1)网站忠实用户群大小 一般来说,拥有自己忠实用户群的知名网站,他们的成功,在于他们的内容和服务,比别人更能吸引和满足用户。 (2)内容特征 A:我写博客:“传言郭德纲要上春晚了。” 同样的来源,前者的受众必然高于后者。即:当在发布源相同的情况下,具有公众属性的内容分值会更高。 2. 稀缺 稀缺主要是描述页面在互联网中的独特性。对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。 3. 质量 典型的高质量页面存在以下一些特征:
4. 时效性 “时效性”是页面价值的一个属性,它一般体现在两个方面:一是页面所描述的事物本身有着较强的公众话题性,容易被传播。二是页面所描述的事物仅在第一时间有较高热度,随着时间推移热度显著下降。 |





