loading ...
loading...

2008-07-05 | 浅谈搜索引擎工作原理

分享
标签: 搜索引擎  SEO 

  今天学了搜索引擎原理,在网络营销实践中和大家分享一下。

  搜索引擎有一个庞大的URL库,搜索引擎定期的派出蜘蛛(spider)从这些URL的首页开始爬行,在爬行过程中如果发现新的网页就抓取过来、原页面有变化的就把之前的替换成新抓取的、发现自从上次搜集后已经不存在的页面就从库中删除。

  任何搜索引擎都是不可能将WEB上的网页搜集完全的,通常都是在其他条件的限制下决定搜集过程的结束(如磁盘满,或搜集时间已经太长了),因此就有一个尽量使搜到的网页比较重要的问题,这对于那些并不追求很大数量覆盖率的搜索引擎特别重要,这些搜索引擎是按照先宽的搜索方式来进行搜索,所以搜索深度不会太深。

  搜索引擎在搜索时会做“预处理”,主要包括四步:关键词的提取,“镜像网页”或“转载网页”的清除,链接分析和网页重要程度的计算。

 

来源:http://www.zyfblog.cn/post/sousuoyinqinggongzuoyuanli.html

分享 分享 |  评论 (0) |  阅读 (?)  |  固定链接 |  类别 (SEO技术) |  发表于 00:03
搜狐博客温馨提示:搜狐博客官方不会要求参加活动的各位博友缴纳任何的手续费用。请勿轻信留言、评论中的中奖信息,更不要拨打陌生电话及向陌生帐户汇款,谨防受骗!识别更多网络骗术,请 点击查看详情
您还未登录,只能匿名发表评论。或者您可以 登录 后发表。
 
  *中国人爱国心,搜狗输入法爱国主题皮肤下载>>
表  情:
加载中...
回复通知: 同时用小纸条通知对方该回复