-
03月15日
-
废话不多说,老规矩,作为一名石家庄SEO了解一下搜索引擎的工作原理是必备的技能。
先来看下搜索引擎的发展!
最最开始其实并没有搜索引擎的,那个时候的搜素引擎其实就类似于现在的一些分类目录网站,只是把一些网站统一分类了而已,然后越往后网站越多的时候,发现这个功能已经满足不聊用户的需求了,才慢慢的逐步的演变为现在的搜素引擎。简单的归为三步即:
分类目录→单一搜索→智能搜索!
主流的搜索引擎!
谷歌!世界最大的搜索引擎!
百度!最大的中文搜索引擎!
这里没什么要说的,一带而过吧!
注意:下面开始干货分享!
了解搜索引擎的工作原理
搜素引擎的工作原理!如果详细的说起来相当的复杂!不过我们可以把他简单化,简化之后基本可以分为四步!
大体分为四步:
1.抓取2.过滤(预处理)3.建立索引4.输出结果
1.抓取
①下载这个网页→②加入到临时数据库→③提取网页中的链接→①→②→③……循环
蜘蛛发现一个链接,下载这个网页,加入到临时数据库,提取网页中的链接(?链或者外链),再下载网页,加入到临时数据库…………循环。
不知道这么说大家能否理解,时间原因,就不给大家画图了,如果不是太理解的话可以加我QQ详聊
扩展知识:蜘蛛抓策略,分为两种抓取策略,即深度优先和广度优先。详见下面两幅图。
深度优先
广度优先有图大家应该都可以理解了!
2.过滤(预处理)
提取文字(过滤JS,过滤图片,过滤CSS等,只留下文字),降噪(比如一些版权的信息处理掉,只留下正文),过滤停止词(比如我们一些常用的,啊,哦,的,了,这些等等),分词,去重(也就是去掉重复的)
3.建立索引
4.输出结果
中文分词,匹配文件,相关性计算,链接分析计算,输出结果
本文由小丑SEO博客首发,转载请注明出处。
文章名称:深度解析搜索引擎工作原理!