- Rongsen.Com.Cn 版权所有 2008-2010 京ICP备08007000号 京公海网安备11010802026356号 朝阳网安编号:110105199号
- 北京黑客防线网安工作室-黑客防线网安服务器维护基地为您提供专业的
服务器维护
,企业网站维护
,网站维护
服务 - (建议采用1024×768分辨率,以达到最佳视觉效果) Powered by 黑客防线网安 ©2009-2010 www.rongsen.com.cn
作者:黑客防线网安网站维护基地 来源:黑客防线网安网站维护基地 浏览次数:0 |
我们都知道,搜索引擎都有自己的“搜索机器人”(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库。通过这一搜索引擎蜘蛛的抓取行为分析后,起航视觉SEO工作室将为大家揭密百度蜘蛛VSGoogle蜘蛛的一些实战经验供大家分享与讨论。
经过站长约一周的详细观察和分析,所有蜘蛛的数据均真实有效,当然并不排除误差现象,希望对大家了解搜索引擎蜘蛛有所帮助。
首先来看下百度和Google对蜘蛛的官方解释:(请去访问官方说明)
百度蜘蛛:Baiduspider Google蜘蛛:Googlebot
以下是我各个站点每日来访的百度蜘蛛和Google蜘蛛的ip段,对应每个站点的成熟度各有不同,我们试着在其中找到规律:(蜘蛛的来访数量与外链的数量,站点的更新频率,权重都息息相关,此处的数据仅代表我个人的站点)
百度蜘蛛分析:
A站.B站.F站均为一年至四个月的半成熟站点,百度蜘蛛( Baiduspider)每日来访次数均在5000-8000+次左右
E站.G站均为二个月至四个月的新站,百度蜘蛛( Baiduspider)每日来访次数均在2000-3000+次左右
C站在上周因服务器问题无法访问一天,正常的爬行次数在3000+
D站为特殊情况,尚待研究。H站上线50天,爬行次数1000+
从以上的列表中可看到:
123.125.64.*123.125.66.* 这两个ip段为最常规出现的百度蜘蛛,应该是正常抓取和站点状态正常时百度的例行巡逻兵。
119.63.193.* 119.63.198.*这两个ip段出现的站点均有更换ip,无法访问,新站初始的情况,我们理解为:新站考察期蜘蛛段。
121.14.89.* 这个ip段作为度过新站考察期,来的更高等级的常驻蜘蛛,作为更深一级的爬行蜘蛛。
Google蜘蛛分析:
从以上的列表中可看到:
202.101.43.*222.73.247.*66.249.65.* 这三个ip段是最为常规出现的。
66.249.16.*出现的站点均为新站或站点出现无法访问情况后再次出现的ip段。
210.72.225.*这个ip段不间断巡逻各站。
203.208.60.*这个ip段出现在新站及站点有不正常现象后。
另再给大家分享一个Google蜘蛛的等级这分
众所周知 ,Google的pr等级分为10个等级,而孰不知goole的蜘蛛等级分为几个等级
Google蜘蛛共分为3个等级下面我们用1.2.3.来分别描述这三个等级的的功能;
1号蜘蛛:
不用说也知道,排在前面肯定是最重要的了 ,1号蜘蛛的抓取范围是很广泛的 ,基本上一些pr值比较小的 或者没有的站都是靠的1号蜘蛛的第一次抓取 ;
2号蜘蛛:
基于1号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问;
3号蜘蛛:
基于1号蜘蛛与2号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问;
1号对于网站的抓取是有一定的周期的 ,它是这样计算的 ,某网站的pr越高抓取时间周期月短,反之,越长 ;
而让2号和3号抓取你网站的重要因素就是你的导入链接数量和质量 ;
做到上述两点,这也是每个站长正在努力的地方 ,当你做到这些时;你会发现你的网站经常天天在被更新.
综合以上数据可看出些许百度蜘蛛和Google蜘蛛的不同:
1、 百度的蜘蛛访问及抓取量远大于Google蜘蛛
2、百度的蜘蛛ip段较固定且有规律,Google可能因蜘蛛的分级及不同服务器过来抓取的频率不同而显得多样化
3、 除非你的站点完全被Google惩罚,否则来访的蜘蛛数量不会有太大的差别,但百度则可能封杀你之后就很难恢复,或对你的站点极少爬行。
可能这张表单里的数据也有我没有完全理解的可能性,发出来就是与大家一起共同讨论,希望有研究的朋友可以多多留言,我更希望能有不同的看法出现,希望这篇文章对大家在seo方面的研究有所帮助。
24小时维护咨询热线 13718235518 王先生 黑客防线网安数据维护基地
我要申请本站:N点 | 黑客防线官网 | |
专业服务器维护及网站维护手工安全搭建环境,网站安全加固服务。黑客防线网安服务器维护基地招商进行中!QQ:29769479 |