倪叶明博客现在百度蜘蛛抓取的数据情况分析

之前我跟各位学员说过,倪叶明博客,当下最大的问题就是:百度不收录新文章的问题。

虽然百度蜘蛛每天有差不多100多的抓取频率,但是查阅了一下,百度蜘蛛每天抓取的全部都是原来的文章,新文章都不抓取。

整个网站最近一年的时间也没有任何的内容页收录。

大家要知道,即使网站首页和页面都有权重,但是如果百度一直不收录新的内容页,那对于整个网站来说,运营也就无从谈起了。

所以,解决百度收录新文章的问题,做了很多的动作,之前我已经通过一篇解释过了,传送门在这里→老域名网站百度只抓取老文章,不抓取新内容页

好在,经过一顿猛如虎的操作之后,百度开始抓取新的内容页和新的tag标签url了。

然后我查阅了这段时间,百度也收录了一些新文章的页面,而且这些页面被百度收录之后,100%有页面权重,并且关键词有一定的竞争力,没有什么比这个消息更好的了。

这意味,接下来只要保持更新,筛选好关键词,网站就能飞速成长,只要更新勤快一点,一年时间理论上可以达到之前暴疯团队博客的权重和流量。

接下来,我说一下,最近我观察到百度蜘蛛在抓取数据的情况:

自从我关联企业主体之后的第二天,百度就猛的抓取了一把新的文章url和新的tag标签url。

但是仅仅只是关联主体之后第二天抓取的,后来第三天、第四天、第五天,百度蜘蛛继续回归到正常的状态,依然不抓取新的文章页。

直到今天,百度又猛的抓取了一把新的文章页,估计过几天又会放出一波新文章的收录页面。

注意:这个时间模型,百度并不是天天都会抓取新文章链接的,而是隔几天抓取一次。

但是这是一个好现象,接下来应该只要能做到持续更新一段时间,网站内容页距离隔天收录的目标就很近很近了。

而在这里,我发现了一个时间差。

我是在1月8号的时间,关联的网站主体的,但是实际上被收录的页面里面,有几个页面是在1月8号之前发布的,我看了一下1月9号百度蜘蛛抓取的情况,并没有抓取这几个页面。

也就是说,从这里,基本上可以得到一些结论。

让百度收录新文章的,原因我们基本上可以确定到三个事情上:

1.关联了企业主体

这个是可以确定的,因为在没有关联主体之前,我一直没看到百度抓取最新的文章,关联了之后立马第二天就出现了大量的抓取

2.持续的更新文章

这个也是可以100%确定的,因为持续的更新,对于网站收录是基础核心,这个不用怀疑,所以无论何时,保持日更,一定不能中断,是各位站长必须要做到的。

3.老文章的锚文本链接

既然百度一直在抓取老文章的url,所以当时我就想着,如果我在老文章里面重新加入一遍新文章的锚文本链接,对于新文章的收录应该是有一定的帮助的,毕竟百度蜘蛛可以顺着文章里面的锚文本进行爬行。

所以,我大概修改了差不多有近100篇文章的老文章的锚文本链接。

前面两个我基本上都能确定有效果,但是关于第三点,我不能100%确定有效果,但是多少应该会有一些帮助。

其实理论上来说,也应该是100%有效果的,但是这里有一定不能确定的就是:百度蜘蛛可能抓取了老文章,对比了一下发现文章没有变化,所以百度快照不更新。

标签 , ,

发表评论

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部