gseeker
更多关于Googlebot抓取JS链接的报道
将文章归档于 挨踢G讯 由. Ken Wong on 2006-05-03
点击看大图
  还记得上次报道过的Googlebot"杀站事件"么?的确,那次只是一次意外。不过前些天我们从Google的Matt Cutts那里了解了Googlebot的抓取原理后,你应该会猜得到,新一代的Googlebot的本领的确得到了加强。不但提高了网页爬行的效率,更令人意外的是,这一代的Googlebot已经学会爬行JS代码了



  其实一直以来,都有人声称Googlebot开始爬行JS代码,并且如果你的JS代码里包括比较完整的链接,它也会像爬行普通链接那样,顺着链接走。SEJ报道了两个这样的例子。其中一个例子是著名的WMW论坛上的一个用户声称,他在自己的网页里放置了第三方的JS统计代码,而之前只有人类(火星人上他的网站机会比较小)使用浏览器浏览了网页,这段JS代码才会被执行,产生记录。但他前几天突然发现这个网站的统计数据增大了不少,一开始以为是访客增多了,结果发现是Googlebot在执行那段JS代码。并且也有不少网友也在自己的服务器的log里找到了Googlebot执行JS的记录。

  这是一个相当有趣的现像。一直以来,动态网页都不太有利于Googlebot的爬行,而现在情况有了很大的变化。不但是像基于ASP或PHP这样的动态链接,就连JS链接也在新一代的Googlebot爬行的范围内,这对于网站的收录是很有好处的。同时还证实了Google给网站管理员的建议是完全正确的:

网页应面向用户,而不是面向搜索引擎。


  这句话的意思是,不要为了短期的较好排名而弄虚作假,因为网页抓取方面,Google会不断地改进,而网站管理员只需要在采用较合理的网站结构后,专注于网站的内容即可。其实这是一个简单的道理:在Google允许的范围内,人类喜欢的网站,Google一般都不会讨厌它。

  我自己刚才也特地看了一下空间的log记录,发现Googlebot好像很喜欢顺着我的tag链接爬行,但还没有发现它爬行JS的记录。
Permalink: 更多关于Googlebot抓取JS链接的报道
img Addthis img Ask img Blinklist img del.icio.us img Digg img Fark img Facebook img Google img Lycos img Ma.gnolia Add this page to Mister Wong Mr Wong img Netscape img Netvousz img Newsvine img Reddit img StumbleUpon img Slashdot img Tailrank img Technorati img Wink img Yahoo

Vote for 更多关于Googlebot抓取JS链接的报道:

  • Currently 9.80/10
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
分值情况: 9.80 / 5 评分
 
Share It
CW工具栏安设
RSSrss   | 所有的部落格订阅选择
Google google   |   什么是RSS?
Yodao Yodao
Netvibes Netvibes
AnothrAnothr
TwitterFollow us on Twitter!