gseeker
Google:在2003年我们每个月才抓取一次网页
将文章归档于 G事八卦 由. Ken Wong on 2006-07-27
点击看大图
  GigaOM的主人、著名的IT爆料者Om Malik最近亲身访问了Google总部即位于美国山景城的Googleplex,并且和互联网上名气最大的Google工程师Matt Cutts叙了旧。在Om Malik与Matt Cutts的交谈里,我们可以找到一些Google轶事或趣闻,下面和大家分享一下



  关于Google的神秘

  Matt Cutts认为神秘是Google文化的一部分,当Google还是一间小公司的时候,很容易保持神秘,但现在有点难。(幻灭:现在的Google依然是无比的神秘,这也是它经常出人意料的最大原因。)

  关于Google的爬虫

  Matt Cutts说在2003年,Google的爬虫每个月才抓取网页一次;现在是每两三天就全面更新一次,以后可能会是几小时甚至几分钟抓取一次。(幻灭:Google的爬虫即Googlebot,关于它抓取网页的原理,可参阅本站之前的文章。非常有趣的是,现在有不少比较小型的搜索引擎就是很久才抓取一次网页,但我没想到2003年的Google也是这样。3年的时间,Google的变化令人惊讶。)

  关于AJAX技术和JavaScript

  Matt Cutts说AJAX技术是Google爬虫的敌人,它会令Googlebot更难抓取和分析网页。这也是Google正在大力解决的问题之一。另外,Google还花很多时间去改进Googlebot,让它能更好地理解JavaScript代码。(幻灭:之前关于Googlebot抓取JS代码的传闻算是得到了证实,并且以后JS的抓取难度将会渐渐减小。但如果你在意网页的收录,至少目前来说AJAX并不是一个很好的选择。)

  关于Google的广告业务

  Matt Cutts:"我们所有的钱都来自广告业务。"(幻灭:简单的一句话,说明了Google以后还将会是一间广告公司。我的感觉是Google首先是一间广告公司,然后才是一间技术公司,因为无论怎样,它都能不断地从广告业务里获得巨大的利润,并且保持强劲的增长。)

  点击这里可看本站之前集中介绍的Google内幕,更多Google相关的趣事请使用本站的搜索功能。
Permalink: Google:在2003年我们每个月才抓取一次网页
img Addthis img Ask img Blinklist img del.icio.us img Digg img Fark img Facebook img Google img Lycos img Ma.gnolia Add this page to Mister Wong Mr Wong img Netscape img Netvousz img Newsvine img Reddit img StumbleUpon img Slashdot img Tailrank img Technorati img Wink img Yahoo

Vote for Google:在2003年我们每个月才抓取一次网页:

  • Currently 8.75/10
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
分值情况: 8.75 / 4 评分
 
Share It
CW工具栏安设
RSSrss   | 所有的部落格订阅选择
Google google   |   什么是RSS?
Yodao Yodao
Netvibes Netvibes
AnothrAnothr
TwitterFollow us on Twitter!