谷歌上海媒体见面会(5.10)摘录:.com强行转.cn、中国网站PR值、Google Phone、机器翻译等
由. Ken Wong 将文章归档于 G源共享

昨天谷歌在上海举行了一次名为"2007年Google中国网页搜索上海媒体沙龙"的媒体见面会,谷歌中国工程研究院技术总监刘骏在会上回答了多家媒体所提出的以搜索为主的问题。下面是其中列出一些我自己比较感兴趣的,和大家分享。
刘骏语录:
*搜索当然是Google中国的一个重点,我们去年大概80%左右的工程师到位后正式开始做的时候都是集中力量在提高中国的搜索质量。
*(...)Google是第一个没有人工干预,到现在为止大概世界上还没有第二个搜索引擎是完全没有人工参与,Google是唯一一个搜索引擎是没有人工干预的。(...)质量很明显是最重要的,搜索质量。我可以这样跟各位说,就是说我们现在,经过我们从去年夏天到现在的努力,我们在中国领先于其他竞争对手的搜索质量,从我们测试结果来看,已经相当于当时Google在美国领先于雅虎的程度。
*搜索质量我们用机器测出来的,去年经过这么多中国工程师的努力,我们的搜索质量提高非常快,在Google内部,前一段时间在全球的员工大会上我们也作为特例拿出来,Google中国搜索去年的搜索质量明显提高。
*你通过我们的热门搜索词可以了解Google的用户和其他的用户有什么区别,如果你仔细去看我们热门搜索词里面,前几位已经有三个银行,前五十位大概至少有七、八个银行。Google是唯一搜索引擎里面有这么多人搜索银行的,这说明Google的商业用户群比较强,正好也是在上海这个城市,也是商业性比较强。从用户群调查里面上海人是最喜欢Google的,相对于其他的城市,因为Google比较适合在商业上或者是对他们实际要解决的问题。
刘骏答媒体问:
*提问:还有我之前听说根据内部的测试Google搜索的精确度有很大的提高,因为我每天都要用搜索引擎,百度和Google肯定要用,作为普通用户我没有感觉到非常明显的提升,而你们内部是有一套相对的算法的,有没有把指标公布出来,我个人感觉绝大多数人是分辨不出来哪些更好。而且个人感觉百度的抓取量还是比Google要高。
刘骏:抓取量有一个很大的误导,抓的东西其实所有的搜索引擎都是抓不到全部,我们在绝对数量上绝对是超过百度。还有一个重要的指标可能大家忽略了,就是你抓的东西要有用,这个就更难了。你说的具体数据很遗憾是非常机密的,一般是不公布的。
*提问:为什么Google.com在国内部分地区会跳转到Google.cn?
刘骏:我们现在是有条件在转,.com永远在。你可以选择,可以回到.com,都可以,但是我们会有一些优化。比如说去年我们做了一个转换,.com、.cn的自动切转,比如你搜索一些比较敏感的词,因为.com的服务器会经过一个防火墙,有时候可能会搜不到结果,因为控制因素太多。我们现在是在一个过程当中,主要是看网络稳定性的过程,如果网络比较稳定的话,我们可能转得多,不稳定的话转得少。但是总的趋势是我们希望越来越多的用户使用.cn,因为.cn是为中国用户开发的网站。所以现在很多新的功能比如搜索推荐什么的,这个是在.com上没有的,越来越多的功能是只在.cn不在.com上,我们要做到本地化。
*提问:Google上月对PageRank进行了大规模更新,据称不少中国网站PageRank都出现下滑,您对此有何看法?
刘骏:Google全球PageRank采用统一算法,而且这一算法一直在改进;中国网站的平均PageRank在全球位居倒数,与拉丁美洲处于同一水平,造成这一现象有多种原因,例如中国互联网抄袭成风、重复内容过多。
*提问:此前有传闻称Google将在发展中国家推出Google Phone,请问中国的确是否也有类似的计划?
刘骏:目前我并未获得相关的消息。
*提问:说到人工智能我对Google的翻译一直觉得很痛苦,我看不懂。
刘骏:那是非常遗憾,这是最好的,世界上的技术今天就到这个地步,我们这个机器的翻译是遥遥领先的,第二名翻译的精度简直就不能看。我不是搞计算机的,机器翻译大概两种,一种是编了很多语法的,用规则来做。这个往往有一个最大的问题是规则越多后来会自相矛盾。第二种类型是用统计学,就看这个文章大多数是这样翻的,就应该这样翻。统计学的翻译现在被认为是比较先进的,统计学翻译最大的难度是规模。每数据量翻一倍就提高五个百分点的精度,我们现在已经做到了相当于100亿对的文章翻译统计,这个是遥遥领先的,当然还有余地我们都要努力,否则都没饭吃了。
(特别感谢"驱动之家"的酷哥编辑"且听枫吟"提供信息!^^)
Permalink: 谷歌上海媒体见面会(5.10)摘录:.com强行转.cn、中国网站PR值、Google Phone、机器翻译等
Tags:
Google
谷歌
上海
媒体
沙龙
中国网站
PR值
机器翻译
Trackback: http://www.creative-weblogging.com/cgi-bin/mt-tb.pl/68589

Mr Wong

