将文章归档于
G事八卦
由. Ken Wong on 2006-12-08

问题一:Gmail里的联系人名单(Contacts)是按什么顺序排列的?
这是由"springkiang"提出来的。当然,英文联系人是按字母顺序排列的,这里讨论的是中文联系人。昨晚向"明月星光"和"fisker"讨教后,初步得出的结论是:Gmail中文联系人名字是按照UTF-8编码排序的。也即按汉字在UTF-8字符集里面的位置码,由小到大排列。
补充:点这里看fisker做的测试页面(忘了加上...)
问题二:在Google.com(中文)里搜索数字"0",为什么排在第一位的是不含"0"的微软IE网页?
这是由"陈少举"提出的。这个问题有待大家来解答。
补充:"Sucirst"在文后评论中有精彩的分析,建议大家阅读。
问题三:在Google.cn里搜索"沈人杰",为什么没结果?
这是由"AB 0529"发现的。我不想去评价"沈人杰",但这的确是当前热门的关键词之一。在百度可以搜,在Google.com可以搜,但在Google.cn,会给你这样的结果:

不知道这个问题会不会有答案:D
补充:不过"Ben"在评论里似乎提到了答案:D
欢迎大家发表对于这三个问题的看法,谢谢。
Permalink: 读者来信:Gmail联系人的排序、搜索“0”及“沈人杰”
Mr Wong
Vote for 读者来信:Gmail联系人的排序、搜索“0”及“沈人杰”:
|
分值情况: 9.89 / 9 评分
|
回应:
nings
(12/08/06 5:20am)
沙发,的确很迷茫
回应:
陈少举
(12/08/06 6:27am)
我通过BaiDu新闻搜索搜索了一下"沈人杰"……怎么都是些他开房XXOO的照片……???
不过长得确实还不错,挺帅的! XD
不过长得确实还不错,挺帅的! XD
回应:
幻灭
(12/08/06 6:40am)
他似乎就是因为“开房事件”而红起来的。从这个角度看,是一起极成功的炒作。
回应:
任平生
(12/08/06 7:49am)
搜索“沈” 可以在它下边的相关搜索中 看到 沈人杰
被Google.cn 过滤掉的应该是 人杰 这个词,为什么Google.cn 不能搜索“人杰”呢,深思中……
被Google.cn 过滤掉的应该是 人杰 这个词,为什么Google.cn 不能搜索“人杰”呢,深思中……
回应:
Sucirst
(12/08/06 7:59am)
16:51 2006/12/7
关于google三个有趣问题的解答
今天看gseeker的新闻,这篇提出了对于google三个比较难回答的问题,尝试以我对google的认识 回答一下吧。
问题地址:
http://www.gseeker.com/50226711/eeaeiegmailecaecaca0aaaea_51677.php
问题:
问题一:Gmail里的联系人名单(Contacts)是按什么顺序排列的?
这是由"springkiang"提出来的。当然,英文联系人是按字母顺序排列的,这里讨论的是中文联系人。昨晚向"明月星光"和"fisker"讨教后,初步得出的结论是:Gmail中文联系人
名字是按照UTF-8编码排序的。也即按汉字在UTF-8字符集里面的位置码,由小到大排列。
问题二:在Google.com(中文)里搜索数字"0",为什么排在第一位的是不含"0"的微软IE网页?
这是由"陈少举"提出的。这个问题有待大家来解答。
问题三:在Google.cn里搜索"沈人杰",为什么没结果?
这是由"AB 0529"发现的。我不想去评价"沈人杰",但这的确是当前热门的关键词之一。在百度可以搜,在Google.com可以搜,但在Google.cn(不能搜到结果)
问题一:
这个已经有了最重要的解答了,补充一点,gtalk中默认的第一排序规则是联系人的状态,然后中文名才按照UTF-8编码的顺序(简单的看,还可以理解为按拼音顺序来排列,因为
这两种方式几乎是完全重合的)。
问题二:
这个我仅能以16:56 2006/12/7察看到的结果做如下猜测:
第一名
Internet Explorer 7: 下载
http://www.microsoft.com/china/windows/ie/downloads/default.mspx
第二名(补充结果不考虑排名)
提示
http://bbs.qq.com/cgi-bin/bbs/friend/user_info_show?ln=56998300
第三名
柒零派- 生于七十年代(生于70年代)
http://www.i70s.com/
结果另外的数据统计:
第一名:
PR:6
关键词“0”的密度:0.922%
第二名:
PR:0
关键词“0”的密度:1.829%
第三名:
PR:4
关键词“0”的密度:2.113%
微软IE7正式版最近刚刚漏出下载(简体中文版),可以想见,在Trends里面,IE 7.0, IE7等等相关搜索一定是最近在中文搜索中的热门,结合搜索排序的几个基本规则,google
猜测用户输入0实际上是要下载某软件的可能性居多;因为数字通常会和版本号关联,最近最热门的结果中,PR值最高的页面被Google选择排在第一位。观察前三位的关键词密度,
第二位的PR仅仅只有0,但是关键词密度在1%--2%之间(符合通常认为的关键词的最佳密度),且URL中包含2个0,该域名为qq.com,为google所信任的网站,因此综合排序后,第
二名的位置属于了这个结果(这是google需要继续改进的地方,因为这个结果对搜索用户而言是无意义的。google应该提高pr的权重)。
第三位的结果受到了第一位的影响,“70”在这里显然被google当做合起来处理的结果了。在第三位的网页中,重要的title中包含了“0”,还包含了70的同义词“七十”,PR值
也较高;网站域名(URL)中包含了“0”,因此排在了第三位。
总的说来,google所有的结果返回都是经过了多个重要因素(据说有100多个)的综合分值,这些分数加权后排序才产生了动态的搜索结果。(较大的更新周期可以理解为和
bigdaddy周期同步,1-3个月)。以上,是从一些重要的影响排位的因素来考虑结果“具备”了哪些获得排名的要素。而我也一直相信,google对正常网页的甄别是看网页“具备”
哪些分数,而绝非同一每一个网页的分数然后扣减它们不“具备”的分数。
问题三:
这个问题现在仅出现在中国的谷歌上。这个问题我认为更多是特殊的中国互联网环境造成的。我在此只把大家的思考方向指向那神秘的G-F-W,不能多做解释。
大家在google.com中搜索“沈人 杰”看看结果(2006.12.07),也许看到前面两条结果就会明白了,这个人名google没有识别出来,和其他的敏感关键词一起被人为的做了处理。
无奈的谷歌~~。
以上的全部回答推测的成分居多,希望能给大家提供一些思路
关于google三个有趣问题的解答
今天看gseeker的新闻,这篇提出了对于google三个比较难回答的问题,尝试以我对google的认识 回答一下吧。
问题地址:
http://www.gseeker.com/50226711/eeaeiegmailecaecaca0aaaea_51677.php
问题:
问题一:Gmail里的联系人名单(Contacts)是按什么顺序排列的?
这是由"springkiang"提出来的。当然,英文联系人是按字母顺序排列的,这里讨论的是中文联系人。昨晚向"明月星光"和"fisker"讨教后,初步得出的结论是:Gmail中文联系人
名字是按照UTF-8编码排序的。也即按汉字在UTF-8字符集里面的位置码,由小到大排列。
问题二:在Google.com(中文)里搜索数字"0",为什么排在第一位的是不含"0"的微软IE网页?
这是由"陈少举"提出的。这个问题有待大家来解答。
问题三:在Google.cn里搜索"沈人杰",为什么没结果?
这是由"AB 0529"发现的。我不想去评价"沈人杰",但这的确是当前热门的关键词之一。在百度可以搜,在Google.com可以搜,但在Google.cn(不能搜到结果)
问题一:
这个已经有了最重要的解答了,补充一点,gtalk中默认的第一排序规则是联系人的状态,然后中文名才按照UTF-8编码的顺序(简单的看,还可以理解为按拼音顺序来排列,因为
这两种方式几乎是完全重合的)。
问题二:
这个我仅能以16:56 2006/12/7察看到的结果做如下猜测:
第一名
Internet Explorer 7: 下载
http://www.microsoft.com/china/windows/ie/downloads/default.mspx
第二名(补充结果不考虑排名)
提示
http://bbs.qq.com/cgi-bin/bbs/friend/user_info_show?ln=56998300
第三名
柒零派- 生于七十年代(生于70年代)
http://www.i70s.com/
结果另外的数据统计:
第一名:
PR:6
关键词“0”的密度:0.922%
第二名:
PR:0
关键词“0”的密度:1.829%
第三名:
PR:4
关键词“0”的密度:2.113%
微软IE7正式版最近刚刚漏出下载(简体中文版),可以想见,在Trends里面,IE 7.0, IE7等等相关搜索一定是最近在中文搜索中的热门,结合搜索排序的几个基本规则,google
猜测用户输入0实际上是要下载某软件的可能性居多;因为数字通常会和版本号关联,最近最热门的结果中,PR值最高的页面被Google选择排在第一位。观察前三位的关键词密度,
第二位的PR仅仅只有0,但是关键词密度在1%--2%之间(符合通常认为的关键词的最佳密度),且URL中包含2个0,该域名为qq.com,为google所信任的网站,因此综合排序后,第
二名的位置属于了这个结果(这是google需要继续改进的地方,因为这个结果对搜索用户而言是无意义的。google应该提高pr的权重)。
第三位的结果受到了第一位的影响,“70”在这里显然被google当做合起来处理的结果了。在第三位的网页中,重要的title中包含了“0”,还包含了70的同义词“七十”,PR值
也较高;网站域名(URL)中包含了“0”,因此排在了第三位。
总的说来,google所有的结果返回都是经过了多个重要因素(据说有100多个)的综合分值,这些分数加权后排序才产生了动态的搜索结果。(较大的更新周期可以理解为和
bigdaddy周期同步,1-3个月)。以上,是从一些重要的影响排位的因素来考虑结果“具备”了哪些获得排名的要素。而我也一直相信,google对正常网页的甄别是看网页“具备”
哪些分数,而绝非同一每一个网页的分数然后扣减它们不“具备”的分数。
问题三:
这个问题现在仅出现在中国的谷歌上。这个问题我认为更多是特殊的中国互联网环境造成的。我在此只把大家的思考方向指向那神秘的G-F-W,不能多做解释。
大家在google.com中搜索“沈人 杰”看看结果(2006.12.07),也许看到前面两条结果就会明白了,这个人名google没有识别出来,和其他的敏感关键词一起被人为的做了处理。
无奈的谷歌~~。
以上的全部回答推测的成分居多,希望能给大家提供一些思路
回应:
mazefa
(12/08/06 8:57am)
现在google被封的厉害,picasa web album刚刚中文化就被封,我今天几乎上不去
回应:
fisker
(12/08/06 9:49am)
为什么不附上我的这个页面?更有说服力.
http://www.x2y2.com/sites/test/
http://www.x2y2.com/sites/test/
回应:
Ben
(12/08/06 11:34am)
因为有本小说叫“生当作人杰之昨日重现”,据说映射胡主席,所以屏蔽了“人杰”和“昨日重现”
回应:
wuyuing
(12/08/06 1:31pm)
昨日重现是一样的结果
回应:
Tian
(12/09/06 2:42am)
屏蔽敏感词- [ Translate this page ]生当作人杰之昨日重现, 敏感词, 删除, 重现令狐计划, 敏感词, 删除. 人杰令狐计划, 敏感词, 删除, 人杰计划, 敏感词, 删除. 昨日重现, 敏感词, 删除 ...
b.zhongsou.com/bbs/newbbs/manage_table-mgr_black_1.asp - 31k - Supplemental Result - Cached - Similar pages - Note this
b.zhongsou.com/bbs/newbbs/manage_table-mgr_black_1.asp - 31k - Supplemental Result - Cached - Similar pages - Note this
回应:
xLight
(12/13/06 2:13am)
Doc & Sheet 里面的排序功能也是按utf8排序.
造成中文排序功能失去价值。
这个问题我很早就报告google了,到现在也没修正,足以证明中国市场在google team心中的地位
见:
http://my.donews.com/xlight/2006/06/08/google_spreadsheets_test/
造成中文排序功能失去价值。
这个问题我很早就报告google了,到现在也没修正,足以证明中国市场在google team心中的地位
见:
http://my.donews.com/xlight/2006/06/08/google_spreadsheets_test/
使用我们的搜索寻找其他有趣的文章
| CW工具栏 | ![]() |
| RSS | |
|
| |
| Yodao |
|
| Netvibes |
|
| Anothr | |
| Follow us on Twitter! |



