Google 网站管理员工具验证上传文件问题新解

399 views

分类 : 技术文摘 | 发布时间 : 05-10-2009

以前本博讨论过Google 网站管理员工具平台中,通过上传一个html文件来验证审核的问题,今天在一个SEO案例中,又看到了新解,特别有代表性,作者是很牛的,负责运营阿里巴巴国际站的seo部分,因此,特忍不住的摘录了其中的部分,收藏并分享。

Google 网站管理员工具使用时,网站有很多都验证不了那个google需要你上传的文件。工程师那边帮助查了很多问题,以为是什么跳转之类的没有做好。查了很多资料,也没有找到特征吻合的相关解决办法。而meta验证的方法因为技术上有一点问题做不了。

所以我们SEO团队就帮工程师去找问题。我同事瞿波不一会就找出问题出在什么地方了,原来问题出在泛解析上。

具体的过程是这样的:

用了泛解析的url,无论你把url组合成一个什么样子,都会有一个正常的页面给你的。比如:如果你网站的根目录下用了泛解析,http://www.xxxxxx.com/a.html 这个url是你网站本来正常的url。那么你随意的输入一个本来不存在的url 如 http://www.xxxxxx.com/adasdsadw.html 甚至 http://www.xxxxxx.com/@####¥¥.html ,网站CMS返回的都是一个正常的页面。

这在一个大型网站中,很多地方出于业务需要,都是这么处理的。但是这样做,在“网站管理员工具”的验证方面就一定不能通过。为什么呢?

因为这样谁都可以把这个网站加到自己的网站管理员工具中。比如:www.made-in-china.com 根目录如果用了泛解析,我把这个网站添加到我的“网站管理员工具”里,系统要我验证一下 http://www.made-in-china.com/google15c03c9b508311f6.html 这个文件是不是存在的时候,因为有泛解析,这个文件是一定存在的,那么我就成功把这个本不属于我的网站加到我的“网站管理员工具”里了。我可以随意更改里面的很多设置。

而实际上这样的情况是不会发生的,因为google不光会验证你上传的文件存不存在,还会验证一个不应该存在的文件是不是不存在。google验证完你上传的文件后,接着会模拟一个叫做 google404errorpage.html 的页面是不是不存在。google觉得你网站根目录下恰好存在一个名叫google404errorpage.html的几率是零,所以如果检测下来发现你这个页面也存在的话,那就不能验证通过。google这个时候已经知道你这是因为泛解析导致的缘故。出于保护你的网站,google不会让这个验证通过。

上面的这个分析过程,在公开的渠道里是找不到的。现在在《google网站质量指南》里也只是让你给不存在的页面返回 4xx 状态码而已。

http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=35638

而且这个规则也是最近加进去的。以前,根本找不到相关的资料来参考。

那我的同事为什么一下子就找到问题在哪里了呢?那是因为服务器的log日志里一定会记录google验证的这个过程的,把相关目录下、某个时间段的log日志调出来查看就可以看到了。

如果没有LOG日志分析,谁能想得到还有这么一个过程在里面呢? 至今,还有很多网站验证不了这个文件的,现在就可以看看有没有这个泛解析的问题,或者去分析log日志看看。

这篇有关“SEO是如何依赖技术的”,其中分析的方法和结果,非常具有代表性,推荐各位去欣赏一下过程和方法,以及结果,并且从中能够学习到解决问题的思考方法。“鱼”和“渔”都要有所收获才好。

你也许还想了解这些

Comments (1)

不错 学到一招

Post a comment

无觅相关文章插件,快速提升流量