Mediapartners-Google漫游器的相关介绍
看了下日志,发现有几条类似这样的:
2010-07-27 16:03:33 W3SVC1129513256 221.192.135.26 GET /a/view/18691.html - 80 - 203.208.60.251 Mediapartners-Google 200 0 0
Mediapartners-Google是什么,搜索一下,原来是Google Adsense的漫游器。
以下内容来自 网站管理员支持中心
我希望网站的某些网页不被编入索引,但要在这些页上显示 AdSense 广告。能否满足我的这一要求?
可以。您可以在这些网页上禁用 (Disallow) 除 Mediapartners-Google 之外的所有漫游器。这样可确保不将网页编入索引,但可让 Googlebot-MediaPartners 漫游器分析这些网页,以确定是否显示广告。Googlebot-MediaPartners 漫游器不与其他 Google 用户代理共享网页。例如,您可以使用下列条目:
User-Agent:*
Disallow:/folder1/
User-Agent:MediaPartners-Google
Allow:/folder1/
如何拦截 Googlebot?
拦截 Googlebot
Google 使用多个 user-agent。您可以在条目的 User-Agent 行中包含漫游器名称来拦截对网页的访问。拦截 Googlebot 将会拦截所有以"Googlebot"开头的漫游器。
Googlebot:从我们的网站索引和新闻索引中抓取网页
Googlebot-Mobile:针对我们的移动索引抓取网页
Googlebot-Image:针对我们的图片索引抓取网页
Mediapartners-Google:抓取网页确定 AdSense 的内容。只有在您的网站上展示 AdSense 广告的情况下,我们才会使用此漫游器来抓取您的网站。
Adsbot-Google:抓取网页来衡量 AdWords 目标网页的质量。只有在您使用 AdWords 为您的网站做广告的情况下,我们才会使用此漫游器。参阅关于此漫游器的更多信息以及如何在您的网站上执行部分拦截。
例如,要完全拦截 Googlebot,您可以使用下列语法:
User-agent:Googlebot Disallow:/
允许 Googlebot
如果您要拦截除 Googlebot 以外的所有漫游器访问您的网页,可以使用下列语法:
User-agent:Disallow:/
User-agent:Googlebot
Disallow:
Googlebot 跟随指向它自己的行,而不是指向所有漫游器的行。
"Allow"扩展名
Googlebot 可识别称为"Allow"的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。"Allow"行的作用原理完全与"Disallow"行一样。只需列出您要允许的目录或页面即可。
您也可以同时使用"Disallow"和"Allow"。例如,要拦截子目录中某个页面之外的其他所有页面,可以使用下列条目:
User-Agent:Googlebot
Disallow:/folder1/
Allow:/folder1/myfile.html
这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。
如果您要拦截 Googlebot 并允许 Google 的另一个漫游器(如 Googlebot-Mobile),可使用"Allow"规则允许该漫游器的访问。例如:
User-agent:Googlebot
Disallow:/
User-agent:Googlebot-Mobile
Allow:
下一篇:百度快照没有抓取title和description标签的原因及解决方法