网站运营 
首页 > 网站运营 > 浏览文章

搜索引擎喜欢UTF-8编码robots.txt

(编辑:jimmy 日期: 2024/11/26 浏览:3 次 )

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。

Google Groups成员指出包括Google在内的大部分常用搜索引擎更宠爱UTF-8编码的robots.txt文件。

相关文章:有道关于robots.txt的解释

Robots.txt这个文件相信大家都不模式吧,是搜索引擎中访问网站的时候要查看的第一个文件。Robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

语法:最简单的 robots.txt 文件使用两条规则:

• User-Agent: 适用下列规则的漫游器
• Disallow: 要拦截的网页

Robots.txt是一种存放于网站根目录下的ASCII编码的文本文件,Robots.txt的文件名应统一为小写,即robots.txt。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠“/”这两种表示是不同的URL,也不能用”Disallow: .gif”这样的通配符。

因为robots.txt是一个纯文本文件,所以很多站长在设置网站的这个文件时,随便把系统中过的文本编辑器拿来就写了,然后上传到自己的网站根目录,以为这样就万事大吉了,其实,你只做了一半因为你的马虎。

已经被无数站长证实的事实是:搜索引擎更喜欢UTF-8编码的robots.txt文件。Google Groups成员Phil Payne也是为此做出声明说:在常用的HTML文件编码类型中,Google和其他的搜索引擎都更偏爱UTF-8编码的robots.txt文件。甚至有的文件编码形式都已经被Google直接忽略掉了。

所以请问,你网站根目录下的robots.txt文件是UTF-8编码吗?如果不是,建议你修改为该编码。

上一篇:SEO教程:网页h1、h2、h3和strong标签
下一篇:SEO必知Baidu和Google更新日期和时间
一句话新闻
一文看懂荣耀MagicBook Pro 16
荣耀猎人回归!七大亮点看懂不只是轻薄本,更是游戏本的MagicBook Pro 16.
人们对于笔记本电脑有一个固有印象:要么轻薄但性能一般,要么性能强劲但笨重臃肿。然而,今年荣耀新推出的MagicBook Pro 16刷新了人们的认知——发布会上,荣耀宣布猎人游戏本正式回归,称其继承了荣耀 HUNTER 基因,并自信地为其打出“轻薄本,更是游戏本”的口号。
众所周知,寻求轻薄本的用户普遍更看重便携性、外观造型、静谧性和打字办公等用机体验,而寻求游戏本的用户则普遍更看重硬件配置、性能释放等硬核指标。把两个看似难以相干的产品融合到一起,我们不禁对它产生了强烈的好奇:作为代表荣耀猎人游戏本的跨界新物种,它究竟做了哪些平衡以兼顾不同人群的各类需求呢?
友情链接:杰晶网络 DDR爱好者之家 南强小屋 黑松山资源网 白云城资源网 网站地图 SiteMap