robots规则--688IT编程网

规则

是一种文件，用于告诉搜索引擎爬虫哪些页面可以被访问，哪些不可以被访问。它通常放置于网站的根目录下，即域名后面的第一个文件。网站管理员可以通过修改来控制搜索引擎爬虫的行为，从而保证网站内容的安全和正确性。下面是规则及其解释。

User-agent:

Disallow:

这是文件中最基本的规则，意思是所有的搜索引擎爬虫都不可以访问网站的任何页面。

这个规则的意思是所有的搜索引擎爬虫都不可以访问网站的任何页面。这个规则通常比较危险，应该只在特殊情况下使用，比如网站被黑或者正在进行重大维护升级等。

这个规则的意思是只限制Google爬虫（googlebot）不能访问网站的/private/目录下的页面。其他的搜索引擎爬虫依然可以访问这些页面。

User-agent: *

Disallow: /admin/

Disallow: /cgi-bin/

爬虫可以干什么 Disallow: /db/

Disallow: /includes/

Disallow: /modules/

Disallow: /tmp/

Disallow: /web_services/

Disallow: /xmlrpc/

这个规则禁止搜索引擎爬虫访问网站的管理员目录、cgi-bin目录、数据库目录、代码包含目录、模块目录、临时文件目录、Web服务目录和XML-RPC目录。这些目录通常包含的

是网站的敏感信息和业务数据，所以要严格控制访问权限。

这个规则是WordPress网站的标准规则。它禁止了Google爬虫访问网站的说明文件、许可证文件、登录页面、XML-RPC文件以及WordPress的后台目录和核心文件目录。其他的搜索引擎爬虫也可以根据这个规则进行访问控制。

这个规则禁止搜索引擎爬虫访问网站的压缩文件、PDF文件、Word文件、Excel文件、PPT文件和Flas件。这些文件通常比较大，访问也会减缓网站内部的流程和用户体验。如果网站需要公开这些文件，可以使用单独的文件夹来存储它们，并在文件中进行具体指定。

Disallow: /search$

Disallow: /*?s=

这个规则禁止搜索引擎爬虫访问网站的搜索页面。搜索页面通常不包含实际的内容，而是一些带有搜索参数的页面，通过这些页面搜索引擎爬虫可以访问到网站内部的一些敏感信息。这个规则能够保护搜索页面和搜索参数的安全性。

总结一句话：规则能够保护网站的数据安全和隐私保护，同时也可以提高搜索引擎爬虫的效率和精准度。

688IT编程网

robots规则

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

robots规则

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式