关于如何预防robots.txt文件泄露网站后台目录的问题,我们首先需要了解robots.txt文件的用途和作用。
Robots使用说明
robots.txt可以告诉搜素引擎你网站的哪些页面可以被抓取,哪些页面不可以被抓取。
屏蔽无价值的页面。
屏蔽重复路径。
屏蔽死链等。
了解了robots.txt的功能后,我们会发现这样的一个问题:
问题描述:
在robots.txt文件中设置搜索引擎不允许访问“后台目录”,但是别人就会下载到robots.txt然后找出后台目录的地址,路径泄漏导致不安全隐患,有什么解决方法吗?当然有,下面361模板给出一般的解决方法。
解决方法:
首先,robots.txt是必须保证任何人、包括搜索引擎能访问的,否则就没有意义了,不能起到应有的作用。也可以这样说,只要搜索引擎能访问robots.txt,那任何人肯定也能访问。
由于robots.txt不支持通配符和表达式等各种条件的判断,所有只能通过变通的方法来实现尽可能的安全。
如果需要设置搜索引擎不允许访问“后台目录”、又不想让其他人看到后台目录(这是必须考虑到的!),假设后台目录是 /admin123/,那么我们可以在设置的时候这样写:
User-agent: * Disallow: /adm*/
关键在第二句,这样写就会阻止搜索引擎访问任何以“adm”开头的文件和目录。为了防止别人猜出你的后台目录,这里截取的越短越好,比如:
User-agent: * Disallow: /a*/
这样,同样起到作用,但留的字母更少,更难猜了,这时会阻止搜索引擎访问所有以“a”开头的文件和目录。
这里需要注意一个问题,就是要避免影响其它的目录和文件,可以通过修改后台目录来实现,不要把别的需要收录的文件或目录一块给屏蔽了。
如果后台目录以某个字母或几个字母开头,那就避免其它需要被收录的文件或目录以这几个字母开头,这样就可以了。
你学会了吗?这就是如何预防robots.txt文件泄露网站后台目录的全部内容。
新闻热点
疑难解答