首页 > CMS > 织梦DEDE > 正文

如果给织梦内核的系统书写规范的robots.txt文件

2024-07-12 08:49:31
字体:
来源:转载
供稿:网友
这篇文章主要为大家详细介绍了如果给织梦内核的系统书写规范的robots.txt文件,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴。

     一个符合SEO优化的网站需要考虑很多方面,其中网站的robots.txt文件也是比较重要的一个方面,在robots.txt文件里我们可以屏蔽搜索引擎,安排搜索引擎蜘蛛爬行路径等等等,是十分重要的优化利器。但是织梦DedeCMS本身自带的robots.txt文件设置很简单,并不能完全满足网站的优化要求,那么我们要如何结合自己网站的情况,做好robots.txt优化呢?下面是织梦模板网给出一点建议供大家参考(适用于未伪静态的DEDECMS网站)。

    User-agent: *

  Disallow: /dede 管理后台目录,需要改名,具体设置后面具体讲

  Disallow: /include 程序核心文件目录

  Disallow: /member 会员管理目录,有些文件可以开放

  Disallow: /plus 插件及辅助功能目录 ,有些文件可以开放,如search.php

  Disallow: /templets 默认模板存放目录

  Disallow: /data 系统缓存或其它可写入数据存放目录

  Disallow: /uploads 上传下载文件保存目录,不想搜索引擎引用图片的话,禁止

  Disallow: /images 系统默认模板图片存放目录

  Disallow: /index.php 网站默认首页,静态化的话,最好禁止

  Disallow: /404.html

  Allow: /plus/search.php 开放禁止目录里的具体文件

  ...

 当然如果您不会书写robots.txt文件,可以直接使用织梦模板网的线上工具:《robots.txt文件生成工具》。

  基本设置就是这样,下面着重讲下后台管理目录和栏目页的设置:

  1.dede目录,为了网站安全考虑需要改名。然而改名之后,大家不免疑惑:改了名,在robots.txt文件里怎么设置呢?直接禁止抓取,还是泄露了后台目录,等于改名无效。那么该如何解决这个问题呢?我们可以通过下面的设置解决这个问题,如后台目录为dedecms:

  Disallow: /d*ms

  这样我们就能即禁止了搜索引擎的抓取,又不会泄露了后台目录名称。

  2.栏目页。有些人会注意到,如果网站不做伪静态优化的话,栏目分页后会有两个链接指向栏目首页,如*/web/和*/web/list_1_1.html,为了网站优化,建议先将栏目分页优化以下(具体做法大家可以在网上找),把首页和第一页的链接改为*/web/的形式,然后在robots.txt文件里做以下设置:

  Disallow: /*1.html$

  以上就是DEDECMS robots.txt文件的设置,大家可以根据自己网站的情况具体设置。

  注意事项:

1.按官方说明设置好目录权限;

2.后台目录改后的名称开头字母和结尾字母不要和其他目录一样;

3.用百度站长工具测试一下robots.txt文件设置是否有效。

以上就是如果给织梦内核的系统书写规范的robots.txt文件的全部内容,希望对大家的学习和解决疑问有所帮助,也希望大家多多支持武林网。
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表