这个小偷程序比较牛,只需要输入一个网址就能一键采集全站,且支持98%站点。但是如果要做出比较精致的采集站来还是得下点功夫。
本文就介绍一下采集规则的编写,要求程序在2.0以上版本。
首先需要选择一个目标站,目标站需要的条件:
1. 最好是单域名,即只有 www.xxx.com,最好不存在其他的二级域名,图片JS这些不影响。
2. 尽量选择JS少的站,华丽的一般JS较多,如:美丽说 这些就不合适了。
3. 图片不要防盗链,速度稳定。
教程选用的网站为:范文网,符号要求,下面开始规则的编写步骤。
一、添加规则:
1. 打开VIVI万能小偷的后台 采集节点 -> 添加 ,节点名称可以随便填写一个,然后填上目标站地址
2. 选上编码gb2312(编码的选择:在你的浏览器打开目标网站,右键查看源代码,找到text/html; charset=xxx xxx就是编码)
3. 在【目标站名称】处填:第一范文网
4. 保存
二、过滤广告:
1. 打开你的网站首页,看到已经完整的采集过来了。点击一个内页链接,进去看到有些广告
2. 回到后台,修改刚才编写的采集规则。
3. 勾选上站外链接、站外JS文件、站内JS文件 (这个站广告是放在站内JS文件所以过滤)。目的是为了过滤广告以及一些无用链接
三、替换logo
1. 对着logo图片右键,点击属性可以看到logo的地址了,把后面的地方复制下来(从问号开始)
2. 回到字符串替换规则,输入
{vivisign}siteimages/DyfwLog.gif{vivicut}{vivisign}static/fanwen/logo.gif (后面的 {vivisign}static/fanwen/logo.gif 代表 /static/fanwen/logo.gif,也就是把logo地址替换成你本地的logo文件)
3.到本地static文件夹下,新建一个文件夹为fanwen,然后把logo保存进去为logo.gif
教程结束,采集规则如下
VIVI:YToxNTp7czo0OiJuYW1lIjtzOjY6Ire2zsTN+CI7czo4OiJmcm9tX3VybCI7czoyNjoiaHR0cDovL3d3dy5kaXlpZmFud2VuLmNvbS8iO3M6OToib3RoZXJfdXJsIjtzOjA6IiI7czo3OiJjaGFyc2V0IjtzOjY6ImdiMjMxMiI7czoxMjoicmVwbGFjZXJ1bGVzIjtzOjE3MDoiP3NpdGVpbWFnZXMvRHlmd0xvZy5naWZ7dml2aWN1dH17dml2aXNpZ259c3RhdGljL2Zhbndlbi9sb2dvLmdpZg0Ke3ZpdmljdXRsaW5lfQ0KaHR0cDovL2ltZy5kaXlpZmFud2VuLmNvbS9zaXRlaW1hZ2VzL0R5ZndMb2cuZ2lme3ZpdmljdXR9e3ZpdmlzaWdufXN0YXRpYy9mYW53ZW4vbG9nby5naWYiO3M6OToic2lmdHJ1bGVzIjtzOjA6IiI7czo3OiJyZXBsYWNlIjtzOjE6IjAiO3M6NzoicmV3cml0ZSI7czoxOiIwIjtzOjc6ImxpY2VuY2UiO3M6NzA6IrW9c3RhdGljzsS8/rzQz8KjrNDCvajSu7j2zsS8/rzQzqpmYW53ZW6jrMi7uvOw0WxvZ2+xo7TmvfjIpc6qbG9nby5naWYiO3M6Nzoic2lmdGFncyI7YTo1OntpOjA7czo2OiJpZnJhbWUiO2k6MTtzOjY6Im9iamVjdCI7aToyO3M6NDoib3V0YSI7aTozO3M6NToib3V0anMiO2k6NDtzOjc6ImxvY2FsanMiO31zOjQ6InRpbWUiO2k6MTM5OTczMTc0NDtzOjEwOiJzZWFyY2hfdXJsIjtzOjA6IiI7czoxNDoic2VhcmNoX2NoYXJzZXQiO3M6NjoiZ2IyMzEyIjtzOjEwOiJmcm9tX3RpdGxlIjtzOjEwOiK12tK7t7bOxM34IjtzOjg6ImJpZzUyZ2JrIjtzOjE6IjAiO30=:END
新闻热点
疑难解答