百度爬虫Baiduspider抓取网页,经过处理建入索引中。目前爬虫只能读懂文本内容,所以 1. 使用文字来显示重要内容或者链接而不是图片(图片链接要使用alt) 2. 爬虫抓取的地方不适用Ajax(爬虫抓取是在服务器端渲染,ajax中还没有获得内容) 3. 尽量不适用iframe,iframe内容会被爬虫丢弃 4. 如果使用Flash制作网页,同时制作一个供搜索引擎收录的文字版,并在首页使用文本链接指向文字版 对于主要由ajax构成内容的网页,也可以对爬虫进行特殊判断,检测来访是爬虫之后,将爬虫引导到文本替代内容的网页
网页的title用于告诉用户和搜索引擎网页的主要内容是什么,所以爬虫在判断一个网页权重时,title是主要参考信息之一。 title一般可以这样设置: 1. 首页:网站名称 or 网站名称_提供服务介绍 2. 频道页: 频道名称_网站名称 3. 文章页: 文章title_频道名称_网站名称 每个网页应该有独一无二的title,重要内容放在title的开始。
说完title,自然就是meta description(搜索结果下面的描述),一个好的description会帮助用户更方便从搜索结果中判断网页内容是否与需求相符。 1. 准确的描述网页,不要堆砌关键词 2. 为每个网页创建不同的description
内容建设应该符合网站主题,否则在只能是浪费服务器资源,对网站的核心价值不会有任何帮助。在web2.0时代,引导用户评论、投票等,可以让用户减少筛选成本。网页中锚文本的内容同样非常重要,对于一张新网页,爬虫看到的首先就是锚链接。
引导用户在通讯工具上分享网址等推荐信息,也一样会被搜索引擎用来判断网页和网站价值。
从搜索引擎获得流量,有多少能转化为网站的核心价值,这就是转化率。内容型网站,忠实用户是核心价值,把搜索引擎用户转变为忠实用户就是最终目的;SNS网站,注册用户是核心价值,让用户来你平台注册、活动就是最终目的;如果你做电子商务网站,卖东西就是核心价值,把东西卖给顾客就是你要达到的目的。
在满足用户需求的同时适当的宣传品牌,不仅对用户在面对多个搜索结果时选择点击哪个有帮助,也会对口碑传播有很大的作用,这有三个层次: 最低层次,让用户知道他所获取的内容来自你的网站 1. 最低层次,让用户知道他所获取的内容来自你的网站 2. 进阶,让用户下次再想找这个信息时,能想到你的网站 3. 最终,能让用户在找同类内容时,能第一时间想到你的网站
新闻热点
疑难解答