本来这篇文章我打算讲一下分词和索引库,但是写到一半,发现如果我不把怎么学seo讲明白的话,有些人可能又觉得我写了一个偏门的东西了。 还有,上次网站备案的时候很多人想让我写一下怎么学seo。所以这篇文章就讲一下怎么来学seo。我希望这篇文章能广为传播一下,让很多seoer意识到这些。
先定义一下,这里所说的seo,是纯粹的指从搜索引擎获得大量优质的流量,把网站要实现的最终效果最大化。有些人把网站运营的内容也纳入到seo范围,不过这篇文章不讨论网站运营的东西,尽管我是很建议大家把网站运营和seo结合。
在“seo作弊与反作弊”里,我把seo和心理学家类比过。其实他们有相同点也有不同点。
相同点就是:你研究的对象,有很多的秘密等着你去探索,对于研究它的人,经常都会有东西是你不知道的。 不同点就是:心理学是一门自然科学,自然界创造的东西,以人类现在卑微的探索能力,你永远无法说你有多接近真实。但是搜索引擎,却是完全由人自己创造的,所以理论上还是能完全把搜索引擎弄明白的。
这就谈到了一个真正的seoer应该学习的第一大技能:弄懂搜索引擎相关技术和原理。
我是不太同意那样的说法的:做seo不需要太技术化,考虑好用户体验就不用担心什么了。考虑用户体验,做好内容是绝对应该做的,这其实是在网站运营方面就要考虑的东西,但是技术化也是另一个非常重要的东西,它很多时候甚至是决定性的条件。
用常识想一想,我们在一个叫做 google 或者百度的平台上拉流量,但是我们对于这个平台内部是怎么运作的竟然不了解,这不是搞笑吗?? 农民种菜还要了解天气和季节对农作物的影响呢。
不光要了解,而且要把这些知识应用到seo,这种了解还需要达到一定的深度才可以。 像迈克·摩尔,做了20多年搜索引擎开发,在搜索引擎领域有多项专利,他也在做seo。而现在有些seoer,仅仅知道怎么样排列关键字就觉得是在做seo了。这个差距真的不是一般的大。当然,最后的结果也是很悬殊的。 迈克·摩尔说过:只有少数人能真正控制搜索引擎。我一直认为他自己就是那种能控制搜索引擎结果的人,记得2年还是3年前,他的团队就硬生生把一个网页在搜索“seo”的时候排在了第四,那个网页,当时连一些资深的seoer都看不明白怎么能排在第四的。
关于怎么在页面上排列关键字,一个报纸的排版人员其实更擅长,他们非常明白怎么兼顾阅读性和内容突出度。如果罗列关键字的技巧就是seo,那也难怪很多人局外人说seo非常简单了。
至于怎么去了解,我推荐大家先去当当网搜一下,有很多的介绍搜索引擎原理的书籍。如果有条件,还需要自己做一个搜索引擎。如:可以用lucene之类的自己搭建一个搜索引擎实践一下。 虽然google对自己的很多技术都很保密,但是放心好了,搜索引擎并非google和百度独有的东西。把类似的搜索引擎了解清楚了, 你再来看google和百度,发现绝大部分还是一样的。
了解得比较透后再来做seo,你就能从搜索引擎的角度出发来看待你在做的事情。你会非常的理解做搜索引擎的人,了解他们的短板在和痛苦在哪里。了解他们将来会怎么去改进他们。
第二大技能:了解网站制作相关的技术,至少能独立做一个静态网站。
了解完了搜索引擎,还要了解我们服务的对象–网站。能从头到尾自己做一个静态网站是最基本的要求,当然能做动态网站更好。这个就要求你懂动态网页开发语言,精通html,基本的css,javascript 等等。一个好的seo人员,最好能帮助网页设计师改写和优化代码。这个技能,在你做内部优化的时候,能帮助你很多。
seoer每天做的事情,非常多和网站的技术相关的。 要配合搜索引擎的要求对网站进行调整,仅仅依靠工程师和网页设计人员是不行的,你要清楚里面的细节。不然你都不知道改动某个地方可以对seo有利。
会网页开发后,还要知道网站架构相关的知识,服务器架设、cms、还有数据库的性能调优等等都是需要了解的。比如,在稍微大一点的网站,提高单个页面的加载速度,对seo都是非常有利的。但是哪些改进可以提高加载速度呢? 依靠工程师,它给你提高10%的加载速度你已经感恩戴德了,但是如果你自己懂的话,把页面冗余代码除去,js外调合并压缩,图片实时压缩,页面cache, 马上提高400%的加载速度,这个效果是不一样的。
对这两大技术方面的了解,越详细越对自己有利。我在“锚文本在seo当中的重要性”中提过:好的seo,一切因素都是可控的。那要拿什么来保证一切因素都可控。 是首先你了解到了所有的因素,然后你具备了控制这些因素的能力。这样,你做的每一个改动,你非常清楚带来的效果会是什么。这个就是seo的核心竞争力。
|||
在学习搜索引擎的相关技术和原理的时候,特别要注意研究爬虫。这也是从常识出发来想的:搜索引擎和网站之间,是爬虫把他们连在一起的。这就是我那么执着于研究爬虫的原因,所以博客里有好几篇都是介绍爬虫的。还写了一些与之相关的:nofollow, url静态化等等。
一个seo同行也认可这种方法的。今年,我们另一个部门的领导在参加美国smx大会的时候,碰到了一个以前在google工作了8年、现在辞职做seo顾问的人。那个顾问给的意见就是:seo要站在搜索引擎的角度来看待问题;然后把网站的技术问题解决好;那些技术问题,不是可有可无的,而是不掌握就不能开始做seo的。我听到这个转述,真的毫不怀疑他确实在google工作过8年的人。大家还可以在《google网站质量指南》里多看看,无处不充斥着很多技术问题。
很多优秀的seoer,都在各自独立做seo,但是最后大家都殊途同归、都在朝正确的方向走的。这是因为他们对这些常识有了解,知道怎么走是不会错的。对常识的了解深到什么程度,你就能有优势到什么程度。其他一些一线的seo,在这些常识的基础上做得既大胆又创新,连我这个对手都不禁要为他们喝彩。
我基于对搜索引擎技术的学习,使我都非常想和google的人交流,因为我明白他们设计某些规则的思想,以及碰到的问题,有时候觉得自己说不定也能给他们提供一点解决方法。在08年4月厦门的smx大会期间,我就和朱建飞单独聊了一个半小时,主要谈他的本行-anti spam。我相信他那时是非常愿意和我谈并且印象深刻的。
第三种技能:数据分析能力。
数据分析能力是做seo应该具备的基本能力。很多影响seo效果的重要因素,都可以从数据上反映出来。不管是前期的预测,还是流量波动后的事后分析,都是离不开数据分析的。seo数据分析需要做到三步:1,知道哪些因素可以数据化;2,建立适当的数据公式或模型;3,分析这些数据和流量之间的关系。这里的每一步做到什么程度,也就决定了你的整体能做到什么程度。比如“建立适当的数据公式或模型”这一步,有些国外优秀的sem公司就做得很好,它根据这个公式得到的一个数据,能很准确的反应你在这一块和竞争对手的差距在哪里。
这个能力,是先要有正规的教材帮助你入门才可以的。有很多现成的分析方法需要你先掌握,然后再根据seo数据分析的特点来变通。同样的数据,分析方法不一样,得到的结论也不一样。
这个数据分析中,要特别注意log日志分析。seo数据分析中的数据来源,很大一部分来自服务器log日志。这里记录了爬虫和用户访问网站的种种信息。如果你具备了相关的能力,可以把log日志里的任意数据合并拆分来分析的。比如从log日志里分析爬虫的到访的次数,每次停留的总时间,单个页面的平均停留时间…… 等等任意维度。
还有第四种技能:了解你要排名的那个搜索引擎。
可能有人很奇怪为什么这个能力可以和其他能力并列,并且好像和前面谈到的第一种能力是重复的。
是这样的:
如果有人问我为什么觉得自己能有信心在google上做好seo,我脱口而出的回答会是:“因为我非常的了解google”。从google一开始为什么会做这个搜索引擎、一开始他们在技术上怎么考虑的,到google现在推出的各种各样产品的由来和现状,到google将来会对哪些产品做什么样的改进我觉得自己都能体会到。虽然了解得很粗糙,但是还是一直在努力探索。
记得也是08年4月在厦门,我跟一个人在极力解释google应该会推出自己的浏览器,他还是半信半疑的。不过我是非常肯定这个事情会发生的,而且这只是一个开始而已。google那时和firefox的合约恰好快到期,浏览器这么重要的互联网入口,按照以往google的做事风格是绝对不会不理的。而且这个和google长期的战略目标非常吻合。再有,做这样的产品很合施密特(google ceo)这个人的胃口。
还有,原创性是现在google排名因素当中一个非常重要的因素。了解google以前历史的人,都非常明白google会用什么算法来检查原创性。这个算法在98年google诞生之前就有了。google这个网站的灵感来源于布林(google创始人一)开始做的数字图书馆项目,在图书领域,也是存在很多的抄袭行为的。在这个算法基础上,之后合并一些算法应用到了搜索引擎。不过这种算法,在面对上百亿网页的时候,会产生很多的“噪音”。所以在判断原创性方面google现在的表现不完美,不过一直在努力,而改进办法之一就非常依赖google数据中心的效率。
不光这个算法依赖google数据中心的效率,google拉开和竞争对手的距离,也是依靠数据中心的。很多人一直不明白这个才是google的核心竞争力之一。
关于这些以后都会有相关文章介绍的。
掌握这些技术知识,就有了一个非常好的基础。接下来就是长期的跟踪和实践。那么很多人会问:其他一些能力呢,那些很多人都强调的比如 seo关键词的选择、内链外链的分析技巧等等?
我觉得那些技巧都是在这些基础之上长期实践得出的常识性的东西。比如 关键词的选择好了,像在“seo关键词的选择”中那样的技巧,其实是只要你有数据分析的意识就是可以发现的。要是再进化下去,还可以发现更复杂的技巧。比如,从另一个角度来分析,长尾关键词和热门关键词应该偏重于优化那种呢?我的结论就是:优化大型网站的时候,把资源偏重优化热门关键词,会让你丢失掉50%以上你本来应该得到的流量。这个结论可以说颠覆了很多人的想法,但是数据分析可以为我们揭示其中的缘由。
|||
seo新手入门,学习资料我只推荐一本书、一个网站。
一本书是《搜索引擎营销:网站流量大提速》。
此书的作者之一就是我常说的 mike moran,研究搜索引擎技术20多年的人。这个书的中文版只有2006年那版的,后来的更新版本只有英文版。他的网站上有最新版本的购买链接http://www.mikemoran.com/ 。
这本书完整讲述了搜索引擎营销的过程和方法。对于有些人来说,这本书好像平淡无奇,那可能是因为受一些错误观点误导太久的缘故。真正的sem方法,没有秘籍,一开始就是那么简单,但是要深入下去就很复杂。我当初拿到这本书的时候,是用一天一夜的时间连续不断看完的,之后又反复看了20几遍。因为我看到一些我辛苦总结的东西,作者一笔带过就讲清楚了。这本书很厚,即使seo已经从业很久的人员,这本书相信精读下去你还是不断会有收获的。
这本书还有很特别的一点,就是专门花一个章节来讲述你如何向你的老板和你的同级部门去推销你的seo方案。因为即使是现在,在一个大中型网站里要说服大家接受某些seo改动还是很费精力的。
其实有很多好的seo教程,本来我以为只有我力捧这本书的,没想到有一天拥有11年seo经验stephen 也跟我极力赞扬这本书。他很少这么推崇一本书的,所以大家快买来看看吧。
一个网站是指《google网站质量指南》。http://www.google.com/support/webmasters/
相信大家也看到我多次引用里面的文章,那是因为好的seo方法都在这里面的缘故。很少有人知道的是,《google网站质量指南》里其实有几百篇文章,涉及到seo的方方面面。里面提到的很多方法都是seo的最终解决方法。
比如:如何去写meta description。
主流的做法会告诉你:在保证语句自然流畅的时候,适当的重复几次关键字。
但是google会这样告诉你写:
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=35264#1
1,为不同网页创建不同的描述。(注意网站一级描述和网页一级描述的区别)
2,在描述中包含清楚标记的事实。 (这样的写法就很好: <meta name=”description” content=”作者:a.n. author,插图制作者:p. picture,类别:图书,价格:$17.99,页数:784 页”> )
3,程序生成的描述。(大中型网站都这么做)
4,使用高质量的描述。(要考虑排名的转化率,排在第一名的有时候不一定比第四名获得更多流量,怎么样让用户最先点你的网站而不是别人的,就需要你多多注意)
google的这四点建议,我觉得就是写meta description的最终解决方案。一定要多实践,才能体会得到为什么。
《google网站质量指南》里尽管事无巨细写了很多,但是还有很多是点到即止的。像我在《lynx浏览器在seo上的应用》里写的lynx就是。还有一些是要你自己去发掘的,像《我也谈一下nofollow》里写的nofollow属性,《google网站质量指南》是在很多篇文章里从不同的角度谈到了它的特点。很多条目是因为那件事情本无法仔细描述而没有详细写,还有一些是因为不能透漏更具体的信息以免被喜欢spam的人利用。
google之所以把这些方法公布出来,是想和这些给他提供内容的网站达成双赢的局面。搜索引擎应该明白的一个道理就是:搜索引擎的内容来自于其他网站,如果这些网站都按照搜索引擎提供的一个质量标准优化自己的网站,把自己有什么内容都告诉搜索引擎,哪些内容是重点都标示出来,就可以达到这样的局面:一,搜索引擎检索到高质量的内容给了用户。二,那些网站拿到了属于自己,比作弊得来的还更好更多的seo流量。
google其实就是用这样的一种策略化解了原本过度的seo和搜索引擎之间的对立关系。这一点是国内的百度一直不会明白的。
这个质量指南其实google对外宣传的时候一直在强调的,也非常重视它的更新。告诉大家一个小技巧就是:一旦google针对某个算法有更新,google也会在第一时间更新《google网站质量指南》里相关的条目,所以请随时留意右下角的更新日期。有新的算法参与排名,也会在里面加上相关的内容,并给予你非常合适的指导。如在《“丰富网页摘要”,让你的网站与众不同》里说的微格式,google已经增加了这个内容的指导。
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=99170
再来谈一下网上的其他seo资料。
因为seo算法一直都是不公开的,所以seo行业就没有一个自己的标准。这就使这个行业内充满了很多完全不一样的观点。对于新手,有时候一些观点会让你误入歧途的。很多道理都可以自圆其说,但是可能完全错误的。
我观察下来,发现还是应该去参考那些在一线的,有实践经验的人。有很多seoer,即使是新手,因为他们有自己的网站练手,也已经做得很不错了。
做seoer,包括我,都要经历一个阶段: 那就是做了很多自己认为是好的优化动作,但是流量就是不涨起来,排名也没有什么变化;感觉能用的都用上了,但是就是没有起色。这个就表示你对影响seo的因素还没有了解清楚,还有就是不具备控制好这些因素的能力。一定要清楚的是:好的seo,一切因素都是可控的。
接下来我会写得勤快一点,把各类因素都揭示出来。
新闻热点
疑难解答