《百度搜索引擎网页质量白皮书》PDF完整版在文库上线后,下载量已达4800余次,阅读量接近22000次,在站长界、SEO圈引发热议。最近小编发现一位网友的解读很有深度,特意推荐给大家参考,百度站长平台非常愿意看到网友对站长平台上的内容从自己的角度进行分析理解。原文如下:
前阵子不知道谁说百度的流量份额下降了很多,360的上升了不少,数据来源很明确,但是数据的真实性谁也搞不清楚。如果百度流量份额真的下降了,是不是因为搜不出好东西来了?
把搜索引擎数据库填满的,不是那寥寥无几的大网站,而是数不尽的中小网站。中小网站对于百度的意义,就像中小卖家对于淘宝的意义。所以如果百度不伺候好这些长尾网站,能搜的东西可能真的越来越少了。
老套白皮书的新解读
当然,百度站长平台一直都很努力的,最近就推出了《百度搜索引擎网页质量白皮书》PDF版,总共18页。它就是想告诉你什么样的网页是好网页,什么样的网页是差网页,而且中间还分好坏的级别,并且有案例可以参考。
如果你已经从事SEO好些年了,看完这份白皮书之后,你会有一种“看了等于没看”的感觉。这些东西很有道理,所以你可以理解为老生常谈。白皮书还是那份白皮书,但你解读它的角度可以不一样。仔细看的话,你也会发现一些新东西。比如以下几个:
1、增加了浏览体验考核
它这里只是说用户浏览体验,没有说用户体验。也就是说,它只强调视觉层面的东西。这算是用户体验的一个分支,但是这次百度没有说一些含蓄的行话套话,而是直接指明了影响浏览体验的两大敏感因素:排版和广告。
对于排版,百度说要排版合理、版式美观、易于浏览和阅读。
我的理解是行间距和段落间距要疏松一点,多进行分段,大小标题和列表穿插其中,使内容富有层次感。
对于广告,百度说广告不能混杂在内容当中,而且广告语内容的匹配度要尽量高。它还用一张“影响网页质量的要素图”明示了广告对用户体验的影响太猖狂了:
有人说文章有料就不要在意排版这些细节,但是大部分用户在意,搜索引擎在意,所以最好还是重视起来,好好给网页整整容。有时候一个人什么都没做错,错就错在长得太丑了。网页也一样,视觉化营销应该作为浮躁风气下的新武器,因为在大数据时代,实在有太多的数据,用户的眼球已经被蹂躏得筋疲力尽了。
2、关于可访问性
白皮书提到,百度希望网页不要设置太多的阅读障碍,尽量能够让用户直接获取网页信息或资源,不要过分使用注册、登录、安装插件等等限制手段。
这里会存在一个悖论:限制越多的资源往往质量越高,但是限制太多又会影响用户体验,顺便影响搜索表现。
如果听百度的,一切以用户为中心,不设限制,但是目前互联网上版权意识又太薄弱,自己的知识产权很容易受到损害。
再三考量之后,很多人还是会选择设限,放弃迎合百度的胃口。搜索流量不能赚几个钱,还可能让自己的东西被抄袭一百遍,最后丢了尊严。
这个问题其实很值得思考。现在卖文章的人越来越多了,往后卖其它内容的人可能也会越来越多。也就是说,以后真正的好内容可能就要直接花钱买了,在搜索引擎上是搜不到的,最后搜索引擎会渐渐演变为一个大众化的“基础知识库”,它只能停留在“百度一下,你就知道SEO”这个水平,而不能达到“百度一下,你就懂SEO”的水平。
至于那些深刻见解、行业机密、系统性教程等等干货,只掌握在少数人手中(大众也不懂得怎么搜这些东西),市场供需关系也会让这些内容自动赚钱。
所以,中小内容网站的可以考虑往这个方向去走:用大而全的内容从搜索引擎获取流量,用小而精的内容进行变现。
3、没有提到原创与不原创
几年前强调原创的力度比较大,于是各种心灵鸡汤、旅游心得、婚丧嫁娶这种圈子型文章以及死皮赖脸凑字数的专家文章噼里啪啦冒了出来。没有内容体系的原创和没有深度的原创都会造成无效信息的泛滥。
所以,整篇《百度搜索引擎网页质量白皮书》甚至都没有出现“原创”两个字。
实际上,原创根本就不是要紧的事。如果互联网上只有原创,就相当于线下只有生产厂家,没有运营商和推广渠道一样,那产品的影响力也是相当有限的。
对于内容的输出,最根本的是保证价值输出,至于原创与否,搜索引擎和用户都不太想去追究了。
无论出于什么目的,基本的内容路线都有三条:
1、原创
有实力的原创就是秀出专家魅力,没实力的原创就是制造垃圾。所以,走这条路线的,一般都是某领域的专家,也只有它们的原创才能生存。如果你本身没有对一个领域进行深入研究,仅仅想喷出自己的浅见,那还是算了吧,反正也创造不了价值。
2、策选
策选可以理解为策划+选择。如果说原创考验的是专业实力,那么策选考验的就是体系组合能力。网上有很多资源可以利用,对这些资源进行多种多样的组合加工,就可以有多种多样的变种内容。就像造房子,一堆砖头、沙石、钢筋水泥就摆在那里,最后决定房子造型的是你的构思和规划。内容体系就是构思和规划,也即是策选的过程。
3、采集
采集就是直接拿过来用,有些网站就是以干这事为生的,比如一些网页精算网站。目前,直接拿过来用还是相对容易的,版权追求还没有那么大的震慑力,但这并不等于你就可以为所欲为了,胡乱采集就相当于内容抢劫,是会遭报应的。走采集路线考验的是信息搜索能力和个人的眼光,你能找到多干的东西,并设立了怎样的准入门槛,都会最终决定你的内容影响力。
随着内容的形式越来越复杂,原创与非原创的界限变得越来越模糊,搜索引擎判断原创和保护原创也会越来越吃力。所以,与其纠结于原创还是不原创的问题,还不如好好想想怎么打造属于自己的、独一无二的内容风格。比如百度的建议当中就有这么一个暗示: