首先说明我是如何建站的,我当初的梦想是以”书“的形式来统一信息,因为我始终相信”书“是唯一能归类整理信息的”工具“,所以我做了书站。整个网站模拟自然书的结构。开始的流量只有一天30人。
为什么没有流量呢? 原因很简单,因为我的书全是”经典“的书,而不是玄幻类的文化快餐。从此我改变了思路,还是先有流量再说,于是进了百度排行榜,选最热门的书添加(纯手工的方式)。可是让我失望的是,所有的小说站都是广告,而且禁止粘贴复制!加了一晚上才加了一本书。(幸运的是那段时间我一直在研究网络蜘蛛,因为我想要实现信息的归类整理,只有靠机器去完成,人是不可能的。)第2天继续加书的时候我用自己研究的小工具抓取了下那个“垃圾”书站的内容。发现竟然是静态页面再套个iframe,而js 代码禁止粘贴复制。但iframe里面竟然是一个aspx文件,而且带有参数。当时喜出往外,于是连续获取那网站3个页面,书页,卷页,及章页。我惊奇的发现,原来我可以轻易的写程序采集出来。于是一天写了采集程序,终于可以点下按钮加一本书的。可是问题出现了,成功率只有98%,也就是一本书,至少有一张缺页。我继续采第2遍,发现依然缺页,但缺的不是同一张。终于知道了,因为网速,怎么也会有误差,于是我设计数据库,把采集过的地址保存下来,并且判断是否抓取成功,没成功就补抓,补抓3遍终于出错率降低到了万分之一。继续完善程序,花了3天针对那个”垃圾“站点写了采集程序,一晚上采集了近1万本书。并且全部做了搜索引擎优化。
开始,奇迹发生了。流量 从 30-200-500-1200-3000-6000-12000-3万 ,我现在依然能记得当时是怎么成几何级数增长的流量的。平均每过一星期就要增长2-3倍!
盈利:为了挣钱我来到了"落伍”,虽然我承认是编程高手,但对于网挣我是个外行。很快因为网站,我落伍了。很快认识了很多“落伍”的朋友,很快我去尝试了很多联盟。什么sogou,keyrun,iplus,myad,百度推广,gogle推广,还有采信,电影等等。从点击广告,到美女图片,到弹出窗口,我都放。很快自己真的“落伍”了,很快开始的理想忘了,很快我的站也垃圾了,虽然一天可以挣个100多。
流量的急剧下滑:也许上天的惩罚,也许是因为我太过于急功近利。终于,我遭了“落伍”的黑手。我的站给别人采集了。由于我全部页面div+css,采集我的站的人基本随便找个软件就可以100%采集完。而那个人又是个seo高手。于是我对流量全跑他那去了。我写信给那个人,他也回了,他告诉我以前不知道采集为何物,也是因为在落伍亮了自己的站,所以给采得体无完服。从那以后,他再也不在落伍发帖,只看帖。从那以后,他也采集了,从那以后。。。。。。。我成了他的目标.......
反采集研究:从那天起,我猛然意识到,光采集还不行,采集所有基本的手段和技术对我来说都不存在技术门槛,但我不能让我辛苦采集到的内容给别人轻易采集了。于是,我苦心研究了几天的反采集技术,因为我相信一般采集的人自己都不会写采集程序,都是下程序来采集的,而且大多数是web采集程序,所以只要能防得住我自己,相信可以防得住99%的菜鸟采集者。当然高手是不可能防得住的,除非你不显示。终于我研究出了初步的反采集,即能让搜索引擎搜索,又能让采集程序无法获取内容,结合js,又能让浏览器获取内容。实验了一个星期,百度成功更新了我改版后的网站!
奇迹,流量少了,挣的钱反而多了!有的时候真是有意载花花不开,无心插柳柳成阴。我无意中采集csdn6万篇编程文档,竟然让我每天挣了10美元!编程站每天只有2000的ip,pv也不过3000,然而经过我优化google广告的位置,竟然破天荒的达到 3-4%的点击率,而且单价非常之高!!!以前3万ip,15万pv的读书站,少的时候只能挣8美元,而2000ip的编程站竟然能获取这么多收入!
回到原点,人间正道是沧桑!结合自己做百度的经验,在百度里做竞价的都是企业,比如卖车的广告,没有人出汽车这个关键词,因为搜汽车的都是看图片的,但输入汽车品牌,汽车配件,肯定是商人或用户,所有有人出高价!同样的道理,网络的经济,尤其是google 的广告,我们的企业何尝不是最大的广告主呢?为了避免无效广告,为了体验“效果为王”各个商家都会在很专业的领域买关键词。所以才有编程站的单价之高!所以真正的网挣,是获取真正有价值的信息,到了今天我才明白了什么是IT,什么是“信息科技”!
未来发展的方向:“采尽天下为我所用“!2005年是搜索力经济年,在2006年这个势头还会持续发展。搜索引擎之所以能火,是因为它海量的信息!既然自己能轻易的把那么复杂书采集了,证明一点没有我采不到信息,但关键不是采集,而是建立起智能蜘蛛,让服务器自动的去采集,整理,发布。把采集程序写成windows的服务。开机自动运行,并且定时读采集规则文件,定时采集,定时发布成最最最简洁的静态页面,方便搜索引擎收入。而信息就是全天下的各行各业的正规信息。在采集的同时,不断完善反采集技术,做到只有我采别人的,不能让别人来采我的。因为最后我发布的信息肯定是很简洁的信息。
我的心里话:钱=有价值的流量=有价值的信息。联盟就做google吧,因为google是迄今我认为最公正的最不会扣量的网挣联盟。做国内的10个联盟都比上做一个google,而且你做那种广告,用户体验会降低,而你放google不但不会妨碍别人访问,反而会因为google的知名,让人感觉你的网站正规可信!
新闻热点
疑难解答