先要准备两个软件:网际快车FlashGet和FineReader,华军软件园都有下载。前者需要安装,后者不用。
第一步:当然是搜索你想要看的书,找到这本书在线阅读的目录页面,一定要是目录哦,因为目录页会有所有内页的链接(如图)。
第二步:鼠标右键-使用网际快车下载所有链接(安装网际快车的时候会自动在IE上安装一个插件,如果你用其软件把这个插件卸掉的话,是弹不出如下这个窗口的。
这个窗口里包含了该页面所有的链接,我们所要下的是中间包含该书的有效链接,这些链接有一个共同的特征,就是数字的连续性。取消其它没用的链接(前面的勾勾取消),确定,更改一下保存路径,如果你不想把东西下载到C盘的话。
第三步:很快所有的页面都保存好了。关掉网际快车,打开Fine Reader。我用的是1.45版本英文的,不知道有没有完全汉化版,语言方面我不介意,所以也就没费心找。
第一行是四个界面,第一个是将HTML文件转换成TEXT文档,第二个是合并文档,第三个段落整理,第四个也是段落整理。我只用过前两个工具。
先使用HTML--TEXT转换工具,后缀是SHTML也可以转换。先点一下“Chinese File”,因为我们看的是中文字。可以看到里面的选项已经改变了。其它的都不用动,直接点Go。跳出一个查找范围的窗口,找到刚才用网际快车下载的那些链接,全选,打开。转换就开始了,速度超快。不要关闭Fine Reader,接下来还要用到。去保存的文件夹看看,每一个HTML文件旁都多出一个文件名一样的TXT文档。
第四步:接下来就要合并这些文档了。选第二个界面“Merge Files”。最上面"Targe file"里已经有默认的文件夹路径了,就是刚才保存页面的文件夹。点Browse,将*.txt改成这本书名,比如“大话方言.txt”,保存。(注意:该软件的合并顺序跟你选择文件的顺序是刚好相反的。所以选择的时候不要从头开始,而是要先从最后一个文件,拉方框一样选取所有文件。好像一些影音播放软件也是这个规则。还有一点要注意,不要认为9.txt文件一定排在10.txt前,事实上9.txt是排在89.txt后,90.txt前,同理,文件名是1至9的文件顺序都会打乱。最好的方法是将1.txt改成01.txt或001.txt,2.txt改成02.txt或002.txt,视文件总数而定)。保存完后,点Go。新的电子书就做好了。
打开刚刚做好的电子书,里面会有一些代码,类似该页面的源代码,所以在选书的来源时,那些页面越干净的做出来的效果就越好。
新浪的读书频道是让我又爱又恨,它这里的新书多而且藏书量丰富,种类繁多,但是它页面中含的代码太多了,做出来的电子书每页前后都会有大段大段的代码,要再通过手动处理。也可以找一些排版软件解决这个问题,不过我是希望越简单越好,所以如非必要我是不用新浪读书的。
第一次写,不知道有没有写明白,感觉自己挺罗嗦的。见谅。
v.
新闻热点
疑难解答
图片精选