[PerlChina] 【请教】大量文档处理的时候,怎么保持中间状态,以便停止后能继续运行?

zongzi honghunter at gmail.com
Tue Apr 10 01:17:18 PDT 2007


问一个可能很傻的问题:
我尝试抓取网上的小说看。
我还不会弄数据库什么的,我的处理过程就是:脚本+txt+批处理+wget。
脚本作些简单的数据提取,例如从一个用wget抓到的html网页中,取出URL,然后生成批处理文件。
TXT是我现在的各种数据的存储方式。
批处理的作用就是调用wget,把URL作为参数去下载网页。

现在的问题是,我希望能处理一部分之后,断了,还能继续接着处理。
该怎么处理这些正在下载、已经下载、等待下载什么的状态哪?
或者说,怎么用文件保存一个列表中处理了一半的位置,下次能从这里开始继续处理?


-- 
这是一个有钱人的世界,与我的世界截然不同!


More information about the China-pm mailing list