[PerlChina] 请教一个问题,脚本编程时候的大数据量比较问题

Havel Zhang havel.zhang at gmail.com
Fri Oct 26 06:17:46 PDT 2007


能不能先grep <your text file> 先筛选出有特定关键字的记录,放到一个文件后,然后用hash和正则表达式来匹配,找出重复的记录?

Havel Zhang


On 10/25/07, zongzi <honghunter at gmail.com> wrote:
>
> 我现在需要从十几万条数据(文本文件中的行)中,提取有特定关键字的记录,然后刷选出这些记录的特定位置重复的记录。
>
> 这是一个桌面使用的脚本,系统维护工作中使用的。
>
> 我本来是想直接放进数组,然后一个一个比较的。
>
> 但是突然觉得那样就算不会超出数组大小的上限,也是非常没有效率的。
>
> 所以想请教一下各位,有啥好的处理思路吗?
>
>
>
> --
> 这是一个有钱人的世界,与我的世界截然不同!
> blog:http://www.dps4e.com/b/ & http://blog.dps4e.com
> 饭否? http://fanfou.com/zongzi
> _______________________________________________
> China-pm mailing list
> China-pm at pm.org
> http://mail.pm.org/mailman/listinfo/china-pm
>



-- 
真理使你自由
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://mail.pm.org/pipermail/china-pm/attachments/20071026/773709fa/attachment.html 


More information about the China-pm mailing list