[PerlChina] 请教一个问题，脚本编程时候的大数据量比较问题

Fri Oct 26 06:17:46 PDT 2007

能不能先grep <your text file> 先筛选出有特定关键字的记录，放到一个文件后，然后用hash和正则表达式来匹配，找出重复的记录？

Havel Zhang


On 10/25/07, zongzi <honghunter at gmail.com> wrote:
>
> 我现在需要从十几万条数据（文本文件中的行）中，提取有特定关键字的记录，然后刷选出这些记录的特定位置重复的记录。
>
> 这是一个桌面使用的脚本，系统维护工作中使用的。
>
> 我本来是想直接放进数组，然后一个一个比较的。
>
> 但是突然觉得那样就算不会超出数组大小的上限，也是非常没有效率的。
>
> 所以想请教一下各位，有啥好的处理思路吗？
>
>
>
> --
> 这是一个有钱人的世界，与我的世界截然不同！
> blog:http://www.dps4e.com/b/ & http://blog.dps4e.com
> 饭否？ http://fanfou.com/zongzi
> _______________________________________________
> China-pm mailing list
> China-pm at pm.org
> http://mail.pm.org/mailman/listinfo/china-pm
>


-- 
真理使你自由
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://mail.pm.org/pipermail/china-pm/attachments/20071026/773709fa/attachment.html