<div>能不能先grep &lt;your text file&gt; 先筛选出有特定关键字的记录,放到一个文件后,然后用hash和正则表达式来匹配,找出重复的记录?</div>
<div>&nbsp;</div>
<div>Havel Zhang<br><br>&nbsp;</div>
<div><span class="gmail_quote">On 10/25/07, <b class="gmail_sendername">zongzi</b> &lt;<a href="mailto:honghunter@gmail.com">honghunter@gmail.com</a>&gt; wrote:</span>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">我现在需要从十几万条数据(文本文件中的行)中,提取有特定关键字的记录,然后刷选出这些记录的特定位置重复的记录。<br><br>这是一个桌面使用的脚本,系统维护工作中使用的。<br><br>我本来是想直接放进数组,然后一个一个比较的。
<br><br>但是突然觉得那样就算不会超出数组大小的上限,也是非常没有效率的。<br><br>所以想请教一下各位,有啥好的处理思路吗?<br><span class="sg"><br><br clear="all"><br>-- <br>这是一个有钱人的世界,与我的世界截然不同! <br>blog:<a onclick="return top.js.OpenExtLink(window,event,this)" href="http://www.dps4e.com/b/" target="_blank">
http://www.dps4e.com/b/</a> &amp; <a onclick="return top.js.OpenExtLink(window,event,this)" href="http://blog.dps4e.com/" target="_blank">http://blog.dps4e.com</a><br>饭否?<a onclick="return top.js.OpenExtLink(window,event,this)" href="http://fanfou.com/zongzi" target="_blank">
 http://fanfou.com/zongzi</a> </span><br>_______________________________________________<br>China-pm mailing list<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="mailto:China-pm@pm.org">China-pm@pm.org</a>
<br><a onclick="return top.js.OpenExtLink(window,event,this)" href="http://mail.pm.org/mailman/listinfo/china-pm" target="_blank">http://mail.pm.org/mailman/listinfo/china-pm</a><br></blockquote></div><br><br clear="all">
<br>-- <br>真理使你自由