<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=UTF-8" http-equiv="Content-Type">
  <title></title>
</head>
<body bgcolor="#ffffff" text="#000000">
是不是跟gbk或者utf8有关?<br>
<br>
缘起和合 wrote:
<blockquote
 cite="mid41143d8f0704120302v1401be9bta51280b62b454db8@mail.gmail.com"
 type="cite">什么编辑器干的?确实很乱,用VIM吧<br>
  <br>
  <div><span class="gmail_quote">On 4/12/07, <b
 class="gmail_sendername">zongzi</b> &lt;<a
 href="mailto:honghunter@gmail.com">honghunter@gmail.com</a>&gt; wrote:</span>
  <blockquote class="gmail_quote"
 style="border-left: 1px solid rgb(204, 204, 204); margin: 0px 0px 0px 0.8ex; padding-left: 1ex;">为
了方便放在PDA上面看小说,我用wget把网页(是新浪读书频道)下载到本机,然后用perl去把其中的正文提取出来。<br>
    <br>
发现弄出来的txt文档中,有好多乱码(用记事本打开看的时候)。<br>
    <br>
请教大家怎么才能解决?
    <br>
    <br>
    <br>
附件是我的代码,写的非常乱。真是不好意思了。<br>
    <br>
--<br>
这是一个有钱人的世界,与我的世界截然不同!<br>
    <br>
_______________________________________________<br>
China-pm mailing list<br>
    <a href="mailto:China-pm@pm.org">China-pm@pm.org</a><br>
    <a href="http://mail.pm.org/mailman/listinfo/china-pm">http://mail.pm.org/mailman/listinfo/china-pm</a><br>
    <br>
  </blockquote>
  </div>
  <br>
  <br clear="all">
  <br>
-- <br>
------======Nerazzurri======------
  <pre wrap="">
<hr size="4" width="90%">
_______________________________________________
China-pm mailing list
<a class="moz-txt-link-abbreviated" href="mailto:China-pm@pm.org">China-pm@pm.org</a>
<a class="moz-txt-link-freetext" href="http://mail.pm.org/mailman/listinfo/china-pm">http://mail.pm.org/mailman/listinfo/china-pm</a></pre>
</blockquote>
</body>
</html>