大家好。<br><br>有个HTML::DOM, HTML::TreeBuilder问题,一直没有很好的解决。<br><br>就是当 &nbsp, &gt, &lt; 等字符出现在HTML内容里时,HTML::DOM模块似乎并不能很好的解析,比如:<p>hello, &nbsp; &gt; world!</p>出现时. 用HTML::DOM::as_text打印出来的p的文本里'&'符号被(encoding/decoding?)处理成乱码了。<br>
<br>如何处理这种情况呢?<br><br>当然,可以在parse之前就先把$content =~ s,\&nbsp;, ,g 来处理。但是我想知道DOM::HTML就无法解决这个问题吗?<br><br>谢谢!<br><br>rorot <br>