大家好。<br><br>有个HTML::DOM, HTML::TreeBuilder问题,一直没有很好的解决。<br><br>就是当 &amp;nbsp, &amp;gt, &amp;lt; 等字符出现在HTML内容里时,HTML::DOM模块似乎并不能很好的解析,比如:&lt;p&gt;hello, &amp;nbsp; &amp;gt; world!&lt;/p&gt;出现时. 用HTML::DOM::as_text打印出来的p的文本里&#39;&amp;&#39;符号被(encoding/decoding?)处理成乱码了。<br>
<br>如何处理这种情况呢?<br><br>当然,可以在parse之前就先把$content =~ s,\&amp;nbsp;, ,g 来处理。但是我想知道DOM::HTML就无法解决这个问题吗?<br><br>谢谢!<br><br>rorot <br>