Thanks Doug.  I'm not sure how that's different than what I'm doing?<div><br></div><div>In that I want to actually change the contents within the HTML::TreeObject, and not just decode (or regex) the output of $cell->as_HTML.</div>

<div><br></div><div>Maybe I missed something</div><div><br></div><div>Thanks</div><div>Jay<br><br><div class="gmail_quote">On Fri, Sep 28, 2012 at 9:53 AM, Doug Bell <span dir="ltr"><<a href="mailto:madcityzen@gmail.com" target="_blank">madcityzen@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im"><br>
On Sep 28, 2012, at 9:41 AM, Jay Strauss <<a href="mailto:me@heyjay.com">me@heyjay.com</a>> wrote:<br>
<br>
> Hi,<br>
><br>
> I'm scraping a web page (code below) using HTML::TreeBuilder.  I'm trying to get the info between the <td> </td>, but embedded in some of the values is a &rsquo;  like:<br>
><br>
> <td align="left" nowrap>Today&rsquo;s Volume</td><br>
><br>
> What I want to do is remove the "&rsquo;" or convert to a single quote, within the HTML::TreeBuilder object, figuring that's probably a more reliable approach.<br>
<br>
</div>That &foo; construct is an "HTML Entity", which the HTML::Entities module can decode for you, like:<br>
<br>
use HTML::Entities qw( decode_entities );<br>
print decode_entities( 'That&rsquo;s all folks!' );<br>
<br>
That entity is specifically a right-angled single quote, so if that exact character is not what you want, then you could use your regular expression to change it to a straight single quote (the ' character).<br>
<br>
Doug Bell<br>
<a href="mailto:madcityzen@gmail.com">madcityzen@gmail.com</a><br>
<br>
<br>
<br>
_______________________________________________<br>
Chicago-talk mailing list<br>
<a href="mailto:Chicago-talk@pm.org">Chicago-talk@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/chicago-talk" target="_blank">http://mail.pm.org/mailman/listinfo/chicago-talk</a><br>
</blockquote></div><br></div>