Here are a couple more comments:<div><br></div><div><span class="Apple-style-span" style="font-family: arial, sans-serif; font-size: 13px; background-color: rgb(255, 255, 255); ">Errors are not a big deal.<div><br><div>We already deal with typos in names all the time.</div>
<div><br></div><div>To check, I think I would run twice, if they did not match significantly, run a third time.</div><div><div><br></div><div>The names are not sensitive.  The stranger would know that somewhere in the world a person lived named "Ruth Smith".  Not a big deal.  If at some time in the future someone decides that it is a big deal I will run a HIT for first name and at HIT for last name.</div>
<div><br></div><div>Anyone know the trick to embedding the image in the HIT?</div><div><br></div><div>From what I read I need to provide a url to the image, but I would rather have the image embedded in the request.  Seems easier to control security.</div>
</div></div><div><br></div></span><div><br><div class="gmail_quote">On Thu, Sep 15, 2011 at 4:01 PM, Michael Potter <span dir="ltr"><<a href="mailto:michael@potter.name">michael@potter.name</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
yes, we are using tesseract-3.00 for OCR of the computer printed text.<div><br></div><div>We are going to try to get the tesseract trained to do hand written block letters, but I am not holding out a lot of hope that it will work with.</div>

<div><br></div><div>I am researching the next best option which might be the mechanical turk.<div><div></div><div class="h5"><br><br><div class="gmail_quote">On Thu, Sep 15, 2011 at 3:26 PM, Joel Berger <span dir="ltr"><<a href="mailto:joel.a.berger@gmail.com" target="_blank">joel.a.berger@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Have you tried OCRing programmatically?<br>
<a href="http://search.cpan.org/search?mode=all&query=ocr" target="_blank">http://search.cpan.org/search?mode=all&query=ocr</a><br>
<br>
How have the results been? It seems that if you could eliminate the<br>
easy ones and perhaps only shift the problematic ones to mTurk that<br>
would be cheaper.<br>
<br>
Joel<br>
<div><div></div><div><br>
On Thu, Sep 15, 2011 at 10:18 AM, Michael Potter <<a href="mailto:michael@potter.name" target="_blank">michael@potter.name</a>> wrote:<br>
> Perl Crew,<br>
> I have been called upon to try to do "OCR" on handwriting.<br>
> In particular, I need to convert a hand written name to ascii.  I could<br>
> provide a small .tif with just the name in it.<br>
> It came to mind that this might be a good use of mechanical turk.<br>
> I am sending this to the perl list because I seem to recall some of the<br>
> Mongers have worked with mechanical turk.<br>
> Here are my specific questions:<br>
> 1) how long is typical turn around for a response?<br>
> 2) Is this a reasonable task for Mechanical Turk.<br>
> I looked at the amazon website for HITs similar to what I am trying to do.<br>
>  I did not find any, but I question my ability to search completely.  The<br>
> closest I found was business card transcription.<br>
> You comments welcome.<br>
> --<br>
> Michael Potter<br>
> Replatform Technologies, LLC<br>
> <a href="tel:%2B1%20770%20815%206142" value="+17708156142" target="_blank">+1 770 815 6142</a><br>
> <a href="mailto:michael@potter.name" target="_blank">michael@potter.name</a><br>
><br>
</div></div>> _______________________________________________<br>
> Chicago-talk mailing list<br>
> <a href="mailto:Chicago-talk@pm.org" target="_blank">Chicago-talk@pm.org</a><br>
> <a href="http://mail.pm.org/mailman/listinfo/chicago-talk" target="_blank">http://mail.pm.org/mailman/listinfo/chicago-talk</a><br>
><br>
_______________________________________________<br>
Chicago-talk mailing list<br>
<a href="mailto:Chicago-talk@pm.org" target="_blank">Chicago-talk@pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/chicago-talk" target="_blank">http://mail.pm.org/mailman/listinfo/chicago-talk</a><br>
</blockquote></div><br><br clear="all"><div><br></div></div></div>-- <br><div class="im">Michael Potter<br>Replatform Technologies, LLC<br><a href="tel:%2B1%20770%20815%206142" value="+17708156142" target="_blank">+1 770 815 6142</a><br>
<a href="mailto:michael@potter.name" target="_blank">michael@potter.name</a><br>
</div></div>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>Michael Potter<br>Replatform Technologies, LLC<br>+1 770 815 6142<br><a href="mailto:michael@potter.name" target="_blank">michael@potter.name</a><br>
</div></div>