> А если загнать оба текста в индекс какой-нибудь искалки типа Lucene/Lucy и сравнить score по ключевым словам. Правда ключевые слова надо как-то вычленить еще. если имеется база "эталонов", то можно приделать байес. будет довольно хороший процент совпадений с категориями. причем можно постоянно базу "учить" и "отучивать"