<br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d"><br>
</div>А зачем тут костыли? Кто Вам сказал, что разные фиды не могут отдавать<br>
одинаковое содержимое? Вот например, у блога могут быть фиды с<br>
последними комментами всего дневника и последними комментами<br>
определённого топика. И даже больше, коммент может попасть в фид всего<br>
блог-хостинга. Везде один и тот же коммент будет показываться. Везде у<br>
него будет один и тот же url, как и в Вами приведённом случае. И даже<br>
больше - у них будет одинаковое содержимое и заголовок! Зачем эти<br>
items считать разными и писать какие-то костыли?</blockquote><div><br>Ага.<br>Все верно, схлопывание уникальных url-ов с одного хоста - самое простое решение, и мы его наверняка в ближайшее время сделаем, если еще не.<br>
Отсеивать одинаковые записи по заголовку или содержимому тоже можно было бы, но в таком случае общее число записей неизбежно будет примерным (оно и сейчас примерное, конечно, но мне кажется, разница есть).<br><br>Да, и как Вы правильно заметили, ничего не мешает блогохостингу по ошибке положить все комменты в общий rss. Или добавить к нам фиды с комментами, по одному на каждый фид.<br>
А общепринятого API для обозначения комметнтов, насколько мне известно, не существует. И если бы и был - нет никакой гарантии, что блогохостинг его правильно реализует :)<br>В общем, это наша вечная головная боль, слишком долго (и не всегда совместимо с NDA) рассказывать детали. Как-то боремся.<br>
</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
Да и к чему этот рейтинг, если он на костылях и не показывает реальной<br>
картины?</blockquote><div> </div><div>Ага, это ключевой вопрос: "достаточно ли точен рейтинг, чтобы его показывать?"<br>Ответ тут может быть только субъективным. На мой взгляд - достаточно. Хотя и есть над чем поработать, конечно.<br>
</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
Или взять например <a href="http://blog.ru" target="_blank">blog.ru</a>, у которого довольно значительный процент<br>
содержимого - это скаченные с других блог-хостингов фиды. Было бы<br>
логично определять источник оригинального контента и не обрабатывать<br>
ретранслируемые фиды. Это конечно сложнее в реализации, но вроде<br>
искать нечёткие дубли Яндекс умел раньше.</blockquote><div><br>1) Какие-то продвижения в этом направлении у нас есть;<br>2) полное решение этой проблемы без того, чтобы заставить такие блогохостинги использовать общее API для трансляций (которого к тому же не существует), может быть построено только на эвристиках (во, надо было это слово использовать вместо "костыль" :) ), которые бы тоже иногда промахивались;<br>
3) (мечты) вот бы все блогохостинги были вежливыми и клали бы оригинальный линк в <link> или хотя бы в <origLink>, как feedburner. Эх...<br> <br>
</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d"><br>
>> Я не знаю почему так происходит, но в проекты Яндекса почему-то всегда<br>
>> подмешивают ═ человеческий ═ фактор, ═ который ═ сводит ═ на ═нет ═все<br>
>> мега-алгоритмы.<br>
<br>
> Теории заговора - это, конечно, очень увлекательно, но реальность<br>
> куда банальнее. Когда обрабатываешь много разных источников, не всем<br>
> из которых можно доверять, трудно извлекать из них все полезное и<br>
> одновременно защищаться от накруток, ошибок в rss, спама и прочего.<br>
> Хотя мне кажется, у нас достаточно хорошо это получается :)<br>
<br>
</div>Со стороны кажется иначе... Я же не зря ссылки тут давал...</blockquote><div><br>Вы давали две ссылки, на roem и на жалобы на Директ.<br>На Роем'е в первых же комментариях столько паранои, что у меня просто воли не хватило до конца дочитать.<br>
Спорить со сторонниками теории заговора бесполезно, к сожалению.<br><br>[дальше рассуждения на тему, а не личное оскорбление :) ]<br><br>Я знаю три лекарства от подобной паранои:<br>1) устроиться работать в ППБ;<br>2) "Маятник Фуко" Умберто Эко может помочь;<br>
3) развивать здравый смысл и не увлекаться поиском совпадений и ассоциаций другими способами :)<br><br>А вот умозрительного аргумента, который бы можно было привести в подобной переписке, я не знаю.<br><br>PS. Ну а Директ просто не в моей компетенции.<br>
<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<font color="#888888"><br>
--<br>
С уважением,<br>
Монашёв Михаил, SoftSearch.ru<br>
</font><div><div></div><div class="Wj3C7c">mailto:<a href="mailto:postmaster@softsearch.ru">postmaster@softsearch.ru</a><br>
ICQ# 166233339<br>
<a href="http://michael.mindmix.ru/" target="_blank">http://michael.mindmix.ru/</a><br>
Без бэкапа по жизни.<br>
<br>
--<br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/moscow-pm" target="_blank">http://mail.pm.org/mailman/listinfo/moscow-pm</a></div></div></blockquote></div><br>