<br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d"><br>
</div>А зачем тут костыли? Кто Вам сказал, что разные фиды не могут отдавать<br>
одинаковое &nbsp;содержимое? &nbsp;Вот &nbsp;например, &nbsp;у &nbsp;блога &nbsp;могут &nbsp;быть &nbsp;фиды с<br>
последними &nbsp; комментами &nbsp; всего &nbsp; дневника &nbsp; и &nbsp;последними &nbsp;комментами<br>
определённого топика. И даже больше, коммент может попасть в фид всего<br>
блог-хостинга. Везде один и тот же коммент будет показываться. Везде у<br>
него &nbsp;будет один и тот же url, как и в Вами приведённом случае. И даже<br>
больше &nbsp;- &nbsp;у &nbsp;них &nbsp;будет &nbsp;одинаковое содержимое и заголовок! Зачем эти<br>
items считать разными и писать какие-то костыли?</blockquote><div><br>Ага.<br>Все верно, схлопывание уникальных url-ов с одного хоста - самое простое решение, и мы его наверняка в ближайшее время сделаем, если еще не.<br>
Отсеивать одинаковые записи по заголовку или содержимому тоже можно было бы, но в таком случае общее число записей неизбежно будет примерным (оно и сейчас примерное, конечно, но мне кажется, разница есть).<br><br>Да, и как Вы правильно заметили, ничего не мешает блогохостингу по ошибке положить все комменты в общий rss. Или добавить к нам фиды с комментами, по одному на каждый фид.<br>
А общепринятого API для обозначения комметнтов, насколько мне известно, не существует. И если бы и был - нет никакой гарантии, что блогохостинг его правильно реализует :)<br>В общем, это наша вечная головная боль, слишком долго (и не всегда совместимо с NDA) рассказывать детали. Как-то боремся.<br>
&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
Да и к чему этот рейтинг, если он на костылях и не показывает реальной<br>
картины?</blockquote><div>&nbsp;</div><div>Ага, это ключевой вопрос: &quot;достаточно ли точен рейтинг, чтобы его показывать?&quot;<br>Ответ тут может быть только субъективным. На мой взгляд - достаточно. Хотя и есть над чем поработать, конечно.<br>
&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
Или &nbsp;взять &nbsp;например <a href="http://blog.ru" target="_blank">blog.ru</a>, у которого довольно значительный процент<br>
содержимого &nbsp;- &nbsp;это &nbsp;скаченные &nbsp;с &nbsp;других блог-хостингов фиды. Было бы<br>
логично &nbsp;определять &nbsp;источник оригинального контента и не обрабатывать<br>
ретранслируемые &nbsp;фиды. &nbsp;Это &nbsp;конечно &nbsp;сложнее &nbsp;в &nbsp;реализации, но вроде<br>
искать нечёткие дубли Яндекс умел раньше.</blockquote><div><br>1) Какие-то продвижения в этом направлении у нас есть;<br>2) полное решение этой проблемы без того, чтобы заставить такие блогохостинги использовать общее API для трансляций (которого к тому же не существует), может быть построено только на эвристиках (во, надо было это слово использовать вместо &quot;костыль&quot; :) ), которые бы тоже иногда промахивались;<br>
3) (мечты) вот бы все блогохостинги были вежливыми и клали бы оригинальный линк в &lt;link&gt; или хотя бы в &lt;origLink&gt;, как feedburner. Эх...<br>&nbsp;<br>
</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d"><br>
&gt;&gt; Я не знаю почему так происходит, но в проекты Яндекса почему-то всегда<br>
&gt;&gt; подмешивают ═ человеческий ═ фактор, ═ который ═ сводит ═ на ═нет ═все<br>
&gt;&gt; мега-алгоритмы.<br>
<br>
&gt; Теории заговора - это, конечно, очень увлекательно, но реальность<br>
&gt; куда банальнее. Когда обрабатываешь много разных источников, не всем<br>
&gt; из которых можно доверять, трудно извлекать из них все полезное и<br>
&gt; одновременно защищаться от накруток, ошибок в rss, спама и прочего.<br>
&gt; Хотя мне кажется, у нас достаточно хорошо это получается :)<br>
<br>
</div>Со стороны кажется иначе... Я же не зря ссылки тут давал...</blockquote><div><br>Вы давали две ссылки, на roem и на жалобы на Директ.<br>На Роем&#39;е в первых же комментариях столько паранои, что у меня просто воли не хватило до конца дочитать.<br>
Спорить со сторонниками теории заговора бесполезно, к сожалению.<br><br>[дальше рассуждения на тему, а не личное оскорбление :) ]<br><br>Я знаю три лекарства от подобной паранои:<br>1) устроиться работать в ППБ;<br>2) &quot;Маятник Фуко&quot; Умберто Эко может помочь;<br>
3) развивать здравый смысл и не увлекаться поиском совпадений и ассоциаций другими способами :)<br><br>А вот умозрительного аргумента, который бы можно было привести в подобной переписке, я не знаю.<br><br>PS. Ну а Директ просто не в моей компетенции.<br>
<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<font color="#888888"><br>
--<br>
С уважением,<br>
Монашёв Михаил, SoftSearch.ru<br>
</font><div><div></div><div class="Wj3C7c">mailto:<a href="mailto:postmaster@softsearch.ru">postmaster@softsearch.ru</a><br>
ICQ# 166233339<br>
<a href="http://michael.mindmix.ru/" target="_blank">http://michael.mindmix.ru/</a><br>
Без бэкапа по жизни.<br>
<br>
--<br>
Moscow.pm mailing list<br>
<a href="mailto:moscow-pm@pm.org">moscow-pm@pm.org</a> | <a href="http://moscow.pm.org" target="_blank">http://moscow.pm.org</a><br>
<a href="http://mail.pm.org/mailman/listinfo/moscow-pm" target="_blank">http://mail.pm.org/mailman/listinfo/moscow-pm</a></div></div></blockquote></div><br>