[Moscow.pm] Offline #6

Монашёв Михаил postmaster на softsearch.ru
Пн Апр 28 01:43:21 PDT 2008


Здравствуйте, Вячеслав.

> Как один из разработчиков ППБ, могу вас заверить, что Антон тут ни при чем.
> Пруфлинки:
> http://style.emoolive.ru/~aaa/rss.xml
> http://style.emoolive.ru/~bbb/rss.xml
> http://style.emoolive.ru/~ccc/rss.xml

> И  вот  такие  потоки  у  них  остаются  на месте каждого удаленного
> дневника. Конечно, такое исправимо с помощью костылей разной степени
> надежности, но защититься от подобных ошибок навсегда нельзя.

А зачем тут костыли? Кто Вам сказал, что разные фиды не могут отдавать
одинаковое  содержимое?  Вот  например,  у  блога  могут  быть  фиды с
последними   комментами   всего   дневника   и  последними  комментами
определённого топика. И даже больше, коммент может попасть в фид всего
блог-хостинга. Везде один и тот же коммент будет показываться. Везде у
него  будет один и тот же url, как и в Вами приведённом случае. И даже
больше  -  у  них  будет  одинаковое содержимое и заголовок! Зачем эти
items считать разными и писать какие-то костыли?

Да и к чему этот рейтинг, если он на костылях и не показывает реальной
картины?

Или  взять  например blog.ru, у которого довольно значительный процент
содержимого  -  это  скаченные  с  других блог-хостингов фиды. Было бы
логично  определять  источник оригинального контента и не обрабатывать
ретранслируемые  фиды.  Это  конечно  сложнее  в  реализации, но вроде
искать нечёткие дубли Яндекс умел раньше.

>> Я не знаю почему так происходит, но в проекты Яндекса почему-то всегда
>> подмешивают ═ человеческий ═ фактор, ═ который ═ сводит ═ на ═нет ═все
>> мега-алгоритмы.

> Теории заговора - это, конечно, очень увлекательно, но реальность
> куда банальнее. Когда обрабатываешь много разных источников, не всем
> из которых можно доверять, трудно извлекать из них все полезное и
> одновременно защищаться от накруток, ошибок в rss, спама и прочего.
> Хотя мне кажется, у нас достаточно хорошо это получается :)

Со стороны кажется иначе... Я же не зря ссылки тут давал...

-- 
С уважением,
Монашёв Михаил, SoftSearch.ru
mailto:postmaster на softsearch.ru
ICQ# 166233339
http://michael.mindmix.ru/
Без бэкапа по жизни.



Подробная информация о списке рассылки Moscow-pm