Google, Bing &Yahoo! — индексация в режиме реального времени

PubSubHubbub

PubSubHubbub

PubSubHubbub

Google планирует внедрить новый метод, который будет автоматически индексировать результаты поиска и в режиме реального времени. Как сообщает Read Write Web, технология базируется на Real Time Protocol Syndication PubSubHubbub (PUSH).

Аналитик Дэнни Салливан видит в этом «новую главу» в развитии поисковых технологии и хороший шанс для Google. Поисковая система уже давно работает над возможностью отображения результатов поиска в режиме реального времени. Примером является индексация сообщения в Twitterе

Новая индексация по протоколу PUSH не имеет ничего общего со стандартным методом поиска Google, который осуществляет сканирование Веба через ссылки. PUSH основан на формате Atom.

Как и в FeedReader содержание передаётся в момент его публикации и только через концентратор, То есть отпадает необходимость в постоянном контакте между двумя серверами — не будет необходимости в постоянном заходе бота поисковой системы.

Веб-ресурсы будут делиться своим содержанием для индексирования Google, только тогда, когда в них появляется новое содержание.

Сканирование сайтов?

Сканирование сайтов не будет заменено, поскольку по-прежнему будет необходимо найти новый канал PuSH-Feeds, для того, что бы его интегрировать А уже потом, после интеграции, индекс будет автоматически обновляется, через PUSH — то есть новое содержание веб-ресурса добавляется автоматически.

Эта технология сможет помочь небольшим сайтам хранить их содержание в индексе Google всегда в актуальном состоянии. Ведь сайты небольшого объёма посещаются стандартным ботом поисковика как правило, примерно раз в неделю.

Спам-фильтр — это необходимость

Однако PUSH технология требует введение дополнительного спам-фильтра. Этот спам-фильтр необходим для контроля содержания сайтов, чтобы нежелательный контент не оказался непосредственно в индексе поисковика.

По словам разработчика Google, Бретта Слаткина (Brett Slatkin), протокол PUSH является открытой системой, которая будет доступна для всех. По его словам, он предлагает открыть её даже для конкурентов.

В этом видео. Google объясняет как работает PuSH :

Bing и Yahoo! в режиме реальном времени

Конкуренты Google также работают над технологиями индексирования Веба в режиме реальном времени. Как говорит Стив Балмер(Steve Ballmer)в интервью с Bing, он буквально влюбился в эту технологию: «I’ve fallen in love with our real-time search; there’s nothing better than our Bing Twitter search”»

Так по сообщению GigaOm, помимо показа сообщений в Twitter-е, Microsoft уже планирует индексацию Facebook в реальном времени

Yahoo! например считает, что эта технология даёт хороший шанс для быстрой индексации событий местного значения и эвентов. Компания работает над методами определения и инструментом, для релевантных сообщений в Twitter-е.

Так инструмент сравнивает слова и словосочетания в сообщениях и сравнивает даты, когда они были созданы.

Кроме того Yahoo рассматривает чрезмерное использования таких модных приёмов как Buzz-Words, Hash-Tags (хэш-теги ) и URL-ярлыки (короткие URL например в Твиттере)  как Real-Time-Spam — спам в режиме реального времени. :)