* На правах рекламы
Вот такое заумное название статьи я решил написать. Итак, 13 апреля Павел Браславский (Яндекс) выступил на профессиональной конференции «Российские Интернет Технологии РИТ++ /2010» с докладом «Как найти и использовать близкие запросы». Благодаря докладчику все присутствующие на конференции были ознакомлены с новым методом, делающим поиск более развернутым и качественным. Этот метод позволяет объединять частотные запросы в близкие пары.
В докладе было дано определение понятию «близкие запросы», показана их квалификация. Существуют близкие запросы, подкорректированные при помощи конкретизации запросов (обручальное кольцо — обручальное кольцо с бриллиантом); путем увеличения области поиска (золотое колье — драгоценности); использованием перевода (детский мир — world of children); сменой цели поиска (купить кольцо — ювелирные изделия). Есть также однотипные запросы (шевроле — мерседес).
Докладчик провёл тщательный анализ распределения ведущих позиций при поиске отдельными поисковыми системами. По сути сама идея — выделение близких запросов, с целью предложения пользователям востребованные связки и качественные переформулировки — уже раньше использовалась различными поисковыми машинами.
К примеру, в настоящее время Yahoo довольно широко использует это на практике. Как это происходит? Пользователь вводит свой запрос. Ему предлагают на выбор два варианта. Для тех, кто хочет более досконально углубиться в это, система предлагает использовать дополнительную панель для формулировки более хорошего запроса.
Довольно давно и достаточно серьёзно этим занимается и Ask. Метод связанных запросов используется также в Яндекс.Картинках, в Гугле. Докладчик делал упор на том, что сформулировать хороший запрос — это не просто. При этом это очень важный фактор более качественного и быстрого поиска. Часто конечная формулировка, которая помогает найти нужную информацию, сильно отличается от первоначального текста запроса.
Павел Браславский в своём выступлении показывает, где можно найти связанные вопросы, столь необходимые пользователям. Как вариант, нужно искать в логах запросов, т.е. там, где их много. Можно также просто формировать запросы по смыслу текста. Но это более ограниченный вариант работы.
Рассмотрим варианты установления семантической близости по логу запроса:
Выступающий также рассмотрел ряд требований к подсказкам в Яндексе. Перечислим их:
Яндекс выполняет это следующим образом. Первый шаг — это контроль чистоты лога, из которого убираются запросы, имеющие опечатки; из внутренней сети Яндекса. Чистка лога также включает в себя и устранение подсказок под строкой поиска в Яндексе. Второй шаг — выделение сессий. Как это происходит? Рассматриваются запросы одного пользователя. Те запросы, которые набирались с большой разницей во времени, будут относиться к разным сессиям. Третий шаг — выделение пар.
После всех этих шагов выявляется частота переходов между запросами, т.е строится матрица. Затем оцениваются эти переформулировки. Итог: применение семантически близких запросов качественно улучшает процесс поиска. Хотя в настоящее время это уже частично реализовано Яндексом, но, в целом, это пока ещё будущее процесса поиска информации.
Поблагодарим спонсора статьи — гиганта индустрии продажи онлайн фильмнов — партнерскую компанию Kinobrothers.com. Всегда высокий и стабильный конверт!
This website uses IntenseDebate comments, but they are not currently loaded because either your browser doesn't support JavaScript, or they didn't load fast enough.

=) нажала вроде на тему — "люди редиски"… Видать промахнулась. Читаю, ничего понять не могу… думаю — может обдурил кто вас на этом семенаре)
Ненене, про редисок соседний пост, но и этот довольно интересный))
Я тож с кинобразером сотрудничаю. Отличная пп, с которой можно хорошо заработать.
согласен)
Конверт растет к зиме, не забывайте об этом. Особенно фильмы…)
Кино — это вечная дойная корова. конверт на Кинобразе гуд!
/Грамотность. Не должно быть орфографических ошибок, опечатков/
Опечаток правильно