Главная » Статьи » Справочный материал » Публикации в прессе

Приемы поиска в системе «Яндекс»

Приемы поиска в системе «Яндекс»

(Симонович С.В., Мураховский В.И. Интернет у Вас дома: Полное руководство начинающего пользователя)

Прежде чем приступать к описанию языка запросов системы Яндекс, отметим, что он заметно мощнее и ложнее языков запросов других отечественных поисковых систем. Впрочем, не надо пугаться. Даже если вы очень не любите читать и, тем более, изучать Инструкции, можете работать с системой интуитивно. Например, введите запрос обычными человеческими словами: Как приготовить пельмени?

В принципе, система Яндекс использует в работе эвристические алгоритмы, которые не совсем строги с математической точки зрения. В результате мы можем получить разные результаты, если будем искать документы со словами Буш Гор выборы и выборы Буш Гор. Зато благодаря этим алгоритмам интуитивный подход к созданию запросов (без чтения инструкций) дает очень Хороший результат, к тому же за очень краткое время.

Поиск по одному слову. Введите искомое слово в поле поиска и нажмите кнопку Найти. Слова разыскиваются с учетом всех возможных словоформ, что особенно важно для русского языка. Например, если введено слово снег, то будут найдены документы, в состав которых входят слова снега, снегов и т. п., снежный, заснеженный и т. п. Если же поиск словоформ не требуется, то его можно отменить с помощью восклицательного знака например !снегом.

Поиск по группе слов. Если слова разделены пробелом, то разыскиваются документы, в которых в одном предложении ветре я все введенные слова. Так, по запросу Буш Гор выборы система выдает документы с фразами типа ... Накануне выборов хакеры взломали сайты Буша и Гора. Среди результатов такого поиска возможны нестрогие соответствия — поисковая система проявляет свой интеллект. Чтобы строго обеспечить появление слов в предложении, надо перед ними поставить знак +, например так: +Буш +Гор +выборы. Знак + должен записываться слитно с тем словом, к которому относится (без пробела). Про т роль оператора И, который также можно ввести явно(символ &), например так: +Буш & +Гор & +выборы. Справа и слева от логического оператора должны быть пробелы.

Если же требуется одновременное присутствие слов не только в предложении, но и во всем документе, применяется оператор &&, например: +Буш &&+Гор &&+выборы.

Теперь рассмотрим приемы исключения слов из поиска. для этого применяются: знак - (строгое исключение из предложения), знак ~ (нестрогое исключение из предложения) и знак ~~  (исключение из всего документа). Так, например, запрос +Буш +Гор~~выборы позволит отобрать документы, в которых в одном предложении встречаются слова Буш и Гор, но во всем документе нет слова выборы и его производных (выбор, на выборах, после, выборов и т. п.).

В тех случаях, когда надо объединить ключевые слова с помощью оператора ИЛИ, используется символ | (вертикальная черта). Так, например, запрос Буш | Гор && +выборы отберет документы, в которых упоминается либо Джордж Буш , либо Альберт Гор, но обязательно встречается слово выборы.

Поиск с указанием расстояния. Давным-давно в поисковых системах появился оператор NEAR позволяющий находить документы, в которых два слова расположены близко друг к другу. Правда, что такое близко каждая система понимает по-разному. В поисковой системе Яндекс можно конкретно указать, на каком расстоянии друг от друга эти слова должны находиться.

Представьте себе, что в документе у каждого слова есть свой номер позиции. Номера позиций двух соседних слов различаются на единицу (номер позиции слова, находящегося справа, больше). Оператор расстояния записывается как /+n, где n — число, соответствующее расстоянию. Например, оператор /+1 соответствует двум словам, идущим подряд, то есть Microsoft/+1 Windows — это то же самое, что и " Microsoft Windows”.

Оператор расстояния может иметь и отрицательное значение. Это означает, что второе слово, указанное в запросе, должно в документе располагаться раньше первого. Например запрос Microsoft/-5 Windows может дать ссылку на документ, содержащий фразу Об операционных системах, которые заменят Windows, рассказал ответственный представитель компании Microsoft.

При проведении поиска с указанием расстояния можно задавать не точное расстояние между словами, а диапазон, например /(—5 +5). В этом случае будут отобраны документы, в которых. слова, указанные в запросе в качестве ключевых, попадают в заданный диапазон. На самом деле, если знак параметра не указан, то это тоже поиск в диапазоне. Так, оператор /5 надо рассматривать на самом деле как диапазон /(-5+5). Запрос Буш/5 Гор разыщет предложения типа: Женщины симпатизировали Бушу, а мужчины — Гору или Гор Буша не слаще.

Система .Якдекс имеет довольно сложные правила языка запросов, но у нее обширные возможности. К примеру, расстояние можно измерять не только между словаки, но и между предложениями. Эта единица измерения используется, когда в запросе применен двойной знак &&  или ~~  Так, запрос Буш/ +1 &&. Гор выдаст документы, в которых слова Буш и Гор встречаются либо в одном предложении, либо в соседних.

Использование скобок. Задание на поиск — это, по сути дела, логическое выражение, которое работает как фильтр при просмотре документов, входящих в базу данных поисковой системы. В логическом выражении точно так же, как и в арифметическом, можно применять круглые скобки. Они служат для управления порядком действий. Характерный пример: Буш & (вы6оры ׀ голосование). Такой запрос вернет ссылки на

Web-страницы, содержащие предложения, в составе которых слова Буш, Гор, выборы или Буш, Гор, голосование.

Управление ранжированием. Цель ранжирования — сделать чтобы Web-страницы‚ наиболее оптимально соответствующие запросу, отображались в списке результатов как можно раньше. Какие алгоритмы при ранжировании применяет поисковая система, это ее дело. Мы либо довольны их работой, либо обращаемся к другой поисковой системе В системе Якдекс есть возможность самостоятельно изменить алгоритм механизма ранжирования с помощью весовых коэффициентов. Такой коэффициент можно присвоить любому ключевому слову или выражению, если оно заключено в скобки. Весовые коэффициенты вводятся через двоеточие, например Буш:5 Гор выборы. При таком запросе документы, в которых слово Буш встречается чаще, получают преимущество и отображаются в результирующем списке на более высоких позициях.

Еще один прием управления ранжированием связан с уточняющим словом. Это такое слово, которое не обязательно содержаться в отбираемых документах, но если оно там есть, то документ получает преимущество при ранжировании. Уточняющее слово вводится после знаков <—. Например, при поиске по ключевым словам Гор Буш <—младший выборы получат преимущество Web-страницы, в которых речь идет не просто о Джордже Буше, а о дДордже Буше-младшем.

Специальный поиск. Особняком стоят приемы поиска информации, содержащейся в специальных полях заголовков ‚ страниц (каждая Web-страницы имеет служебные поля в своем заголовке) или поиск специальных элементов, входящих в Web-страницы, например гиперссылок. В системе Яндекс команды специального поиска в полях заголовка начинаются с символа $, а команды поиска отдельных элементов Web-страниц — со знака  Все средства специального поиска работают заметно медленнее по сравнению с обычными. Поэтому набе ритесь терпения.

Команда

Описание

Пример

Пояснение

$title

(выражение)

 

Поиск ключевых слов, указанных в выражении выполняется только в заголовках Web-страниц

$title (Космос)

Разыскиваются только Web -страницы, в заголовках которых имеется слово Космос

$аnсhог

Поиск ключевых слов, указанных в выражении, выполняется только в якорях внутренних ссылок Wеb-страниц

$аnсhог

(вступление)

Внутренние (выражение) гиперссылки (ссылки внутри документа) используют для создания внутренней структуры документа (аналог содержания). Эта команда разыщет 1еЬ-страницы, в которых имеется якорь «Вступление»

#kеуwords

=(выражение)

 

Поиск среди ключевых слов, заданных автором Wеb-страницы

#kеуwords

= (новости)

Автор Wеb-страницы может сам задать ключевые слова, описывающиеего материал. При просмотре в броузере мы их не видим, но они учитываются поисковыми системами при индексации

#abstract

=(выражение)

 

Поиск в аннотации Wеb-страницы

#abstract

=(Буш ׀ Гор)

Автор Wеb-страницы может дать ей краткую аннотацию, которая на экране не отображается, но учитывается поисковыми системами при индексации и представлении -

#image

"имя файла”

Поиск файлов иллюстраций по их имени

#image=

"Bush.*”

Если заранее неизвестно, какое расширение может иметь имя файла, при меня ют подстановочный символ <*», который замещает любое количество произвольных символов

#hint=

(выражение)

 

Поиск слов в альтернативном тексте иллюстраций

#hint=

(Буш ׀ Гор)

Автор может связать с иллюстрацией текст называемый альтернативным. Он воспроизводится, если графика в броузере отключена или при наведении указателя мыши на рисунок. Считайте его подрисуночной подписью

#url=

"URL-адрес”

Поиск сайта или Wеb-страницы

#url=

"www.anysite.ru”

Обычно используется для локализации поиска. Например, чтобы ограничить круг поиска одним сайтом или, наоборот, исключить его из области поиска

#link=

”адрес”

Поиск Wеb-страниц, содержащих   " гиперссылки на заданный URL-адрес сайта или ‚ЧеЬ-страницы

#link=

"www.musite.ru”

Обычно используется "URL-адрес”  для выявления Wеb-страниц , на которых имеются гиперссылки, ведущие к собственной странице

 

Категория: Публикации в прессе | Добавил: trofusha (12.02.2011)
Просмотров: 1122 | Рейтинг: 5.0/1
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]