СЕТИ ЭВМ И ТЕХНОЛОГИИ РАСПРЕДЕЛЕННОЙ ОБРАБОТКИ ДАННЫХ. 

Язык поисковых запросов.

Язык поисковых запросов, это набор служебных команд - символов-операторов, дающих возможность детализировать запрос, посылаемый поисковой машине. В нём используются простейшие логические функции объединения или исключения слов из запроса. Следует упомянуть, что набор символов, используемых в языке запросов, отличается для разных поисковых машин, но имеется некий усреднённый набор, применяемый практически всеми поисковыми системами.

Самыми распространёнными среди большинства поисковых систем являются команды поиска по маске: символы – "*" или "?". Символ "?" в ключевом слове запроса заменяет один символ в слове. А символ "*" - последовательность символов. Например, если в слове запроса неизвестна точно одна из букв, вместо неё может быть подставлен символ "?". При вводе слова "велос?пед" , с подставленным символом "?", поисковая машина сама вставит недостающую букву "и", и выдаст результат, соответствующий запросу. Если необходимо найти производные от слова, то можно использовать символ "*". В этом случае поисковый сервер найдёт документы, содержащие все доступные формы слова. Например, введя слово "вода*", вы получите в результатах - "водный", "водяной", "водянистый" и т.д.

Символы "+" и "-" принудительно добавляют, или исключают из запроса какие-либо слова. Слово, перед которым ставится знак "+", должно обязательно присутствовать в результате запроса, а слово, перед которым ставится знак "-", должно обязательно отсутствовать. Например, если вы хотите найти в сети сотовый телефон с аксессуарами к нему, вы можете составить запрос таким образом: "сотовый телефон Samsung +аксессуары". Поисковая система будет при этом искать все документы, содержащие фразу "сотовый телефон Samsung" и также содержащие слово "аксессуары". Или, например, нужно найти информацию о сотовых телефонах Samsung, но исключить из результатов информацию о продажах, Интернет – магазинах. Тогда запрос может выглядеть таким образом: "сотовый телефон Samsung -Интернет-магазин -продажа -продам -цена".

В некоторых машинах эти операторы имеют другое написание. Например в Рамблере операторы "+" и "-" будут выглядеть соответственно так: "AND" и "NOT". Также оператор "AND" имеет сокращение "&".
Оператор "OR"(логическое ИЛИ) или его сокращение "|" позволяет искать хотя бы одно из слов ключевой фразы. Например, запрос "автомобиль OR Toyota", "автомобиль | Toyota" даст в результате хотя бы одно слово из сочетания. Хотя в этом случае, он естественно найдёт оба слова, так как выбран неудачный пример.

Аналогично символу "-", применяется и символ "~" – тильда, то есть исключает из результата слова, отмеченные этим знаком.

Следующий символ – "", двойные кавычки, используется для поиска фразы целиком Для того, чтобы специальные символы расценивались как обычные, фразу следует заключить в двойные кавычки.

Удвоение какого-либо символа применит действие не к одному предложению, а к целому документу. Например, фраза "сотовый телефон Samsung ~~цена ~~продажа ~~Интернет-магазин" Означает, что слова "цена, продажа, Интернет-магазин" должны отсутствовать в пределах всего документа, а не только в предложении.

Запрос: "сотовый телефон Samsung &&цена &&продажа &&Интернет-магазин" Указывает поисковой системе, что в выдачу необходимо включить все документы, в которых удастся найти эти слова, не зависимо от того, находятся ли они в одном предложении, или разбросаны по документу в произвольном порядке.

Символы-операторы можно комбинировать. Для этого применяются открывающая и закрывающая скобки. Например, "сотовый телефон &(Nokia | Samsung)" – означает, что документы должны содержать либо "сотовый телефон" и "Nokia", либо "сотовый телефон" и "Samsung".

В некоторых случаях комбинировать символы можно и без применения скобок. Например, "сотовые телефоны &Samsung &&аксессуары ~~кожаные чехлы" Означает, что необходимо найти "сотовые телефоны" и "Samsung" в пределах одного предложения, "аксессуары" во всём тексте, и чтобы фраза "кожаные чехлы" ни разу не встретилась во всём тексте.

Некоторые поисковые серверы используют кавычки как служебный символ, используемый для того, чтобы заключённую в них фразу искать только целиком.

Также нужно заметить, что разные поисковые машины по-разному относятся к регистру вводимых слов. Поэтому, чтобы избежать ошибок, лучше всего вводить слова запроса строчными буквами, а заглавный регистр использовать только для имён и разного рода названий, географических, например.

Кроме того, существует ещё ряд очень полезных служебных специфических символов, которые позволяют искать и получать важные данные. Вот такие операторы, например, применяются для поиска в Яндексе. Синтаксис может отличаться для разных машин, но в целом он является схожим.

Синтаксис Что означает оператор Пример запроса
$title (выражение) поиск в заголовке $title (CompTek)
$anchor (выражение) поиск в тексте ссылок $anchor (CompTek | Dialogic)
#keywords =(выражение) поиск в ключевых словах #keywords=(поисковая система)
#abstract =(выражение) поиск в описании #abstract=(искалка | поиск)
#image ="значение" поиск файла изображения #image="tort*"
#hint =(выражение) поиск в подписях к изображениям #hint=(lenin | ленин)
#url ="значение" поиск на заданном сайте (странице) #url="www.comptek.ru*"
#link ="значение" поиск ссылок на заданный URL #link="www.yandex.ru*"
#mime ="значение" поиск в документах данного (pdf или rtf) типа #mime="pdf"

Естественно всё вышеописанное приведено в общих чертах, и каждая машина имеет для уточнения поиска свой набор символов-операторов. И поэтому, практически в каждой поисковой системе имеется на этот счёт подробная справка.        

Проверьте усвоение  Предыдущий раздел  Следующий раздел  Оглавление

 

Hosted by uCoz