СЕТИ ЭВМ И ТЕХНОЛОГИИ РАСПРЕДЕЛЕННОЙ ОБРАБОТКИ ДАННЫХ.
Язык поисковых запросов.
Самыми распространёнными среди большинства поисковых систем являются команды поиска по маске: символы – "*" или "?". Символ "?" в ключевом слове запроса заменяет один символ в слове. А символ "*" - последовательность символов. Например, если в слове запроса неизвестна точно одна из букв, вместо неё может быть подставлен символ "?". При вводе слова "велос?пед" , с подставленным символом "?", поисковая машина сама вставит недостающую букву "и", и выдаст результат, соответствующий запросу. Если необходимо найти производные от слова, то можно использовать символ "*". В этом случае поисковый сервер найдёт документы, содержащие все доступные формы слова. Например, введя слово "вода*", вы получите в результатах - "водный", "водяной", "водянистый" и т.д.
Символы "+" и "-" принудительно добавляют, или исключают из запроса какие-либо слова. Слово, перед которым ставится знак "+", должно обязательно присутствовать в результате запроса, а слово, перед которым ставится знак "-", должно обязательно отсутствовать. Например, если вы хотите найти в сети сотовый телефон с аксессуарами к нему, вы можете составить запрос таким образом: "сотовый телефон Samsung +аксессуары". Поисковая система будет при этом искать все документы, содержащие фразу "сотовый телефон Samsung" и также содержащие слово "аксессуары". Или, например, нужно найти информацию о сотовых телефонах Samsung, но исключить из результатов информацию о продажах, Интернет – магазинах. Тогда запрос может выглядеть таким образом: "сотовый телефон Samsung -Интернет-магазин -продажа -продам -цена".
В некоторых машинах эти операторы имеют другое написание. Например в Рамблере
операторы "+" и "-" будут выглядеть
соответственно так: "AND" и "NOT". Также
оператор "AND" имеет сокращение "&".
Оператор "OR"(логическое ИЛИ) или его сокращение "|"
позволяет искать хотя бы одно из слов ключевой фразы. Например, запрос
"автомобиль OR Toyota", "автомобиль | Toyota" даст в
результате хотя бы одно слово из сочетания. Хотя в этом случае, он естественно
найдёт оба слова, так как выбран неудачный пример.
Аналогично символу "-", применяется и символ "~" – тильда, то есть исключает из результата слова, отмеченные этим знаком.
Следующий символ – "", двойные кавычки, используется для поиска фразы целиком Для того, чтобы специальные символы расценивались как обычные, фразу следует заключить в двойные кавычки.
Удвоение какого-либо символа применит действие не к одному предложению, а к целому документу. Например, фраза "сотовый телефон Samsung ~~цена ~~продажа ~~Интернет-магазин" Означает, что слова "цена, продажа, Интернет-магазин" должны отсутствовать в пределах всего документа, а не только в предложении.
Запрос: "сотовый телефон Samsung &&цена &&продажа &&Интернет-магазин" Указывает поисковой системе, что в выдачу необходимо включить все документы, в которых удастся найти эти слова, не зависимо от того, находятся ли они в одном предложении, или разбросаны по документу в произвольном порядке.
Символы-операторы можно комбинировать. Для этого применяются открывающая и закрывающая скобки. Например, "сотовый телефон &(Nokia | Samsung)" – означает, что документы должны содержать либо "сотовый телефон" и "Nokia", либо "сотовый телефон" и "Samsung".
В некоторых случаях комбинировать символы можно и без применения скобок. Например, "сотовые телефоны &Samsung &&аксессуары ~~кожаные чехлы" Означает, что необходимо найти "сотовые телефоны" и "Samsung" в пределах одного предложения, "аксессуары" во всём тексте, и чтобы фраза "кожаные чехлы" ни разу не встретилась во всём тексте.
Некоторые поисковые серверы используют кавычки как служебный символ, используемый для того, чтобы заключённую в них фразу искать только целиком.
Также нужно заметить, что разные поисковые машины по-разному относятся к регистру вводимых слов. Поэтому, чтобы избежать ошибок, лучше всего вводить слова запроса строчными буквами, а заглавный регистр использовать только для имён и разного рода названий, географических, например.
Кроме того, существует ещё ряд очень полезных служебных специфических символов, которые позволяют искать и получать важные данные. Вот такие операторы, например, применяются для поиска в Яндексе. Синтаксис может отличаться для разных машин, но в целом он является схожим.
Синтаксис | Что означает оператор | Пример запроса |
$title (выражение) | поиск в заголовке | $title (CompTek) |
$anchor (выражение) | поиск в тексте ссылок | $anchor (CompTek | Dialogic) |
#keywords =(выражение) | поиск в ключевых словах | #keywords=(поисковая система) |
#abstract =(выражение) | поиск в описании | #abstract=(искалка | поиск) |
#image ="значение" | поиск файла изображения | #image="tort*" |
#hint =(выражение) | поиск в подписях к изображениям | #hint=(lenin | ленин) |
#url ="значение" | поиск на заданном сайте (странице) | #url="www.comptek.ru*" |
#link ="значение" | поиск ссылок на заданный URL | #link="www.yandex.ru*" |
#mime ="значение" | поиск в документах данного (pdf или rtf) типа | #mime="pdf" |
Естественно всё вышеописанное приведено в общих чертах, и каждая машина имеет для уточнения поиска свой набор символов-операторов. И поэтому, практически в каждой поисковой системе имеется на этот счёт подробная справка.
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление