Яндекс для всех - Абрамзон М. Г.
Шрифт:
Интервал:
Закладка:
…запрос продажа автомобилей Украина отличается от запроса продажа автомобили Украины. В первом запросе "точно найденным документом" будет считаться документ, в котором слова "продажа" и "автомобиль" находятся "рядом" (скажем, в одном предложении), а слово "Украина" — "далеко" (скажем, где угодно в документе). Во втором запросе точно найденным документом будет считаться только такой, в котором слова "автомобиль" и "Украина" находятся достаточно близко. Яндекс решает так, потому что фраза "автомобили Украины" синтаксически согласована. То есть, с точки зрения Яндекса, первый запрос нацелен на поиск украинских автомобильных дилеров, а второй — на поиск любых продавцов "Таврий".
Используя настройки расширенного поиска, вы тем самым ужесточаете требования к его результатам и ограничиваете "своеволие" поисковой машины. Незначительный, вроде бы, нюанс, но может существенно сказаться на полученных результатах.
Расположение слов на страницеПри обычном поиске заданные в запросе слова разыскиваются по всем элементам страницы (табл. 1.2). В данном контексте под элементами понимаются тело страницы, ее заголовок (тот текст, который виден в заголовке браузера), либо ссылки, ведущие со страницы. Вы можете ограничить ареал поиска, выбрав один из перечисленных элементов. И более того, вы можете ужесточить поиск среди ссылок, если в качестве дополнительного параметра укажете, на какой конкретно сайт должна вести ссылка. Это может пригодиться в том случае, если вы знаете сайт, информации на котором вы доверяете. И если в процессе поиска в тексте документа будут ссылки на информацию с этого сайта, вы заранее предполагаете, что сможете доверять и найденной информации.
Форма представления словаЕще один элемент настройки — выбор формы представления слова в документе (табл. 1.3). С его помощью можно либо искать слово во всех его морфологических формах, либо в строгом соответствии с написанием в запросе. Использование этого элемента идентично использованию восклицательного знака перед словом в тексте запроса.
Группа условий СтраницыА вот эта группа настроек предназначена для отбора соответствующих запросу страниц, но по параметрам, не имеющим отношения к словам. Отбор выполняется по иным требованиям и позволяет сократить количество подобранных ссылок до минимума.
Первое, что предлагается в качестве дополнительного ограничения, — язык документа (страницы). Хотя Яндекс проводит индексирование сайтов только русскоязычной части Интернета, здесь также могут встречаться сайты и документы на разных языках. По умолчанию для поиска язык сайта или документа не важен (например, слово computer может встречаться как в текстах на русском, так и в текстах на английском языке). Если же вас интересуют тексты (страницы сайта, документы) только на определенном языке или группе языков, используйте опцию выбора языка. Можно выбрать определенный язык, а можно, используя клавиши <Shift> или <Ctrl>, выбрать несколько.
Во многих случаях важно не только наличие страницы или документа, но и дата их создания. К примеру, вы ищете новую информацию об Испании, куда хотели бы поехать в отпуск. Вам нужны публикации за последний месяц. Используя второй элемент настройки — дата, установите необходимый период. Это могут быть последние две недели, месяц, три месяца или год. Впрочем, совершенно не обязательно использовать эти предварительные настройки — вы можете установить и собственный период для отбора.
К сожалению, необходимо отметить, что отбор документов по времени работает плохо. И связано это не с особенностями поисковой машины. Отнюдь. Яндекс прекрасно понимает дату создания документа, получая ее из его свойств, и дату публикации или изменения страницы на сайте. Беда в другом. Далеко не все серверы выдают правильную дату документа или страницы. Это первое. А второе заключается в том, что на обновленной странице, где размещаются тексты, новости, объявления, дата самого текста может быть очень давней, а дата публикации страницы из-за публикации новостей, новой. Поэтому я бы не очень доверял использованию данной настройки.
Впрочем, этой настройке в большей степени можно доверять в том случае, когда вы ищете только документы, исключая поиск страниц. Яндекс понимает документы, созданные в нескольких форматах: HTML, PDF (Adobe Acrobat Reader), RTF, DOC (Microsoft Word), PPT (PowerPoint), SWF (Macromedia Flash). Если вас интересует несколько определенных форматов, удерживая клавишу <Shift> или <Ctrl>, выберите нужные.
Неплохая возможность есть для тех, кто разместил в Интернете свой сайт или публикацию. С помощью поля содержат ссылку можно указать сетевой адрес сайта или статьи. Результатом будет список страниц и документов, в которых, помимо ключевых слов, будет и указанная ссылка. Результаты поиска помогут увидеть заинтересованность в материалах вашего сайта или публикации. Но не надо думать, что все заинтересованные посетители будут ставить на вас ссылки. Поэтому к итогам надо относиться очень аккуратно и доверять им только как к определенному показателю, не более того.
Вы можете еще более ограничить область поиска, если укажете перечень сайтов, на которых нужно будет искать информацию. Заполните поле находятся на сайте перечнем сайтов (через запятую), и Яндекс будет проводить поиск только по их материалам. Эту особенность можно использовать и в том случае, если вам известен интересный сайт с полезной информацией, но не имеющий функции поиска. Введите в поле находятся на сайте его адрес, и Яндекс выдаст результаты по одному сайту. Не следует забывать, что владельцы сайта могли поставить запрет на индексирование определенных страниц или разделов сайта, поэтому в результатах могут быть приведены далеко не все страницы, содержащие разыскиваемую информацию.
ПримечаниеВ документации к разделу расширенный поиск говорится о том, что должно быть еще одно поле — не находятся на сайте. Служит оно для противоположной цели — исключить из результатов поиска один или несколько сайтов. Но на странице расширенного поиска это поле отсутствует.
Поиск "по образцу" заключается в том, что вы вносите в поле похожи на страницу адрес документа, для которого хотели бы найти подобные материалы. В результате вы получите список страниц и документов, содержащих искомые слова и подобные предложенному вами образцу. По своему действию эта настройка подобна ссылке Похожие документы в результатах поиска.
И еще одно ограничение, которое вы можете наложить на выдачу результатов поиска. Заключается оно в том — на сайтах какого региона требуется искать результаты. Для этого введите в поле регион название города, области, государства. В результатах вашего запроса будут ссылки на документы и сайты, находящиеся в этом регионе. Но не все так однозначно. Будут пропущены сайты, владельцами которых являются организации или жители данного региона, но реально размещенные на хостингах, находящихся далеко за его пределами. Примеров таких множество. И наоборот. В результаты попадут сайты, совершенно не связанные с нужным регионом, но находящиеся на площадках компаний, предоставляющих услуги хостинга в нужном вам регионе.
По мере формирования условий поиска, выбранные назначения отображаются в нижней части страницы в поле после слова Итого. Те параметры, которые не изменялись, в итоговое выражение не включаются.
Итак, подведем небольшие итоги. С помощью расширенного поиска вы можете наложить ограничение на взаимное расположение слов в документе, их нахождение в отдельных его элементах, ограничить используемый язык документа, время создания или изменения, тип, регион и диапазон просматриваемых сайтов. Чем точнее вы сможете наложить ограничения, тем меньше и точнее будет сформированный результат поиска. Да, времени на подготовку запроса уйдет заведомо больше, чем при обычном запросе. Зато время на просмотр результатов существенно сократится.