Категории
Самые читаемые
onlinekniga.com » Компьютеры и Интернет » Интернет » Яндекс для всех - Абрамзон М. Г.

Яндекс для всех - Абрамзон М. Г.

Читать онлайн Яндекс для всех - Абрамзон М. Г.

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 40 41 42 43 44 45 46 47 48 ... 117
Перейти на страницу:

Наконец, для ряда новостей может присутствовать еще одна ссылка — карта (рис. 3.4). Эта ссылка означает, что на карте отмечено место, где произошло данное событие. К примеру, когда в московском метро был открыт памятник бездомной собаке, место, где это произошло, было отмечено на карте Москвы, и его можно было посмотреть, перейдя по ссылке.

Страницы сюжетов

Если вас заинтересовала какая-либо новость, опубликованная на странице главного или тематического раздела, вы можете перейти на страницу сюжета, щелкнув на его названии.

На странице сюжета (рис. 3.5) представлены отобранные по содержательной близости новости различных источников, отсортированные в хронологическом порядке. Причем здесь подбираются не только текстовые сообщения, но также фотографии, аудио- и видеофайлы, входящие в сюжет. По умолчанию на странице сюжета показывается 30 заголовков, но под этим списком есть ссылка, по которой можно просмотреть все новости, включенные в сюжет, с их аннотациями.

Страница сюжета открывается, как правило, фотографией с места событий, а также более развернутой, чем на тематической странице, аннотацией. При этом аннотация может быть сборная, полученная из различных публикаций.

Следом приводится статистическая информация — сколько входит в этот сюжет сообщений, фотографий и других файлов, сколько высказано по этому поводу мнений в блогах. И не менее важная информация — какое информационное издание первым опубликовало эту новость (приводится название издания, дата и точное время публикации).

В конце списка новостей может присутствовать ссылка на другие сюжеты, связанные с данным. К примеру, с обсуждением установки памятника бездомной собаке Яндекс. Новости связали сюжет под названием "Суд рассмотрит дело охранника метро, убившего пса Рыжика". Поскольку все формирование раздела новостей происходит автоматически, остается лишь порадоваться такому точному определению тематически связанных сюжетов.

Если в новости упоминается географический адрес, связанный с событием, то в дополнение сюжет будет проиллюстрирован фрагментом карты города (пока поддерживается 10 городов, среди которых Москва, Киев, Екатеринбург, Самара). Как уже говорилось, в новости про памятник собаке упоминается станция метро, поэтому на странице сюжета приводится фрагмент карты Москвы (см. рис. 3.4) в районе упомянутой станции. Если вы захотите рассмотреть карту подробнее, то сможете сделать это с помощью одного щелчка, перейдя на большую карту в Яндекс. Картах.

Выделение адресов из контента проводится с помощью технологии извлечения данных, которая применяется и для выделения других важных компонентов сообщений (например, действующих лиц).

С технологической точки зрения интересной задачей оказалось определение города, к которому относится упомянутый в новости адрес. Дело в том, что авторы новостных сообщений достаточно редко пишут город непосредственно рядом с улицей, — говорит Лев Гершензон, ведущий разработчик компании "Яндекс". — Для решения этой задачи пришлось из каждого новостного сообщения выделять все названия населенных пунктов, а потом выбирать самое "релевантное" — в зависимости от количества вхождений в документ, от расположения в документе и т. п.

Очень часто в связи с тем или иным событием в онлайновых изданиях публикуются высказывания известных личностей. Наиболее интересные высказывания могут быть подобраны в специальный блок, который называется Сюжет в лицах. На странице сюжета в этом блоке представлены фамилии людей, выразивших свое отношение к обсуждаемому событию, либо тем или иным образом с ним связанные. Например, в сюжете, посвященном эмбарго на поставку мяса из Польши, в блоке Сюжет в лицах приведена фамилия Маркоса Киприану (рис. 3.6), специального уполномоченного по здравоохранению ЕС. Перейдя по ссылке с фамилии, попадаешь на страницу, посвященную этому человеку, где информация о нем представлена в виде четырех блоков:

□ кто такой Маркос Киприану (в данном случае ЕС Маркос);

Работа;

Что он говорит по поводу события;

Что о нем говорят по поводу события.

Примечание

Кстати, обратите внимание на то, что в данном случае обработка информации о человеке была выполнена некорректно. Вместо его имени была подставлена аббревиатура "ЕС", присутствующая в тексте рядом с фамилией человека, что и привело к возникновению ошибки. А вот его имя было, похоже, принято за что-то, имеющее отношение к Кипру.

3.1.4. Поиск по Новостям

Для пользователя поиск по новостям выглядит совершенно так же, как и обычный поиск по веб-страницам. То же самое поисковое выражение, которое надо ввести в строку поиска, те же дополнительные параметры, позволяющие составлять сложные поисковые выражения. Поиск по новостям можно выполнять с главной страницы Яндекса, выполнив вначале общий поиск, а затем перейдя на вкладку Новости (параллельный поиск), либо перейти в раздел Яндекс. Новости и поиск выполнить с его главной страницы.

Отличие результатов поиска по новостям от поиска по веб-страницам заключается в том, что при поиске новостей включаются дополнительные алгоритмы, формирующие сюжеты, их аннотирование и ранжирование. В результате, задавая вопрос в Яндекс. Новостях, вы получите не просто список сообщений, соответствующих вашему запросу и отсортированный по времени и релевантности. Результаты поиска будут сгруппированы по сюжетам, а ранжирование по релевантности будет выполнено согласно стандартным принципам ранжирования, принятым на Яндексе. Ранжирование основано на числе и ранге всех найденных новостей внутри новостных сюжетов, при этом ранг одной новости определяется как ее свежесть с учетом приоритетов строгого текстуального совпадения. В то же время оставлена возможность изменить сортировку по сюжетам на сортировку результатов поиска по времени.

Вы можете спросить, будут ли найдены и представлены новости, соответствующие запросу, но не попавшие в какой-либо сюжет? Будут. Такие новости считаются сюжетом из одного сообщения, к которому применяются все правила выдачи и ранжирования, как к любому иному сюжету.

Для каждого найденного сюжета приводится статистика включенных в него сообщений и ссылка для просмотра сюжета полностью. В отличие от представления сюжета на страницах новостных разделов, к найденному сюжету не добавляется информация о его обсуждении в форумах. Вместо этого предлагается ссылка для поиска по блогам по вашему поисковому выражению.

Расширенный поиск

Для поиска по новостям можно использовать дополнительные параметры, ужесточающие рамки поиска. Для этого надо со страницы Яндекс. Новости перейти на страницу расширенного поиска (не путайте его с расширенным поиском для поиска по веб-страницам).

Дополнительные ограничения для поиска распределены по четырем группам. В первой предлагается выбрать рубрику (или несколько рубрик), чьи новости вас интересуют. Вторая группа ограничений позволяет отобрать определенные СМИ, среди публикаций которых и будет выполняться поиск. Выборка производится из списка всех официальных партнеров Яндекса. Хотя список для удобства пользования рассортирован по алфавиту, непонятна система, по которой в этот список включаются издания, чьи названия начинаются с цифры (например, 3DNews). Хотя, если этим списком пользоваться постоянно, постепенно привыкаешь к тому, где искать те или иные издания.

Третье ограничение связано с выбором региона — поиск будет учитывать не только поисковое выражение, но и связь найденных новостей с выбранным регионом. Еще одно ограничение, которое вы можете наложить на поиск, позволяет определить период, за который вам нужно найти нужные новости. В качестве дополнительного параметра вы можете установить, сколько новостей будет показано на одной странице результатов поиска.

1 ... 40 41 42 43 44 45 46 47 48 ... 117
Перейти на страницу:
На этой странице вы можете бесплатно читать книгу Яндекс для всех - Абрамзон М. Г..
Комментарии