Экономика символического обмена - Александр Долгин
Шрифт:
Интервал:
Закладка:
1.3.2.6. Кто кого фильтрует?
По мере того как число участников коллаборативной фильтрации растет, нарастают проблемы обработки данных. При нескольких миллионах пользователей ограничения скорости операций становятся ощутимыми. Поэтому, когда рекомендательный сервис используют в качестве придатка к торговым системам, фильтрацию по типу «потребитель-потребитель» заменяют цепочкой «объект-объект» (см. рисунок). Этот принцип экономичнее, в частности из-за отсутствия необходимости часто пересчитывать взаимосвязи между клиентами[141]. В этот момент и закладываются предпосылки для незаметной переориентации метода с нужд потребителей на интересы продавцов.
В основе пообъектной фильтрации – фиксация всех оценок, выставленных пользователями системы различным объектам (это могут быть товары, услуги, учреждения и т. д.), и анализ сходства между объектами, что не совсем то же самое, что сходство между людьми. Например, берется конкретный продукт – книга – и выявляются все прочие книги, получившие от различных потребителей сходную оценку. Хотя с точки зрения математики подсчеты «объект-объект» вроде идентичны данным, полученным из оценок потребителей, но во втором случае отбираются продукты, нужные людям, а в первом – люди, «нужные» для продвижения продуктов. В объектной фильтрации сходство между товарами устанавливается по профилю оценок потребителей, а в «человеческой» версии – по ряду персонально выделенных и значимых параметров. Разница именно в том, что в коллаборативной фильтрации с непосредственным участием потребителей те сами расставляют акценты, а пообъектная схема обходится без этого. Методы были бы идентичны, если бы в поклиентской версии фильтрации учитывались все оценки всех покупок, совершаемых потребителями.
Пренебрегать прямо высказанными оценками – это все равно что судить о совпадении вкусов людей по их знакомству с блокбастерами. К тому же очевидно, что факт потребления чего-либо далеко не всегда равнозначен удовлетворению. Существует зазор между интересом к продукту и его итоговой оценкой. Неспроста модераторы Ringo не ограничивались часто ранжируемыми артистами, а оставляли место для индивидуальных предпочтений. Расхождение между оплатой и удовлетворением особенно существенно тогда, когда нет повторного потребления, и накопления информации (позитивной или негативной) от предыдущих покупок не происходит. Именно поэтому культурная продукция, потребляемая однократно, оказывается в числе наиболее проблемных случаев для пообъектной фильтрации. Здесь между интересом, ожиданиями и конечными впечатлениями может пролегать пропасть. В предметной сфере ситуация менее острая.
В потребительской версии люди сигнализируют о своих итоговых эмоциях и впечатлениях, а в пообъектной – товары указывают на свою способность притягивать внимание людей, что, очевидно, заслуга не только их качества, но еще и рекламы и цены[142]. Таким образом, люди дают экспертную оценку товаров с большей пользой для себя. В особенности если учитывать, что их вовлеченность в процесс сама по себе позитивна. В областях, где люди потребляют приблизительно одинаковый ассортимент, например одни и те же автомобили или стиральные порошки, совпадение списка покупок не выявляет различий во вкусе. Другое дело, что оно указывает на схожесть статусов, и в этом смысле пообъектная фильтрация оказывается информативной. В то же время очевидно, что она скорее подогревает стремление к подражанию, чем к отличиям, и это на руку бизнесу.
Как отмечалось, анализ сходства в рамках объектной фильтрации не нужно делать каждый раз, что обеспечивает скорость ответа на запрос. Именно это и требуется Amazon и прочим торговцам для того, чтобы успеть напичкать клиентов рекомендациями, пока они пребывают в покупательском настроении. Люди ведут поиски и покупки в интернете, оставляя на различных сайтах следы своего присутствия, а на них попутно сыплется информация то ли рекомендательного, то ли рекламного свойства. Простые клики на веб-страницы засчитываются системой как акты потребительского ранжирования. Но остановка внимания на некоем предложении, а может быть просто пауза по сторонним причинам – не такой уж точный показатель заинтересованности человека в данной вещи. К тому же, далеко не все покупки совершаются в интернете, поэтому выборка покупательских предпочтений, сделанная только на основе этих данных, не вполне репрезентативна. Коллаборативная фильтрация с непосредственным участием потребителя пусть медленнее, но вернее служит его интересам.
1.3.2.7. Бизнес-версия коллаборативной фильтрации, или зачем поступаться принципами?
Рекомендательная система, интегрированная с процессом продаж так, чтобы подсовывать товары в то время, когда что-то приобретается или ищется, ориентирована на интересы бизнеса. Она не требует активности со стороны пользователя. Все, что от него нужно – это вступить на торговую площадь. Тут его и берут в оборот. Это соображение – ковать железо, пока горячо – стало решающим в эволюции коллаборативной фильтрации. Держать оценки наготове и быстро выдавать их, как того требуют интересы бизнеса, никого ни о чем не спрашивая, – данная логика подвела к скрытому этическому компромиссу. Как только решили не беспокоить клиента по таким пустякам, как его мнение о качестве, дело все больше стало клониться к программированию поведения.
Если для обычных товаров пообъектная фильтрация в ряде случаев дает искомый результат, то с навигацией в культурном предложении все обстоит хуже. Хотя справедливости ради надо отметить, что музыка в ряду культурных благ стоит особняком. Поскольку к хорошим мелодиям люди могут возвращаться неоднократно, потребительские оценки с успехом заменяет подсчет числа прослушиваний той или иной песни. Это тот редкий случай, когда неявные предпочтения адекватно репрезентируют явные. На этом основаны музыкальные сервисы Audioscrobbler (ныне Last.Fm), Launchcast Radio и др.[143] На компьютер, на котором прослушивается музыка, закачивается специальный программный модуль. Больше от пользователя ничего не требуется[144]: его не беспокоят просьбами ранжировать музыкальные композиции, не задают вопросов о настроении и т. д. Модуль отслеживает музыку, которую проигрывает человек, и передает информацию на сервер. Он также создает персональные веб-страницы пользователей сервиса, на которых демонстрируются списки прослушанного. Предполагается, что после того как прозвучало более половины песни, ее смело можно причислять к понравившимся и вносить в профиль. И все же в такой методике есть скрытые ограничения. На сервер поступает информация только о той музыке, которая звучит на компьютере, т. е. в определенной обстановке, в частности в офисе. Очевидно, в этих условиях включишь не всякую музыку, а например фоновую. В автомобиле будут слушать другие мелодии, на Hi-End аппаратуре – третьи. Так что автоматически формируемый потребительский профиль неизбежно получается деформированным.