Категории
Самые читаемые
onlinekniga.com » Фантастика и фэнтези » Альтернативная история » Суперфрикономика - Стивен Левитт

Суперфрикономика - Стивен Левитт

Читать онлайн Суперфрикономика - Стивен Левитт

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 21 22 23 24 25 26 27 28 29 ... 65
Перейти на страницу:

Хорсли организовал команду аналитиков и специалистов по работе с клиентскими профилями. Команда создавала компьютерные программы, которые могли изучить всю базу данных клиентов и выявить случаи мошеннической деятельности. В команде работали хорошие программисты. Однако мошенники были не хуже: как только старые способы переставали работать, они моментально придумывали новые. Эти быстрые мутации привели к тому, что Хорсли научился думать как мошенник. Даже во сне он подсознательно перерабатывал миллиарды единиц банковской информации, выискивая последовательности действий, свидетельствовавшие о неправомерных операциях. Создаваемые им алгоритмы становились все жестче и точнее.

Нам посчастливилось встретиться с Ианом Хорсли в этот период, и вместе с ним мы задались вопросом: если разработанные им алгоритмы могут просеивать бесконечные потоки данных о банковских операциях и успешно выявлять действия мошенников, то можно ли разработать алгоритмы, позволяющие найти других плохих парней, например потенциальных террористов?

Наши предчувствия подкреплялись данными, полученными после атак 11 сентября. Анализ банковской информации девятнадцати террористов позволил выявить некоторые типичные действия, которые в совокупности отличали их от обычных клиентов банков.

— Они открывали счета в американских банках, внося сумму, эквивалентную примерно 4 тысячам долларов. Обычно счета открывались в отделениях больших и хорошо известных банков.

— В качестве адреса обычно использовался адрес «до востребования» в почтовом отделении, который часто менялся.

— Некоторые из них регулярно получали и отправляли переводы в другие страны, однако суммы переводов всегда были небольшими и не привлекали внимания контролирующих органов банка.

— Они были склонны создавать один крупный депозит и постепенно снимать с него небольшие суммы.

— Банковские счета обычно не использовались для покрытия нормальных бытовых расходов, таких как арендные платежи, коммунальные услуги, страхование и тому подобное.

— В операциях по зачислению и снятию средств не наблюдалось последовательности от месяца к месяцу.

— Они не пользовались сберегательными счетами или депозитными ящиками.

— Доля снятия денег наличными по отношению к выписываемым чекам была чрезвычайно высокой.

Разумеется, гораздо проще создать ретроактивный профиль банковской деятельности террориста, вина которого доказана, чем построить профиль, способный выявить террористов до того, как они начнут свою деятельность. И очевидно, что профиль девятнадцати террористов — иностранцев, живших на территории США и учившихся угонять самолеты, — не всегда соответствовал профилю британского террориста, родившегося и прожившего всю жизнь в Лондоне.

Более того, когда данные используются для оценки неправомерных действий в прошлом (в «Фрикономике» мы приводили примеры действий обманывающих учителей и сговоров между борцами сумо), обычно доля мошенников в общем числе подозреваемых является довольно высокой. Но в нашем случае общее число было гигантским (у одного только банка, где работал Хорсли, несколько миллионов клиентов), а число потенциальных террористов — крайне малым.

Однако давайте предположим, что нам удалось разработать алгоритм, точный на 99 процентов. Допустим, что в Великобритании имеется 500 террористов. Алгоритм позволит с высокой точностью выявить 495 из них, что и составляет 99 процентов. Однако в Великобритании проживает примерно 50 миллионов взрослых, не имеющих ничего общего с терроризмом, и этот алгоритм ошибочно отнесет к террористам 1 процент из них, то есть 500 тысяч человек. Иными словами, этот замечательный алгоритм, работающий с точностью 99 процентов, выдает слишком много положительных результатов — полмиллиона человек будут вполне справедливо возмущаться, если их обвинят в пособничестве террористам.

Кроме того, власти не смогут справиться с нагрузкой и проверить всех подозреваемых.

Подобная проблема существует и в области здравоохранения. Недавнее исследование в области онкологии показало, что у половины из 68 тысяч участников присутствовал хотя бы один положительный (и недостоверный) результат после прохождения 14 тестов38. Поэтому, несмотря на убедительность аргументов множества сторонников системы повсеместных и широкомасштабных исследований, в реальности такая система будет приводить к возникновению множества неточных положительных заключений, в то время как некоторые действительно больные люди будут упускаться из внимания. Бейсболист Майк Лоуэлл, недавний победитель World Series, упомянул сходную проблему, возникновение которой возможно при повсеместном тестировании игроков Высшей лиги на наличие у них гормона человеческого роста. «Если эта система точна на 99 процентов, то по итогам проверки команд появится не менее семи положительных тестов (не имеющих отношения к действительности), — говорит он. — Но что если такой неверный диагноз будет поставлен ведущему игроку, например Кэлу Рипкену? Что это, как не черная метка для его карьеры?»39

Аналогичным образом, если вы хотите поймать террористов, 99-процентная точность совершенно недостаточна.

Ранним утром 7 июля 2005 года четыре исламских террориста-смертника взорвали свои бомбы в Лондоне: один сделал это в переполненном пассажирами автобусе, а трое других — в метро. Погибло пятьдесят два человека. «Лично я был просто убит этими новостями, — вспоминает Хорсли. — В то время мы только начали работу по выявлению террористов, и я никак не мог отделаться от мысли о том, что, начав работу всего на пару лет раньше, мы могли бы предотвратить случившееся».

Смертники, взорвавшие себя в Лондоне, оставили после себя кое-какие банковские данные, но их было немного. Тем не менее в течение последовавших нескольких месяцев в рамках контртеррористических мероприятий было выявлено и арестовано множество подозрительных личностей. Стоит отметить, что никто из них в результате не оказался террористом; против большинства из них не были выдвинуты никакие обвинения40. Однако если они напоминали террористов настолько сильно, что их арестовывали, то, возможно, изучение их методов общения с банками могло бы помочь в создании практического алгоритма. К счастью, более сотни таких подозреваемых были клиентами банка Хорсли.

Процедура состояла из нескольких этапов. Для начала необходимо было собрать данные по этим ста подозреваемым и разработать некий алгоритм, основанный на признаках, по которым эти люди отличались от сообщества в целом. После надлежащей настройки этого алгоритма он мог быть использован для детального поиска по всей базе данных банка и выявления других потенциальных преступников.

Если учитывать, что Великобритания сражалась с исламскими фундаменталистами и при этом практически закончила воевать с ирландскими повстанцами, то очевидно, что у арестованных подозреваемых были мусульманские имена. Это становилось одним из важнейших демографических маркеров для алгоритма. Шансы на то, что потенциальным террористом окажется человек, ни имя, ни фамилия которого не являются мусульманскими, составляют примерно 1 к 500 000.

Шансы на то, что террористом окажется человек, имя или фамилия которого являются мусульманскими, составляют около 1 к 30 000. Для человека, имя и фамилия которого являются мусульманскими, шансы оказаться террористом составляют 1 к 2000.

Потенциальные террористы являлись в основном мужчинами, обычно в возрасте от двадцати шести до тридцати пяти лет. Более того, эти люди чаще всего обладали следующими характеристиками:

— владели мобильными телефонами;

— были студентами;

— арендовали дом или квартиру, а не владели ими.

Разумеется, все эти факты сами по себе не могут служить основанием для ареста (этим характеристикам соответствуют практически все помощники, которые когда-либо были у авторов этой книги; при этом мы уверены, что никто их них не является террористом). Однако в совокупности с маркером мусульманского имени даже такие простые факты способны придать нашему алгоритму дополнительную силу.

Приняв эти факты к сведению, разработчики смогли определить, что несколько других характеристик являлись нейтральными, то есть на их основании было практически невозможно определить, является человек террористом или нет. К ним относились:

— тип занятости человека;

— семейное положение;

— степень близости жилья к мечети.

Итак, вопреки сложившемуся мнению, молодой безработный мужчина в возрасте двадцати шести лет, живший по соседству с мечетью, с точно такой же вероятностью может оказаться террористом, как женатый мужчина тридцати шести лет, имеющий постоянную работу и проживающий в пяти милях от мечети.

1 ... 21 22 23 24 25 26 27 28 29 ... 65
Перейти на страницу:
На этой странице вы можете бесплатно читать книгу Суперфрикономика - Стивен Левитт.
Комментарии