Вторая эра машин. Работа, прогресс и процветание в эпоху новейших технологий - Эндрю Макафи
Шрифт:
Интервал:
Закладка:
совокупный объем бесед между роботами в беспроводных сетях мира… может вскоре превысить объем всей голосовой коммуникации между людьми в этом канале.[100]
Когда метрической системы не хватает: взрывной рост данных
Дигитализация практически всего: документов, новостей, музыки, фотографий, видео, карт, новостей в личной жизни, социальных сетей, запросов на получение информации и ответов на них, данных со всевозможных сенсоров и так далее – представляет собой одно из самых важных явлений последних лет. Чем дальше мы входим во вторую эру машин, тем сильнее расширяется и ускоряется дигитализация, и при взгляде на статистику, связанную с ней, у нас просто перехватывает дыхание. Согласно данным компании Cisco Systems, всемирный интернет-трафик увеличился в 12 раз всего за 5 лет с 2006 по 2011 год, достигнув объема в 23,9 экзабайт в месяц.[101]
Экзабайт – огромное число, это примерно 200 тысяч баз данных компьютера Watson. Однако даже этого числа не хватает, чтобы описать общей объем нынешней и будущей дигитализации. Компания IDC, занимающаяся технологическими исследованиями, рассчитала, что в 2012 году в мире имелось 2,7 зеттабайт (2,7 сикстильона байтов) цифровых данных – почти вдвое больше, чем в 2011-м. И все эти данные не просто хранятся на жестких дисках наших компьютеров – они активно перемещаются. По прогнозам Cisco, глобальный трафик по межсестевому протоколу Internet достигнет к 2016 году 1,3 зеттабайт.[102] Для сравнения: это больше 250 миллиардов DVD-дисков с информацией.[103]
Все эти цифры ясно дают понять, что дигитализация создает по-настоящему большие объемы данных. По сути, если такой же быстрый темп роста сохранится и в будущем, нам перестанет хватать метрической системы. Когда в 1991 году на XIX Конференции мер и весов был расширен список приставок для числительных, самой большой из них была «йотта», обозначающая один септильон, или 1024.[104] В нашей «эре зеттабайт» мы находимся всего в одном шаге от этого значения.
Бинарная наука
Взрывное расширение дигитализации, происходящее в последнее время, производит сильное впечатление, однако насколько оно важно? Действительно ли все эти экза- и зеттабайты цифровых данных полезны? Да, они невероятно полезны. Одна из главных причин, которые позволяют нам считать дигитализацию основной силой, формирующей вторую эру машин, состоит в том, что дигитализация улучшает процесс овладевания знанием. Она обеспечивает легкий доступ к огромным массивам данных, а данные – это источник жизненной силы науки. В данном случае под «наукой» мы понимаем работу над формулированием теорий и гипотез и их последующую проверку (говоря менее формально, мы делаем догадки о том, как что-то работает, а потом проверяем, верны ли они).
Некоторое время назад Эрик предположил, что данные поиска в интернете могут сигнализировать о будущих изменениях в ценах на недвижимость и объеме ее предложения по всей стране. Он исходил из того, что если семейная пара собирается переехать в другой город и купить там дом, то супруги вряд ли надеются провернуть это за пару дней. Они начнут собирать нужную информацию заранее, за несколько месяцев до переезда. В наши дни поиск такой первоначальной информации в интернете происходит постоянно: вы начинаете с того, что вбиваете в поисковой строке «риелтор в Финиксе», «районы Финикса» или просто «цена дом две спальни Финикс».
Чтобы протестировать свою гипотезу, Эрик поинтересовался у Google, может ли он получить данные по статистике поиска. Ему ответили, что никакого специального разрешения здесь не требуется и что эти данные бесплатно доступны онлайн. Эрик и его аспирант Линн Ву (оба – совсем не специалисты в области экономики недвижимости) построили простую статистическую модель, чтобы изучить данные, использующие контент, создаваемый пользователями в ходе их поисковых запросов через Google. Их модель связывала изменения в количестве поисковых запросов определенного рода с последующими изменениями цен на недвижимость и предсказывала, что если количество запросов, подобных описанным выше, сегодня выросло, то цены на дома и объем предложения в Финиксе будут расти в ближайшие три месяца. Оказалось, что эта простая модель вполне работает: фактически она предсказывала уровень продаж на 23,6 % точнее, чем прогнозы, публикуемые экспертами Национальной ассоциации риэлторов.
Подобных же успехов при использовании доступных цифровых данных добиваются и исследователи в других областях. Команда под руководством Руми Чунара из Гарвардской медицинской школы исследовала пути распространения холеры после землетрясения 2010 года на Гаити и выяснила, что информация об эпидемии в «Твиттере» была не менее точной, чем данные официальных отчетов; кроме того, эта информация появлялась как минимум на две недели раньше.[105] Ситарам Асур и Бернардо Губерман из Лаборатории социальной инженерии компании Hewlett Packard обнаружили, что твиты могут также использоваться для прогнозирования дохода от проданных билетов в кинотеатры. По словам ученых, их исследование «наглядно продемонстрировало, как социальные сети отражают коллективную мудрость, которая, если ее направить в нужное русло, может чрезвычайно мощно и точно предсказывать, что произойдет в будущем».[106]
Дигитализация может также помочь нам лучше понимать прошлое. Так, по состоянию на март 2012 года компания Google отсканировала свыше 20 миллионов книг, опубликованных за несколько столетий.[107] Этот огромный массив цифровых слов и фраз формирует основу для так называемой культуромики, или «применения техники сбора данных с высокой пропускной способностью и их анализа для изучения человеческой культуры».[108] Команда профессионалов из нескольких отраслей под руководством Жана-Батиста Мишеля и Эреца Либермана Эйдена проанализировала свыше 5 миллионов книг, опубликованных на английском языке начиная с 1800 года. Помимо прочего, они обнаружили, что количество слов в английском языке за период между 1950 и 2000 годами выросло более чем на 70 %, что прославиться в наши дни можно быстрее и легче, чем в прошлом (но и проходит эта слава быстрее), и что в XX веке интерес к вопросам эволюции стабильно снижался до тех пор, пока Уотсон и Крик не открыли структуру ДНК.[109]
Все это – примеры более ясного понимания и точного предсказания (или более качественной науки), возникшие благодаря дигитализации. Хэл Вариан, главный экономист Google, многие годы изучал это явление. Он также умеет отлично описывать то, что видит. Одно из наших любимых высказываний Вариана звучит так: «Я утверждаю и буду утверждать, что самой модной и привлекательной профессией в следующие 10 лет будет статистика. И я не шучу».[110] Когда мы видим объемы постоянно создающихся цифровых данных и думаем о том, сколько еще открытий при их исследовании нас ожидает, то не можем не согласиться с ним.
Новые уровни приносят новые рецепты
Информация в цифровой форме – это не только питательная среда для новых видов науки; это вторая фундаментальная сила (после экспоненциального прогресса), которая стимулирует инновации и этим формирует вторую эру машин. Отличным примером может служить Waze. Этот сервис выстроен на множестве цифровых технологий разных уровней и разных поколений, и ни одна из этих технологий не стала дефицитной и не истощилась, поскольку все цифровые продукты неконкурентны.
Первый и самый старый уровень – это цифровые карты, появившиеся как минимум одновременно с персональными компьютерами.[111] Второй – это GPS-информация о местоположении, ставшая намного более полезной для водителей после того, как правительство США повысило точность GPS-позиционирования в 2000 году.[112] Третий – это пользовательские данные; пользователи Waze помогают друг другу, предоставляя информацию обо всем, начиная с аварий и полицейских радаров, замеряющих скорость, и заканчивая более дешевыми заправками; они даже могут использовать приложение для общения между собой. И, наконец, Waze активно использует сенсорные данные; по сути, программа превращает каждый автомобиль в сенсор, оценивающий скорость дорожного потока, и использует эти данные для расчета оптимальных маршрутов.
Встроенные автомобильные навигационные системы, которые используют лишь первые два уровня данных – карты и GPS-позиционирование, – появились в нашей жизни уже некоторое время назад. Они могут быть чрезвычайно полезны, особенно в незнакомом городе, однако, как мы уже видим, обладают и серьезными недостатками. Создатели Waze поняли, что по мере развития и распространения дигитализации им удастся преодолеть недостатки традиционной GPS-навигации. Эти инноваторы сделали шаг вперед, добавив в уже существовавшую систему пользовательские и сенсорные данные, что значительно повысило мощность и полезность сервиса. Как мы увидим в следующей главе, такой стиль инноваций – отличительный признак именно нашего времени. И он настолько важен, что мы считаем его третьей и последней из сил, формирующих вторую эру машин. Следующая глава объясняет, почему это так.