Компьютерра PDA N62 (09.10.2010-15.10.2010) - Компьютерра
Шрифт:
Интервал:
Закладка:
Сейчас помимо Трана в команду разработчиков входят его бывший коллега Майк Монтемерло, ведущий разработчик программного обеспечения для "Стэнли" а также Кристофер Урмсон, специалист по робототехнике в Университете Карнеги-Меллона, возглавлявший команду, выигрывшую в 2007 году соревнование DARPA Urban Challenge. С ними также работает Энтони Левандовски, создатель первого автономного мотоцикла, участвовавшего в DARPA Grand Challenge.
Как пишет корреспондент New York Times, участвовавший в тестовом заезде на одной из роботизированных Toyota Prius, машина, двигаясь по запрограммированному маршруту, спокойно выехала на шоссе, встроилась в плотное движение, ехала, не превышая заложенного в её базу скоростного лимита, и так же без проблем ушла с шоссе, когда это понадобилось.
Затем, двигаясь по городу Маунтин Вью, машина спокойно ехала в общем потоке, останавливаясь на светофорах и у знаков "Стоп".
Приятный женский голос всякий раз предупреждал, если машина приближалась к пешеходному переходу или поворотам. Этот же голос оповещает находящихся в машине людей, если главная система контроля обнаруживает, что с сенсорами происходит что-то не то.
Как отмечает NYTimes, можно запрограммировать даже манеру езды - та может быть "сдержанной", тогда автомобиль в основном следует за другими, или "агрессивной" - в этом случае машина будет стремиться вырываться вперёд.
За всё время заезда, Кристоферу Урмсону, сидевшему за рулём тестовой машины, пришлось дважды вмешиваться в движение. Один раз - когда велосипедист рванулся наперерез на красный свет, и второй - когда машина, ехавшая впереди остановилась и начала пятиться, чтобы вписаться в парковочное место.
Впрочем, похоже, с этой проблемой робот мог бы справиться и самостоятельно.
Сейчас в Google отсутствует ясное видение того, как сделать бизнес на экспериментах с роботами-водителями, однако проект, по некоторым сведениям, поддерживает лично Ларри Пейдж, сооснователь Google. И Тран и Пейдж жаждут сделать автомобильное движение в США более безопасным и уверены, что с помощью робомобилей им удастся этого добиться.
Впрочем, даже самые ярые оптимисты считают, что до того, как технология дозреет, пройдёт ещё минимум лет восемь.
Есть и ещё одна проблема - юридическая. Законодательство в США требует, чтобы в транспортном средстве обязательно находился человек, который постоянно будет его контролировать. В робомобиле постоянный контроль не требуется - в результате передовая техническая разработка имеет противоречие с действующими законами страны. Вдобавок, даже самый надёжный программно-аппаратный комплекс может сбоить - особенно в случаях, когда окружающая действительность меняется непредсказуемым образом.
И если авария всё-таки случается - кто будет нести ответственность, водитель, или разработчик системы автономного движения?..
У Google на эти вопросы нашёлся ответ: дескать, поскольку человек в любой момент может перехватить управление, робомобили вполне легальны - во всяком случае, по законам Калифорнии.
С другой стороны, сознание, что машиной управляет в основном робот, который видит происходящее вокруг лучше и реагирует быстрее, неизбежно будет приводить к снижению чувства ответственности находящихся в них людей и, естественно, к снижению внимательности.
Вряд ли стоит полностью полагаться на роботов.
Голубятня: Ась?
Автор: Сергей Голубицкий
Опубликовано 12 октября 2010 года
Читатели со стажем не дадут соврать: о системах распознания речи (VRS, Voice Recognition Systems) я писал регулярно, начиная с самой первой статьи, опубликованной в бумажной "Компьютерре" аж в 1996 году! Я делился, помнится, впечатлениями о чуде из чудес компьютерных технологий - программе Dragon Dictate. Вот этот исторический текст, отдаленный от нас во времени почти как полет американцев на Луну (от меня, по крайней мере, и от моих воспоминаний об Америке):
"Наблюдение за Бобом в офисе неизбежно рождало чувство приобщенности к XXI веку. Обставленный компьютерами и мониторами, Боб принимал и отсылал электронную почту, издавал резолюции и созывал собрания совета директоров - и все это без помощи клавиатуры: команды он подавал через микрофон благодаря программе Dragon Dictate. Зрелище просто феерическое! Иное дело - абсолютная сырость самой Dragon Dictate, которая не распознавала каждые три слова из четырех. Бобу приходилось постоянно отвлекаться и вносить изменения в словарный запас программы, причем для этого необходимо было произнести магическое слово"Oops" . В этом случае Dragon Dictate переключается в командный режим и позволяет делать исправления. Я сидел рядом и, закрыв глаза, слушал волшебную музыку очарования технологией: "Упс... упс... упс... упс!"
Но мистер Старер не был бы тем, кем он является на самом деле, - одним из тысячи самых богатых людей Соединенных Штатов (согласно журналу "Fortune"), - если бы не умел вовремя контролировать свои эмоции. После часа ритуальных утренних "упс"-заклинаний он снимал наушники, потягивался и принимался за настоящее дело - подписывал горы бумажных документов, звонил по телефону, летел за пятьсот миль на собственном реактивном самолете на встречи с деловым партнерами и потенциальными клиентами, которые, хоть и не ведали об очаровании технологией, однако обладали просто чудовищным финансово-материальным потенциалом".
Что ж, прошло 15 лет. За это время я предпринимал несколько попыток свериться со свежими достижениями в области распознания речи, однако всякий раз в совершенно конфузном состоянии закрывал тему, покрывая эти самые "достижения" конфузной фигурой умолчания. Отчего так? Оттого, что за 15 лет прогресс нулевой. Именно так - читайте по слогам: ну-ле-вой! Никакой!
Для аналогии приведу еще одну перспективнейшую сферу soft-hard решений, которая топчется на месте те же 15 лет: синтез речи (TTS - Text-To-Speech Engines). О нем я тоже писал миллионократно - при всяком очередном всполохе надежд: то какие-то белорусские товарищи (Sakrament) грозились не сегодня-завтра создать чудо-движок для русской речи, то объявлялась какая-то загадочная якобы 22-килогерцовая "Катя" (ScanSoft RealSpeak Katerina 22Khz), которая на поверку оказывалась чистой воды аберрацией разума (размер TTS 45 мегабайт, тогда как "всего лишь" 16-килогерцовый английский движок AT&T Natural Voices занимает 600 мегов и при этом звучит на фоне русской "Кати" как бог).
Короче говоря, и TTS и VRS, будучи едва ли не самыми перспективными инициативами ай-ти не только на уровне пользователей, но и бизнес-решений, одновременно яляются и самыми тупиковыми и безнадежными. Может найдется, все-таки, профессиональный человек среди читателей Голубятен (а то все больше мельтешат на форуме негативные голубицкоманы), которые объяснят старику-филологу: что такого страшно неподъемного в TTS и VRS, что не позволяет сдвинуть воз с места 15 лет к ряду?!
Поводом к посту послужил разговор с Антонелло, который хвастался андроидной приблудой, встроенной в последнюю версию мобильной ОС (2.2) - Google Voice Actions, кажется так это называется. Поначалу мне очень понравилось, как старый Козловский надиктовал прямо в камеру Скайпа мне письмо и одним кликом отправил по мылу. Все прошло гладко - примерно так, как мечталось нам в 1995 году. Впечатлившись, я тут же бросился искать нечто подобное на моем любимом айфоне. И быстро нашел: называется... вы не поверите: Dragon Dictation свежайшей (октябрьской) версии 2.02, который справляется с задачей распознания речи не хуже Google Voice Actions.
После получаса работы с Dragon Dictation эйфорию, увы, сменила печаль времен "Упс-упс-упс" моего дорогого учителя Боба Старера. Наверное, распознание происходит получше, чем в 1995 году. Во всяком случае мобильный вариант (на айфоне) смотрится сильно интереснее последней (второй) версии Dragon Dictate, изданной в этом году для Mac OS X. Эту - последнюю - приходится обучать и обучать до бесконечности, и все равно результату до идеала примерно как до Луны.
Продукты Dragon (компания Nuance Communications), кстати, работают только на английском, немецком, французском и - кажется, либо на подходе - испанском языках. О русском даже мечтать не приходится. Когда-то был такой "Горыныч" - явный филиал Dragon Dictate либо пародия на него - однако канул в лету: в прошлом году видел на Горбушке какую-то полуОЕМ версию этого барахла непонятно, какого года выпуска. Короче, все разработки с распознанием русской речи, похоже, сдохли окончательно и бесповоротно. Наверное, растворились в нанотехнологиях.
Google Voice Actions вроде с русским справляется. Встроенный в iOS 4 надкусановый вариант управления голосом на фоне андроидной приблуды смотрится, конечно, ребенком. Но, опять же, по гамбургскому счету: ВСЕ перечисленное, ВСЕ-ВСЕ-ВСЕ без исключения - это жалкие потуги, даже не претендующие на хоть какую-то динамику в направлении того, что 15 лет назад казалось и не идеалом вовсе, а гарантированной данностью завтрашнего дня.
Ну и что случилось? Почему все так печально? Кто-нибудь даст объяснение импотенции? Ась?