Сегодня технологии искусственного интеллекта стали обычным явлением.
Среднестатистический технофил просыпается в комфортной температуре благодаря обучающемуся термостату Nest. Google Maps упрощает ему поездку на работу, предсказывая трафик и сокращая время езды. На работе почтовое приложение от Apple автоматически создает ответы на письма и проверяет орфографию, чтобы избежать ошибок. Вечером он включает Netflix и отдыхает под рекомендованный ему новый сериал. Таким образом, ИИ делает его поездки, работу и жизнь проще.
В марте 2018 года опрос Gallup, проведенный среди 3 000 американцев, показал, что 85 % из них пользуются продукцией на основе ИИ, будь это навигаторы, стриминговые сервисы или приложения для совместных поездок. Так что неудивительно, что некоторые самые успешные компании Кремниевой долины стали таковыми благодаря внедрению ИИ. Сегодня приложений с ИИ слишком много для подробного и всеобъемлющего анализа. Здесь мы сосредоточимся на нескольких областях, в которых влияние ИИ уже заметно, и рассмотрим некоторые технологии и алгоритмы, лежащие в основе этих приложений.
Без сомнения, машинное обучение сыграло самую важную роль в развитии искусственного интеллекта за последние двадцать лет. Это парадигма, которая позволяет программам автоматически повышать свою эффективность при выполнении конкретной задачи благодаря изучению огромных объемов данных. В отличие от классических программ, алгоритмы обучения (learners) — не строго запрограммированы, а обучаются. Эти мощные алгоритмы уже не пользуются «спущенными сверху» наборами созданных людьми правил обработки информации. Вместо этого они учатся с нуля — не у людей, а на основе данных. Алгоритмы обучения не работают по заранее известной схеме; они полагаются на статистику.
Благодаря машинному обучению мы приблизились к по-настоящему умным машинам.
Рост числа самообучающихся программ отчасти объясняется более дешевым и надежным аппаратным оборудованием, которое обеспечило возможность построения систем, основанных на реальных данных. Растущая способность собирать, хранить и обрабатывать значительные объемы информации помогла в создании алгоритмов, которые действуют, опираясь на различные статистические методы.
Машинное обучение часто упоминается как единая дисциплина, хотя фактически этим термином обозначают группу различных статистических методов, направленных на решение конкретных задач. Многие из этих алгоритмов основаны на интуитивных представлениях о работе человеческого мышления, однако само машинное обучение является чисто техническим продуктом. Оно не решает философские вопросы вроде: думают ли машины? обладают ли они сознанием? Машинное обучение стремится в явном виде воспроизвести в компьютерах конкретные выполняемые людьми функции, чтобы на выходе программы выдавали эффективные решения этих задач. На данный момент машинное сознание значения не имеет. То есть, когда вы говорите с цифровым помощником, осознанного понимания произносимых вами предложений не происходит. Цифровые помощники на чисто поведенческом уровне обрабатывают слова, фразы и предложения таким образом, чтобы алгоритм мог выполнить голосовую команду — например, выйти в интернет и найти прогноз погоды.
Когда пользователи разговаривают с голосовым помощником — например, Siri, — они запускают двухэтапный процесс. Во-первых, Siri активирует систему ИИ для распознавания речи, которая переводит нечеткий звук в однозначный текст. Этот шаг невероятно сложен, потому что люди, естественно, говорят с разной высотой звука и с различными акцентами, которые варьируются в зависимости от места жительства и пола. Для того чтобы ИИ эффективно распознавал речь всех пользователей, система использует технику машинного обучения под названием «глубокое обучение».
Сегодня глубокое обучение — это движущая сила всего машинного обучения. Эта техника основана на искусственных нейронных сетях, которые создавались по подобию биологических нейронных контуров, благодаря которым мыслит человек. Огромный успех метода очевиден почти во всех приложениях с ИИ.
Например, в распознавании речи частота ошибок в большинстве приложений составляет теперь менее 10 %.
После преобразования речи в текст Siri пытается определить, что именно пользователь хотел выразить этими словами. Этому помогают алгоритмы обработки естественного языка, которые также обучаются на миллионах примеров. Поскольку человеческий язык часто является неточным или неоднозначным, Siri необходим большой набор данных, чтобы иметь возможность фиксировать и обобщать изменения в речи для расшифровки значения. Тем не менее преимущество глубокого обучения состоит в том, что, обработав достаточное количество примеров, системы обработки естественного языка приобретают способность интерпретировать речь, анализировать эмоциональный тон предложений и автоматически переводить с одного языка на другой.
Еще одно популярное применение ИИ — личные рекомендации. В качестве примера рассмотрим четыре, казалось бы, разные компании: Netflix — потоковый видеосервис; Amazon — платформа для онлайн-покупок; Facebook — социальная сеть; Google — поисковая система. Хотя эти компании предоставляют различные услуги, их системы искусственного интеллекта выполняют очень похожую задачу: они доводят до вас информацию.
С помощью машинного обучения эти компании понимают, какую информацию показывать своим пользователям. Сегодня рекомендательные системы широко используют ИИ, чтобы дать индивидуальные рекомендации по книгам или фильмам или предоставить персонализированные результаты поиска. Эти системы также используются в контекстной рекламе и онлайн-сервисах знакомств.
По сути, приложения на основе ИИ стремятся дать осмысленные рекомендации даже в условиях неопределенности. Например, Amazon может рекомендовать вам купить книгу на основе ранее приобретенного издания, даже не зная о ваших читательских предпочтениях. Это достигается двумя взаимодополняющими способами. Во-первых, система составляет схему предпочтений пользователя на основе предыдущих действий и аналогичных решений других пользователей. Amazon в основном использует этот метод, чтобы рекомендовать товары на основе истории покупок. Facebook, LinkedIn и другие социальные сети используют аналогичную систему, чтобы рекомендовать друзей или профессиональные связи. Во-вторых, ИИ извлекает ряд характеристик из запрашиваемого элемента и создает его профиль. Затем система находит другие элементы, имеющие схожий профиль, и прогнозирует важность каждой характеристики для конкретного пользователя. Сайт Rotten Tomatoes, выкладывающий обзоры фильмов, и приложение для музыкальных рекомендаций Pandora Radio используют этот подход для рекомендаций фильмов и музыки соответственно.
Ключевой проблемой таких систем является неопределенность: часто у них нет полных данных ни об элементе, ни о предпочтениях пользователя. При этом системе нужно оценить вероятность того, что рекомендация понравится пользователю. Здесь особенно стоит отметить популярный набор алгоритмов, основанный на байесовском подходе. Эти алгоритмы позволяют обновлять достоверность конкретной гипотезы — например, вероятность того, что пользователю может понравиться фильм или песня — на основе новых данных. Это очень действенный метод, который может почерпнуть знания из случайных, зашумленных данных. Пользователь, возможно, купил книгу в подарок; это мешает при создании профиля его предпочтений. Байесовские методы в ИИ позволяют обучаться с достаточной точностью даже на несовершенных данных, также они часто сочетаются с другими алгоритмами — такими как искусственные нейронные сети — для создания алгоритмов метаобучения, дающих оптимальный результат.
Рекомендации с использованием ИИ — это процветающая отрасль.
Netflix считает свою систему рекомендаций самым ценным активом. Платформа Cinematch изучает предпочтения пользователей, чтобы посоветовать им малоизвестные фильмы и сериалы, на которые компания потратила не так много. Отвлекая внимание от дорогих блокбастеров, Netflix гарантированно покрывает свои лизинговые расходы и получает прибыль от подписок пользователей. В 2006 году компания предложила приз в размере 1 миллиона долларов тому, кто на 10 % повысит точность их рекомендаций.
Компания заявила, что по состоянию на 2012 год 75 % фильмов зрители увидели благодаря алгоритму рекомендаций.
Не так давно Netflix взялась и за производство контента. Используя свою обширную базу данных о предпочтениях пользователей, компания рассчитала, какие сюжеты и актеры привлекут наибольшее внимание, и начала производить фильмы и сериалы на основе этих данных. На сегодняшний день Netflix выпустила несколько популярных продуктов, в том числе «Карточный домик», «Оранжевый — хит сезона», «Очень странные дела». Подобный подход переняли и другие стриминговые сервисы, такие как Amazon Prime Video и Hulu.
Системы искусственного интеллекта быстро меняют наше взаимодействие с физическим миром даже за пределами цифровой сферы. Например, появление беспилотных автомобилей заставляет полностью пересмотреть нынешнюю транспортную систему. Еще в 2000-х годах считалось, что создать беспилотные транспортные средства проблематично из-за сложного устройства городской среды и риска многочисленных инцидентов, которые автомобиль не сможет предвидеть и контролировать.
В 2004 году щедрое финансирование Управления перспективных исследовательских проектов Министерства обороны США (DARPA) спровоцировало рывок в исследованиях автономного транспорта. Пятнадцать беспилотных автомобилей проехали 228 км по пустыне Невада, США. В итоге команды не смогли выполнить поставленную задачу, но призовой фонд в размере 1 миллиона долларов вызвал интерес к разработке базовых технологий для создания беспилотных автомобилей, в том числе — передовых сенсорных технологий и 3D-карт местности.
Сегодня автономные транспортные средства — одна из наиболее быстро развивающихся сфер применения ИИ.
К февралю 2018 года беспилотные автомобили Google Waymo проехали 5 миллионов миль по дорогам общего пользования в 25 городах США. Большинство автомобилей, производимых Tesla, укомплектованы оборудованием для полностью автономного вождения, и, обновляя программное обеспечение, компания включает в него опции для автоматизированного вождения.
Такой быстрый и неожиданный прогресс отчасти объясняется значительными достижениями в нескольких областях ИИ, в том числе — компьютерном зрении, поиске и планировании, а также обучении с подкреплением. Благодаря развитию этих областей ИИ способен непрерывно отслеживать окружающую обстановку и прогнозировать потенциальные изменения в ней. В общем и целом, существует шесть столпов, которые обеспечивают безопасное перемещение беспилотного автомобиля.
Во-первых, автомобиль перемещается в пространстве, ориентируясь по GPS и подробной 3D-карте окружающей местности. Чтобы построить такие карты, необходимо множество раз проехать по окрестностям и зафиксировать, как могут изменяться дорожные условия. Благодаря таким картам беспилотники знают, чего ожидать от окружающей местности, и получают некоторые предварительные расчеты.
Далее автомобиль собирает данные с помощью своих датчиков, в том числе — камер объемного звучания, обладающих 360-градусным охватом ультразвуковых и радиолокационных датчиков, а также лидаров. Совместная работа датчиков обеспечивает комплекс данных о близрасположенных предметах — их размере, форме, а также скорости и направлении движения.
Третий шаг — поиск по этим данным таких объектов, которые могут повлиять на маршрут автомобиля. Для этого шага требуется компьютерное зрение — краеугольный камень в исследованиях ИИ, которое учит машины «видеть» и «понимать» изображения, видео и другие визуальные мультимедиа. Заметьте, алгоритмы ИИ в явном виде не обладают пониманием того, что они видят; тем не менее они генерируют явный правильный вывод: например, они различают на картинке собаку, не понимая, что такое собака. В случае автономных транспортных средств, собранные данные используют для того, чтобы обучить алгоритмы машинного обучения отличать объекты на основе их формы и поведения. Обрабатывая миллионы примеров, ИИ учится распознавать пешеходов, велосипедистов, разметку полос и другие объекты.
Поскольку многие объекты движутся по дороге, ИИ должен в том числе прогнозировать направление и скорость их движения. Например, движется ли пешеход к или от самоуправляемого автомобиля? Это четвертый шаг: предугадать действия объектов на дороге. Одним из методов, позволяющих ИИ достичь этой цели, является метод опорных векторов — популярный алгоритм, созданный под влиянием знаний о человеческой психике. Алгоритм с таким необычным названием полагается на простой принцип — люди учатся по аналогии.
Живя в хаотичном мире, мы ищем сходство между различными явлениями и ситуациями, чтобы связать неизвестные события с теми, что мы уже пережили. В свою очередь, эти сравнения позволяют нам увидеть общие закономерности. Анализируя видео, снятое автомобильными датчиками, метод опорных векторов в сочетании с глубоким обучением помогает различать транспортные средства и пешеходов и предсказывать их перемещения. Безусловно, этот метод очень важен для беспилотных автомобилей и ИИ в целом. Правильно оценив место действия, ИИ должен предпринять пятый шаг — определить, как верно реагировать на изменения в окружающей обстановке.
Поиск и планирование — это область ИИ, в которой машины учатся рассчитывать и выбирать правильную последовательность реакций для решения конкретной задачи.
Алгоритмы планирования часто используют в робототехнике для того, чтобы выстроить последовательность действий, они помогают разработать план с учетом имеющихся ограничений. Например, после того, как автомобиль-робот проанализирует окружающую обстановку, он должен в режиме реального времени проложить безопасный, удобный и эффективный путь через множество движущихся объектов, чтобы достичь своей цели — например, следующего перекрестка.
Возможно, самым современным методом создания систем ИИ для принятия решений является обучение с подкреплением. Также созданный под влиянием данных психологии, метод обучения с подкреплением является разновидностью метода проб и ошибок, часто применяемого при дрессировке животных. Если вкратце, животное за какой-либо поступок либо награждают, либо наказывают, пока не добьются желаемого поведения.
Наградой для ИИ является число, которое алгоритм пытается увеличить. Во время обучения вознаграждение может быть кратковременным и даваться сразу после действия, а может быть долгосрочным и даваться только после целой последовательности действий.
Когнитивные психологи утверждают, что именно через обучение с подкреплением люди получают новые знания, когда нет четких инструкций: например, долгое время управляя автомобилем, мы интуитивно обучаемся новым навыкам вождения. Схожим образом алгоритм ИИ воспроизводит метод обучения без учителя. Объединение глубокого обучения и алгоритмов обучения с подкреплением в одно целое — глубокое обучение с подкреплением — считается последним словом в этой сфере исследований. Эта концепция, которую первой разработала компания DeepMind, сочетает в себе обучение методом проб и ошибок с обучением на основе необработанных входных данных, например пикселей в изображении. Если развить эту концепцию и применять ее в беспилотниках, ИИ сможет рассчитывать свой следующий шаг исключительно на основе данных, полученных датчиками, без вмешательства человека. Другими словами, этот вид алгоритмов учится выполнять последовательность действий в конкретной обстановке.
Идею глубокого обучения с подкреплением подсказал человеческий мозг. Возьмем, к примеру, дифференцируемый нейронный компьютер, который отчасти имитирует рабочую память в человеческом мозге. Еще одна идея, подсказанная нейронаукой, — автономное воспроизведение, которое позволяет сети постоянно учиться на прошлом опыте. Сравнивая текущие ситуации с событиями, хранящимися в памяти, сеть со временем начинает понимать, какие действия при тех или иных входных данных приведут к вознаграждению. Изначально алгоритм обучался на играх компании Atari, но теперь он используется для навигации по дорогам. Развитие методов глубокого обучения с подкреплением позволяет беспилотникам получать опыт вождения в процессе эксплуатации. Если развитие алгоритмов с модулями памяти будет продолжено, они помогут беспилотникам блестяще справляться со сложными дорожными ситуациями.
На шестом и последнем шаге все эти технологии машинного обучения помогают автомобилю с ИИ правильно реагировать на ситуацию: ускориться, притормозить или повернуть. Исследования в области беспилотных автомобилей постоянно развиваются. Например, в Массачусетском технологическом институте лидарные датчики учатся анализировать структуру покрытия прилегающих территорий, чтобы лучше определять границы грунтовых дорог, тогда автономные транспортные средства можно будет использовать и в сельской местности. Виртуальная реальность также помогает учить ИИ вождению. Использование смоделированных карт позволяет опустить первый шаг в обучении — построение высококачественных 3D-карт — и дает автомобилю возможность испытать на себе редкие, но потенциально смертельные дорожные происшествия.
В июне 2018 года DeepMind выпустила глубокую нейронную сеть под названием генеративная сеть запросов (GQN), которая может воссоздать в 3D любое место на основе нескольких родственных 2D-изображений. Также GQN выстраивает изображение местности с разных точек обзора. GQN и подобные методики пока несовершенны, но они уже могут предложить беспилотникам дополнительные возможности ориентирования на дороге. Например, алгоритм может ознакомить ИИ с определенным перекрестком, когда автомобиль движется к нему под необычным углом.
Благодаря интересу со стороны ученых и бизнеса производство автономных автомобилей быстро развивается: в США Департамент транспортных средств уже разрешил более 50 компаниям тестировать подобные автомобили в различных штатах. Среди них — как новые компании, такие как Waymon, Uber и Tesla, так и знакомые всем автомобильные гиганты Nissan, BMW, Honda и Ford.
Разумеется, развитию этой сферы также способствует то, что первый массовый производитель автономных транспортных средств выиграет экономически.
В одном из исследований аналитики Intel доказали, что беспилотные автомобили обладают огромным экономическим потенциалом: в Intel прогнозируют, что к 2035 году производство автономных автомобилей даст годовой доход в 800 миллиардов долларов, а к 2050 году он увеличится до 7 триллионов долларов. В докладе этот новый рынок называется «пассажирской экономикой», в нее входит стоимость услуг и товаров, которые появляются вследствие использования беспилотных автомобилей, а также нематериальная экономия времени и ресурсов.
Считается, что производство автономных грузовиков принесет еще больше доходов. На длинных участках шоссе беспилотные грузовики могут выстраиваться в колонны, уменьшая, таким образом, аэродинамическое сопротивление. В отличие от живых водителей, ИИ никогда не устает и не теряет концентрацию. В начале 2018 года компания Embark объявила, что ее беспилотный грузовик преодолел 3 860 км по территории США, при этом контролировал поездку живой водитель. Если бы законы не запрещали автономное передвижение транспортных средств, грузовик мог бы проехать от одного побережья до другого всего за два дня, а не за четыре-пять, как с живым водителем. Экономические выгоды настолько велики, что Waymo, Tesla и Uber занялись грузоперевозками. В течение ближайшего десятилетия автономные грузовики, возможно, завоюют всю отрасль.
Вопреки первоначальным прогнозам, внедрение ИИ разрушает не только сферу низкоквалифицированного труда — ИИ получает широкое распространение и в такой неожиданной области, как здравоохранение. Влияние ИИ уже ощущается в фармацевтике, пациенториентированных клиниках, хирургии и медицинской диагностике.
С помощью больших данных, а также сложных алгоритмов ИИ крупные фармацевтические компании анализируют библиотеки препаратов, чтобы найти возможность создания новых перспективных лекарств. Суперкомпьютер IBM Watson после своей знаменательной победы в шоу Jeopardy! сотрудничает с такими фармацевтическими гигантами, как Merck, Novartis и Pfizer, разрабатывая новые лекарства, планируя и анализируя клинические испытания, а также прогнозируя безопасность и эффективность лекарств.
В фармацевтике часто применяют ИИ, в основе которого лежат эволюционные алгоритмы. Так же как и случае с искусственными нейронными сетями, концепция эволюционных алгоритмов появилась благодаря природе — в данном случае, идее естественного отбора. Исследователи ИИ берут начальную совокупность алгоритмов и выбирают те, которые лучше всего генерируют новую молекулярную структуру препарата. Потом немного изменяют самые результативные алгоритмы или смешивают фрагменты их кода, чтобы получить следующее поколение алгоритмов. Теоретически через несколько поколений лучшие программы последней популяции смогут превосходно генерировать молекулы, похожие на лекарства.
Эволюционные алгоритмы позволяют исследователям моделировать свойства молекул, а также создавать новые молекулярные структуры и определять, пригодятся ли они при создании лекарств. Сегодня большинство крупных фармацевтических компаний в процессе изыскания новых лекарственных средств использует генетические алгоритмы. Кроме того, байесовские модели, ранее внедренные в рекомендательные системы, также помогают понять, какие химические структуры подойдут для различных типов лекарств и в случаях множественной лекарственной устойчивости.
В клиниках новое поколение технологически подкованных врачей постоянно консультируется со специализированными приложениями на основе ИИ. Так как рабочие нагрузки увеличиваются, врачи готовы прибегать к любой помощи, что способствует интеграции ИИ в их повседневную практику.
Во-первых, поскольку объем научных публикаций быстро растет, автоматизированные системы по обработке текста могут просматривать опубликованные отчеты и выуживать из них новую информацию, которую затем врачи получают уже в виде простых сводок. В настоящее время IBM Watson и Semantic Scholar обучаются именно такой способности. Обрабатывая естественный язык, эти системы читают и классифицируют результаты миллионов научных работ, чтобы найти необходимую информацию и ранее упущенные соответствия. Во-вторых, клинические помощники на основе ИИ могут взять на себя административную работу — например, заполнение медицинских карт. В середине 2018 года компания Suki вложила миллионы в развитие своего голосового цифрового помощника для клиник. Предварительные данные, полученные в ходе 12 исследований в США, показывают, что ИИ экономит врачам до 60 % времени, затрачиваемого на оформление документов. Как и в других технологиях машинного обучения, точность Suki будет только расти по мере увеличения объемов собранных данных.
Важная область применения ИИ — робототехника — также внесла свой вклад в развитие медицины: речь о роботах-хирургах.
В 2000 году компания Intuitive Surgical представила систему da Vinci, которая способна проводить минимально инвазивные операции по шунтированию сердца. Система превращает движения рук хирурга в небольшие точные действия роботизированных манипуляторов. В настоящее время аппарат может проводить множество типов операций и работает в больницах по всему миру.
Но, пожалуй, сильнее всего ИИ повлиял на медицинскую диагностику.
В 2017 году в престижном академическом журнале Nature было опубликовано исследование, доказывающее, что искусственная нейронная сеть может выявить подтвержденный биопсией рак кожи. Алгоритм выполняет диагностику не хуже, а иногда и точнее сертифицированных дерматологов.
В некоторых испытаниях ИИ проявил себя более внимательным и точным, чем живые врачи, реже пропускал смертельный рак кожи и реже ошибочно диагностировал рак. Совсем недавно другие разработчики представили системы ИИ, которые сканируют изображения сетчатки, оценивая риск развития глазных и сердечнососудистых заболеваний. Существуют также алгоритмы диагностики рака молочной железы на основе маммограмм и автоматизированные системы выявления пневмонии, аритмии сердца и некоторых переломов костей, и диагнозы этих алгоритмов не уступают по точности диагнозам живых врачей.
Успехи ИИ в медицинской диагностике настолько многообещающие, что британский ученый Джеффри Хинтон (род. 1947) недавно заявил, что медицинским институтам «пора прекратить выпускать рентгенологов». Многие, однако, считают, что ИИ может помочь рентгенологам в слаборазвитых или развивающихся регионах и расширить доступ к медицинской помощи.
Еще более новаторская сфера применения ИИ в медицине — умное протезирование. Используя методы глубокого обучения, ученые разработали протезы рук и кистей, которые реагируют на мозговые волны, позволяя пациентам управлять бионическими конечностями с помощью разума. Такие компании, как Aipoly и EyeSense, используют нейронные сети, чтобы помочь слабовидящим людям ориентироваться в окружающей среде. Приложения работают на смартфонах и описывают близко расположенные объекты.
Влияние ИИ на общество и его применение безграничны.
Согласно «Столетнему исследованию искусственного интеллекта» Стэнфордского университета, в течение следующих двух десятилетий ИИ, помимо описанных в этой главе сфер жизни, значительно повлияет на логистику, образование, общественную безопасность и работу сервисных роботов. С развитием технологий ИИ-системы будут проникать в общество и промышленность. Однако для того, чтобы ИИ полностью реализовал свой потенциал, его результаты должны быть точными и объяснимыми.
Сегодня существует несколько серьезных препятствий, которые мешают ИИ воплотить связанные с ним революционные перспективы.