Глубокое обучение: Когда человеческий мозг становится моделью

Если вы разговариваете с Siri или Google Assistant, вы уже используете глубокое обучение. Без этой технологии голоса из смартфонов и колонок не смогли бы понимать наш разговорный язык и давать соответствующие ответы.

Глубокое обучение — явление не новое, но только в последние несколько лет оно было усовершенствовано до такой степени, что может принести реальную пользу, сделав первый шаг в нашу повседневную жизнь. Развитие в этой области также идет быстрыми темпами. Такие мегакорпорации, как Google, проводят серьезные исследования в области глубокого обучения — и не только для того, чтобы в один прекрасный день мы могли общаться с Google Assistant как с человеком. Существует огромное количество возможных применений.

Мы объясним, как работает эта технология, в чем ее сильные и слабые стороны и какие области применения доступны сегодня и в будущем.

Что такое глубокое обучение?

Если говорить о человеке, то для того, чтобы компьютеры были интеллектуальными, они должны уметь делать прежде всего одно: самостоятельно обучаться. В связи с этим глубокое обучение — это область научных исследований в сфере искусственного интеллекта. Более конкретно: Это подраздел машинного обучения. Существует множество различных методов реализации машинного обучения: одним из таких методов является глубокое обучение.

Определение: Глубокое обучение

Глубокое обучение — это раздел машинного обучения, в котором компьютеры обрабатывают большие объемы данных с помощью нейронных сетей, имитирующих человеческий мозг. С помощью новой информации существующие связи могут быть изменены и расширены, чтобы система училась новому без вмешательства человека, позволяя принимать все более качественные решения и прогнозы.

Искусственные нейронные сети используются для обработки информации и состоят из входного слоя, одного или нескольких промежуточных слоев и выходного слоя. Информация поступает на входной слой в виде входного вектора и взвешивается в промежуточных слоях с помощью искусственных нейронов, после чего на выходном слое формируется определенный шаблон. Чем больше слоев содержит искусственная нейронная сеть, тем более сложными могут быть задачи, решаемые искусственным интеллектом.

Пример: Распознавание изображений

Сортировка изображений в зависимости от того, кто на них изображен — собаки, кошки или люди, — сложная задача для компьютера. То, что человеку понятно с первого взгляда, требует от компьютера анализа отдельных характеристик изображения.

При глубоком обучении исходные данные, в данном случае изображение, анализируются слой за слоем. На первом уровне искусственной нейронной сети, например, система анализирует цвета отдельных пикселей изображения. Каждый пиксель изображения обрабатывается своим собственным нейроном. В следующем слое определяются края и формы, а в последующем слое изучаются более сложные характеристики.

Собранная информация отображается в гибком алгоритме. Результаты одного слоя переносятся в следующий слой и изменяют алгоритм. Таким образом, компьютер способен использовать множество операций, чтобы прийти к выводу, можно ли отнести изображение к категории собак, кошек или людей.

В начале периода обучения ошибки в категоризации исправляются людьми, что позволяет алгоритму адаптироваться. Через некоторое время он может самостоятельно улучшить распознавание изображений. По мере изменения взаимосвязи между нейронами в сети и адаптации весовых коэффициентов переменных в алгоритме, определенные входные паттерны (различные виды изображений кошек) все точнее и точнее приводят к одинаковым выходным паттернам (распознаваемая кошка). Чем больше изображений доступно системе для обучения, тем лучше.

При глубоком обучении человек не всегда может понять, какие именно модели распознал компьютер, чтобы прийти к своим выводам, особенно потому, что система постоянно оптимизирует свои собственные правила принятия решений.

История глубокого обучения

Глубокое обучение на самом деле довольно недавний термин — впервые он был использован в 2000 году — однако метод использования искусственных нейронных сетей, позволяющий компьютерам принимать интеллектуальные решения, насчитывает несколько десятилетий.

Фундаментальные исследования в этой области начались еще в 1940-х годах. Искусственные нейронные сети были впервые разработаны в 1980-х годах. Однако тогда качество решений было неутешительным, поскольку для самостоятельного обучения машин — глубокого обучения — требуется большое количество данных, которых в то время просто не было в цифровом виде. Только на рубеже тысячелетий наступила эра больших данных, благодаря чему глубокое обучение вновь стало интересным для науки и бизнеса.

Сильные и слабые стороны

По сравнению с более ранними технологиями ИИ, глубокое обучение значительно эффективнее. Именно поэтому огромный интерес к ней со стороны СМИ полностью оправдан, как и интерес к исследованиям. Однако прежде чем технология сможет полностью раскрыть свой потенциал, необходимо преодолеть некоторые слабые стороны.

Сильные стороны глубокого обучения

Одним из самых важных аргументов в пользу глубокого обучения является качество его результатов. В частности, в распознавании изображений и обработке речи эта технология явно превосходит все остальные. Получив высококачественные обучающие данные, глубокое обучение может выполнять рутинную работу гораздо эффективнее и быстрее, чем любой человек — без каких-либо признаков усталости и без изменения качества.

В других формах машинного обучения разработчики анализируют исходные данные и периодически определяют дополнительные характеристики, которые алгоритм должен учитывать в процессе обучения, чтобы улучшить способность ИИ к прогнозированию. При глубоком обучении система сама распознает полезные переменные и включает их в процесс обучения. После начального периода обучения она может обучаться без участия человека, что экономит время и деньги, поскольку для дальнейшего развития не нужны квалифицированные сотрудники.

До сих пор для того, чтобы машинное обучение стало возможным, большое количество данных необходимо было маркировать вручную. Например, при распознавании изображений требовались сотрудники, которые присваивали изображениям метки «собака» или «кошка». С глубоким обучением период ручного обучения значительно сокращается. Прежде всего, это актуально потому, что, хотя общая корпоративная практика, конечно, предполагает сбор большого количества данных, лишь в редких случаях они существуют в виде структурированных данных (номера телефонов, адреса, кредитные карты и т.д.). В большинстве случаев они хранятся в виде неструктурированных данных (изображения, документы, электронные письма и т.д.). В отличие от альтернативных методов машинного обучения, глубокое обучение может оценивать различные источники неструктурированных данных с учетом поставленной задачи.

Аргумент о том, что эта технология слишком дорога на практике, чтобы ее можно было применять в больших масштабах, теряет свою актуальность. Все чаще появляются такие сервисы, как Google Visionor IBM Watson, позволяющие компаниям опираться на существующие нейронные сети вместо того, чтобы разрабатывать их с нуля. Благодаря этому в будущем глубокое обучение будет все больше и больше использовать свои сильные стороны в корпоративной практике.

Обзор сильных сторон

  • Лучшие результаты, чем при использовании других методов машинного обучения
  • Нет необходимости в разработке функций и маркировке данных
  • Эффективное выполнение рутинных задач без ущерба для качества
  • Беспроблемная работа с неструктурированными данными
  • Все больше сервисов, облегчающих использование искусственных нейронных сетей

Слабые стороны глубокого обучения

Глубокое обучение требует огромной вычислительной мощности для поддержания нейронных сетей и обработки большого количества необходимых данных. Вычислительная мощность во многом зависит от сложности и трудности решаемой задачи и размера используемого набора данных. До сих пор это делало технологию дорогой и применимой только для научных исследований и нескольких мегакорпораций.

В этом отношении действительно наблюдается заметный прогресс. Но что не изменится в обозримом будущем, так это тот факт, что решения, принимаемые глубоким обучением, больше не прозрачны для человека. Нейронная сеть (пока) является «черным ящиком». Для некоторых приложений, где прозрачность имеет решающее значение, это делает технологию неактуальной.

Для того чтобы глубокое обучение вообще работало, необходимы большие наборы обучающих данных. Если такие объемы данных недоступны, компьютеры пока не могут обеспечить надежные результаты с помощью глубокого обучения. Первые библиотеки нейронных сетей действительно публикуются, что облегчает применение глубокого обучения для широкой публики. Однако эти сервисы подходят не для каждого приложения, а это значит, что разработка алгоритмов глубокого обучения по-прежнему требует больших временных затрат и потенциально занимает больше времени, чем использование альтернативных методов.

Слабые стороны с первого взгляда

  • Требуется высокая вычислительная мощность
  • Разработка алгоритмов обучения занимает относительно много времени
  • Необходим большой массив данных
  • Требуется больше обучающих данных, чем при использовании других методов машинного обучения
  • Решения трудно или невозможно понять (черный ящик)

Области применения глубокого обучения

Глубокое обучение уже применяется в различных отраслях, а в будущем мы столкнемся с ним во многих других областях нашей повседневной жизни.

Пользовательский опыт

Некоторые чат-боты уже оптимизируются с помощью глубокого обучения, чтобы они могли все лучше и лучше реагировать на запросы клиентов и облегчить нагрузку на человеческую службу поддержки.

Голосовые помощники

Как уже упоминалось, глубокое обучение используется для различных голосовых помощников, таких как Alexa, Google Assistant и Siri, которые самостоятельно расширяют свой словарный запас и понимание речи.

Перевод

Глубокое обучение уже используется в некоторых переводческих программах. Благодаря этой технологии даже диалекты и текст на изображениях могут быть автоматически переведены на другие языки, что было невозможно с предыдущими приложениями машинного обучения, которые полагаются на структурированные данные.

Создание текстов

С помощью глубокого обучения компьютеры способны создавать тексты, не только правильные с точки зрения грамматики и орфографии, но даже имитировать стиль автора — при условии, что им предоставлено достаточно обучающего материала. В ходе первых испытаний системы искусственного интеллекта с помощью глубокого обучения создали статьи для Википедии и обманчиво реалистичные шекспировские тексты.

Кибербезопасность

Системы ИИ с глубоким обучением, благодаря своей независимой и непрерывной обучаемости, особенно хорошо приспособлены для выявления нарушений в деятельности системы, что означает, что они могут предупреждать о возможных хакерских атаках. Система может консультировать видеоматериалы, чтобы лучше защитить особо уязвимые места, такие как аэропорты, потому что компьютер способен распознать отклонения от нормы в обычной работе аэропорта.

Финансы

Способность обнаруживать аномалии может быть с успехом использована и в такой деликатной сфере, как финансовые операции. Если алгоритм обучен соответствующим образом, атаки на банковские сети и мошенничество с кредитными картами могут быть отражены более эффективно, чем это было возможно в прошлом.

Маркетинг и дистрибуция

С помощью глубокого обучения системы ИИ могут проводить анализ настроений, то есть отфильтровывать гневные сообщения от клиентов (в чате и по электронной почте), чтобы затем передать их коллегам-людям в качестве приоритетных.

Системы также могут автономно принимать определенные меры для восстановления удовлетворенности клиентов и предотвращения отмены заказа. Оценивая данные о клиентах, собранные в CRM, системы с искусственным интеллектом глубокого обучения могут также делать прогнозы о том, как клиент будет вести себя в будущем, чтобы принять целевые меры для клиентов, готовых к покупке, или клиентов, рассматривающих возможность отмены заказа.

Автономное вождение

Автомобили без водителей-людей, безопасно участвующие в дорожном движении, все еще остаются футуристической идеей. Однако такая технология уже существует, сочетая в себе различные алгоритмы глубокого обучения: Например, один алгоритм распознает дорожные знаки, а другой специализируется на определении местонахождения пешеходов.

Промышленные роботы

Роботы с искусственным интеллектом глубокого обучения могут быть задействованы во многих отраслях промышленности. Просто наблюдая за человеком, системы могут узнать, как нужно обращаться с машинами, а затем оптимизировать свое поведение.

Техническое обслуживание

В частности, в области промышленного технического обслуживания есть важные возможные применения. Для сложных систем необходимо постоянно контролировать множество параметров, чтобы гарантировать безопасность. Глубокое обучение может не только контролировать эти сложные системы, чтобы гарантировать, что они работают без ошибок, но и прогнозировать, какие части системы потребуют обслуживания в ближайшем будущем (предиктивное обслуживание).

Медицина

ИИ глубокого обучения может сканировать изображения на предмет аномалий гораздо точнее, чем человеческий глаз, даже хорошо натренированный. С помощью интеллектуальных систем компьютерная томография или рентгеновские снимки могут быть использованы для выявления заболеваний раньше, чем раньше, что повышает шансы пациента на выздоровление.

Глубокое обучение: Большой потенциал, но не универсальное решение

В публичных дискуссиях в определенной степени создается впечатление, что глубокое обучение — это единственная технология будущего для ИИ. Это правда, что во многих прикладных областях глубокое обучение позволяет добиться гораздо лучших результатов, чем предыдущие процедуры. Огромный потенциал искусственных нейронных сетей еще далеко не реализован, и их применение все еще находится в зачаточном состоянии.

Однако глубокое обучение не является лучшим технологическим решением для каждой проблемы. Существуют и другие стратегии, позволяющие сделать компьютеры «умными», — решения, которые также могут работать с небольшими наборами данных и в которых принятие решений прозрачно для человека.

Некоторые исследователи ИИ рассматривают глубокое обучение как переходное явление и считают, что появятся более совершенные подходы, не основанные на человеческом мозге. Стратегия компании Google доказывает, что эти критические голоса не стоит игнорировать: Там глубокое обучение является лишь одной из составляющих стратегии ИИ. Наряду с ним существуют и другие методы машинного обучения, например, разработка квантовых компьютеров.

Оцените статью
cdelat.ru
Добавить комментарий