Самообучающиеся системы: как работает машинное обучение?

Искусственный интеллект является важной частью процесса цифровизации, который оказывает неизгладимое влияние на наше общество. То, что еще несколько лет назад относилось к области научной фантастики, сегодня стало реальностью: мы разговариваем с компьютерами, используем смартфоны, которые показывают нам самый быстрый путь до ближайшей заправки, а наши часы знают, достаточно ли шагов мы сделали за день. Технологии становятся все более интеллектуальными, поскольку ученые, инженеры и программисты учат компьютеры учиться самостоятельно.

Машинное обучение интересно не только научным и IT-компаниям, таким как Google или Microsoft, мир онлайн-маркетинга также может измениться благодаря развитию искусственного интеллекта. В следующем тексте мы расскажем, как развивался искусственный интеллект (ИИ) за последние несколько лет, что именно можно понимать под машинным обучением, какие методы машинного обучения существуют и почему маркетологам стоит полагаться на самообучающиеся системы.

История самообучающейся системы

Роботы и машины занимают человечество уже несколько веков. Авторы романтических романов уже имели дело с искусственным интеллектом, и даже сегодня роботы в книгах, фильмах и компьютерных играх по-прежнему завораживают нас. Отношения между людьми и мыслящими машинами всегда колебались между страхом и восхищением. Однако реальные усилия в направлении машинного обучения начались лишь в 1950-х годах, когда компьютеры еще только зарождались, а об искусственном интеллекте можно было только мечтать. За два столетия до этого такие теоретики, как Томас Байес, Адриен-Мари Лежандр и Пьер-Симон Лаплас, уже заложили основы для последующих исследований, но только благодаря работе Алана Тьюринга идея адаптивных машин приобрела конкретный смысл.

Цитата

«В таком случае придется признать, что прогресс машины не был предусмотрен, когда в нее были заложены первоначальные инструкции. Это было бы похоже на ученика, который многому научился у своего учителя, но гораздо больше добавил к этому своей собственной работой. Когда такое происходит, я считаю, что машину следует рассматривать как проявление интеллекта».

Алан Тьюринг на лекции в 1947 году. (Цитируется по книге Б. Э. Карпентера и Р. В. Дорана (ред.) «Отчет А. М. Тьюринга о тузах в 1946 году и другие работы»).

В 1950 году Тьюринг разработал тест Тьюринга, своего рода игру, в которой компьютер притворяется человеком. Если испытуемый не понимает, что разговаривает не с реальным человеком, значит, машина прошла тест. В то время этот тест был не очень развит, но всего через два года Артур Самуэль создал компьютер, который мог играть в шашки — и с каждой партией он становился все лучше. Программа обладала способностью к обучению. Наконец, в 1957 году Фрэнк Розенблатт разработал перцептрон, который стал одной из первых искусственных нейронных сетей. 

С этого момента ученые стали доверять компьютерам еще более сложные мыслительные задачи. Машины справлялись с этими задачами иногда очень хорошо, а иногда не очень. В то же время крупные компании стали одной из движущих сил развития машинного обучения: IBM разработала Watson — компьютер, обладающий огромным хранилищем знаний и способный отвечать на вопросы, заданные на естественном языке. Этот компьютер также использовался в известном телешоу «Jeopardy» и в итоге победил! (Это событие было похоже на шахматное соревнование 1997 года между чемпионом мира Гарри Каспаровым и другим компьютером IBM, Deep Blue. В этом случае тоже победила машина).

Google и Facebook используют машинное обучение, чтобы лучше понять своих пользователей и предоставить им больше возможностей. DeepFace от Facebook теперь может определять лица на изображениях с точностью 97 %. Благодаря проекту Google Brain, поисковый гигант уже значительно улучшил функцию распознавания речи в операционной системе Android, а также поиск фотографий в Google+ и рекомендации видео на YouTube.

Что такое машинное обучение?

По сути, машины, компьютеры и программы работают только так, как их запрограммировали: «Когда происходит случай А, вы делаете Б». Однако наши ожидания от современных компьютерных систем растут, и программисты не могут предсказать все возможные случаи и подготовить к ним свой компьютер. Поэтому необходимо, чтобы программное обеспечение принимало самостоятельные решения и адекватно реагировало на неизвестные ситуации. Алгоритмы необходимы для того, чтобы программа могла обучаться. Это означает, что сначала им скармливают данные, чтобы потом понять их и провести ассоциации.

В связи с самообучающимися системами часто возникают смежные термины, с которыми нужно быть знакомым, чтобы лучше понимать машинное обучение.

Искусственный интеллект

Исследования, связанные с искусственным интеллектом (ИИ), направлены на создание машин, которые могут действовать как люди: компьютеры и роботы должны анализировать окружающую среду, чтобы принять наилучшее возможное решение. Они должны вести себя как можно более разумно — в соответствии с нашими стандартами. Это тоже проблема, поскольку мы не знаем, по каким критериям судить об интеллекте. В настоящее время ИИ не может имитировать человека полностью (включая эмоциональный интеллект). Вместо этого изолируются отдельные аспекты, чтобы справиться с конкретными задачами. Это обычно называют «слабым искусственным интеллектом».

Нейронные сети

Направление исследований в области искусственного интеллекта, нейроинформатика, нацелено на создание компьютеров, максимально приближенных к мозгу. Это направление рассматривает нервную систему как абстрактную, то есть освобожденную от биологических свойств и ограниченную режимом работы. Искусственные нейронные сети — это прежде всего математические, абстрактные методы, а не реальные проявления. Это как бы сеть нейронов (математических функций или алгоритмов), которая может справляться со сложными задачами, подобно человеческому мозгу. Нити между нейронами различаются по силе и могут адаптироваться к проблемам.

Большие данные

Термин «Большие данные» просто означает, что речь идет об огромном количестве данных. Однако не существует определенного момента, когда данные становятся большими данными. Тот факт, что в последние годы это явление привлекает все больше внимания СМИ, объясняется тем, откуда берутся эти данные: во многих случаях поток информации образуется из данных о пользователях (интересы, профили передвижения, жизненно важные данные), собираемых такими компаниями, как Google, Amazon и Facebook, чтобы более точно адаптировать предложения для клиентов. Такие объемы данных уже не могут быть удовлетворительно оценены традиционными компьютерными системами: обычное программное обеспечение находит только то, что ищет пользователь. Поэтому необходимы самообучающиеся системы, способные обнаружить ранее неизвестные связи.

Добыча данных

Добыча данных — это название, данное анализу Больших Данных. С просто собранными данными многого не сделаешь: они становятся интересными только тогда, когда из них извлекаются и оцениваются соответствующие характеристики — подобно добыче золота. Добыча данных отличается от машинного обучения тем, что первое в первую очередь занимается тем, как используются распознанные закономерности, а второе — поиском новых закономерностей.

Различные методы машинного обучения

В основном разработчики различают контролируемое обучение и неконтролируемое обучение, с постепенными промежуточными этапами. Используемые алгоритмы сильно отличаются друг от друга. При контролируемом обучении система получает примеры. Разработчики указывают значение соответствующей информации, например, относится ли она к категории А или В. Самообучающаяся система делает из этого выводы, распознает закономерности и может лучше справляться с неизвестными данными. Цель состоит в том, чтобы максимально снизить коэффициент ошибок.

Известным примером самообучения являются спам-фильтры: система использует характеристики, чтобы решить, следует ли отправить письмо в папку «Входящие» или переместить его в папку «Спам». Если система допустила ошибку, вы можете внести коррективы вручную, и фильтр соответствующим образом скорректирует свои дальнейшие вычисления. Таким образом, программа достигает постоянно лучших результатов. Подобные программы-фильтры основаны на байесовской фильтрации спама (из теории вероятности), поэтому их также называют байесовскими фильтрами (также известными как фильтры Байеса).

Неконтролируемое обучение не нуждается в «учителе», в отличие от контролируемого обучения, где он необходим, чтобы указать, что к чему относится, и дать обратную связь для принятия системой самостоятельных решений. Вместо этого программа пытается самостоятельно распознать закономерности. Например, с помощью кластеризации: элемент выбирается из данных, исследуется на предмет его характеристик, а затем сравнивается с элементами, которые уже были исследованы. Если уже были исследованы эквивалентные элементы, то текущий объект будет добавлен к ним. Если это не так, он будет храниться изолированно.

Системы, основанные на бесконтрольном обучении, реализуются в нейронных сетях. Примеры применения можно найти в сетевой безопасности: самообучающаяся система обнаруживает аномальное поведение. Например, поскольку кибератаку нельзя отнести к известной группе, программа может обнаружить угрозу и поднять тревогу.

Помимо этих двух основных направлений, существуют также полусамостоятельное обучение, обучение с подкреплением и активное обучение: эти три метода более тесно связаны с самоконтролируемым обучением и отличаются типом и степенью участия пользователя.

Кроме того, проводится различие между поверхностным и глубоким обучением. Если первое — это относительно простой метод, результаты которого довольно поверхностны, то глубокое обучение касается более сложных наборов данных. Они сложнее, потому что состоят из естественной информации, например, информации, возникающей при речи, почерке или распознавании лиц. Естественные данные легко обрабатываются человеком, но не машиной, поскольку их математически трудно понять.

Глубокое обучение и искусственные нейронные сети тесно связаны между собой. Способ обучения нейронных сетей можно назвать глубоким обучением. Глубоким оно называется потому, что сеть нейронов состоит из нескольких иерархических уровней. Первый уровень начинается со слоя входных нейронов. Они записывают данные, начинают их анализ и отправляют свои результаты на следующий нейронный узел. В конце концов, все более уточненная информация достигает начального уровня, и сети выдают значение. Многочисленные уровни, расположенные между входом и выходом, называются скрытыми слоями.

В целях защиты вашей конфиденциальности видео не будет загружаться, пока вы не нажмете на него.

 

Поиск изображений Google можно использовать в качестве примера для демонстрации глубокого обучения. Сеть, стоящая за алгоритмом поиска, выводит на экран только изображения кошек, если вы искали, например, кошек. Это работает потому, что самообучающаяся система Google может распознавать объекты на изображении. Когда Google добавляет новое изображение в свой каталог, начальные нейроны системы обрабатывают данные (для компьютеров изображения состоят исключительно из цифр).

Проходя по слоям, сеть отфильтровывает необходимую информацию, пока не сможет решить, какие объекты видны на изображении, например, кошка. На этапе обучения разработчики присваивают каждому изображению определенную категорию, чтобы система могла обучаться. Если машина выдает неправильные результаты, например, изображения собак вместо кошек, разработчики могут адаптировать отдельные нейроны. Как и наш мозг, они имеют различные весовые коэффициенты и пороговые уровни, которые можно регулировать в самообучающейся системе.

Как машинное обучение работает для маркетинга?

Машинное обучение уже имеет важные функции для маркетинга. Однако в настоящее время эти функции используют в основном крупные компании, такие как Google. Системы самообучения еще настолько новы, что их нельзя просто купить в качестве готового решения. Вместо этого популярные интернет-провайдеры разрабатывают свои собственные системы и поэтому являются движущей силой в этом секторе. Однако, поскольку некоторые из них имеют открытый исходный код и работают на основе независимых исследований, несмотря на коммерческий интерес, развитие в этой области происходит еще быстрее.

Помимо творческой стороны, маркетинг всегда имел и аналитический аспект: Статистика поведения клиентов (покупательское поведение, количество посетителей сайта, использование приложений и т.д.) играет важную роль в принятии решения о том, какие конкретные рекламные меры использовать. Чем больше данных, тем больше информации из них можно извлечь. Для обработки такого большого количества данных необходимы интеллектуальные программы. Именно здесь в игру вступают самообучающиеся системы: Компьютерные программы обучаются распознавать закономерности и могут делать обоснованные прогнозы, что в противном случае весьма ограничивает возможности людей, которые склонны относиться к данным предвзято.

Аналитик обычно подходит к измеренным данным с определенными ожиданиями. Эти предубеждения трудно не иметь заранее, и они часто могут привести к разочарованию результатами. Чем больший объем данных обрабатывает аналитик, тем большее отклонение может быть. Хотя интеллектуальные машины также могут быть предвзятыми.

Самообучающиеся системы также улучшают и облегчают способ представления результатов анализа: Автоматизированная визуализация данных — это техника, при которой компьютер автоматически выбирает наилучший способ представления данных и информации. Это особенно важно для того, чтобы люди могли понять, что обнаружила и предсказала машина. При таком большом количестве данных становится трудно отобразить результаты самостоятельно. Поэтому имеет смысл, чтобы результаты представил компьютер.

Машинное обучение также может повлиять на создание контента — ключевым словом здесь является генеративный дизайн. Вместо того чтобы разрабатывать одинаковый путь клиента для всех пользователей (т.е. шаги, которые клиент предпринимает для приобретения продукта или услуги), динамические системы могут создавать индивидуальный опыт на основе машинного обучения. Контент, отображаемый пользователю на сайте, по-прежнему создается копирайтерами и дизайнерами, но система интегрирует компоненты специально для пользователя. В то же время самообучающиеся системы используются и для самостоятельного проектирования: в проекте Dreamcatcher можно получить компоненты, разработанные машиной.

Машинное обучение также можно использовать, например, для улучшения чат-ботов. Многие компании уже используют программы, которые выполняют часть работы по поддержке клиентов с помощью чат-бота. Но во многих случаях пользователей быстро раздражают автоматические операторы: Возможности существующих чат-ботов обычно очень ограничены, а варианты ответов основаны на базах данных, которые ведутся вручную. Чатбот, основанный на самообучающейся системе с хорошим распознаванием речи (NLP), может создать у клиентов ощущение, что они общаются с реальным человеком — и, следовательно, пройти тест Тьюринга.

Amazon или Netflix сделали еще одну важную разработку в области машинного обучения для маркетологов: рекомендации. Основным фактором успеха этих провайдеров является предсказание того, что пользователь захочет сделать дальше. В зависимости от собранных данных, самообучающиеся системы могут рекомендовать пользователю дополнительные продукты. То, что раньше было возможно только в больших и не очень личных масштабах («Нашим клиентам нравится продукт A, значит, им понравится и продукт B»), теперь возможно и в малых масштабах благодаря современным программам («Клиенту X понравились продукты A, B и C, поэтому ему наверняка понравится продукт D»).

В целом, самообучающиеся системы будут влиять на интернет-маркетинг четырьмя важными способами:

  1. Количество: Программы, работающие с машинным обучением и прошедшие хорошую подготовку, могут обрабатывать большие объемы данных и делать прогнозы на будущее. Таким образом маркетологи делают выводы об успехе или провале кампаний.
  2. Скорость: Анализ занимает много времени — если его приходится проводить вручную. Самообучающиеся системы повышают скорость работы и позволяют быстрее реагировать на изменения.
  3. Автоматизация: Машинное обучение облегчает автоматизацию операций. Поскольку современные системы могут самостоятельно адаптироваться к новым условиям с помощью машинного обучения, возможны и сложные автоматизированные процессы.
  4. Индивидуальность: Компьютерные программы могут обслуживать бесчисленное множество клиентов. Поскольку самообучающиеся системы собирают и обрабатывают данные отдельных пользователей, они могут оказывать всестороннюю поддержку и этим клиентам. Индивидуальные рекомендации и специально разработанные путешествия клиентов помогают повысить эффективность маркетинговых мероприятий.

 

 

Другие области применения самообучающихся систем

В то время как машинное обучение уже все чаще используется в маркетинге, самообучающиеся системы находят все большее применение во многих других областях нашей жизни. В некоторых случаях они помогают в науке и технике, способствуя прогрессу. Однако в некоторых случаях они также используются в виде иногда больших, иногда меньших гаджетов, призванных упростить нашу повседневную жизнь. Различные варианты использования, представленные в этой статье, являются лишь примерами. Можно предположить, что в недалеком будущем машинное обучение будет влиять на всю нашу жизнь.

Наука

То, что применимо к маркетингу, еще более важно в науке. Интеллектуальная обработка Больших Данных — это огромное облегчение для ученых, занимающихся эмпирическими исследованиями. Физики элементарных частиц, например, могут использовать самообучающиеся системы для записи и обработки гораздо большего количества измеренных данных и, соответственно, обнаружения отклонений. Машинное обучение помогает и в медицине: уже сегодня некоторые врачи используют искусственный интеллект для диагностики и лечения. Машинное обучение также используется для прогнозирования таких заболеваний, как диабет и сердечные приступы.

Роботы

Роботы повсюду, особенно на заводах. Они помогают, например, в массовом производстве, если их запрограммировать на выполнение последовательных рабочих операций. Однако зачастую они имеют мало общего с интеллектуальными системами, поскольку запрограммированы только на выполнение той работы, которую они выполняют. Если в робототехнике будут использоваться самообучающиеся системы, то эти машины также должны быть способны осваивать новые задачи. Разумеется, эти разработки очень интересны и для других областей: от космических путешествий до дома, роботы с искусственным интеллектом будут использоваться во многих сферах.

Дорожное движение

Одним из главных флагманов машинного обучения является самоуправляемый или автономный автомобиль. Транспортные средства могут самостоятельно маневрировать в реальном дорожном движении, не вызывая аварий. Этого можно достичь только с помощью машинного обучения, поскольку невозможно запрограммировать все ситуации, которые могут произойти. По этой причине крайне важно, чтобы автомобили могли самостоятельно ориентироваться в дорожной обстановке с помощью интеллектуальных машин. Самообучающиеся системы могут произвести революцию не только в транспортном секторе: интеллектуальные алгоритмы, например, в виде искусственных нейронных сетей, могут анализировать дорожное движение и разрабатывать более эффективные системы управления движением, такие как светофоры.

Интернет

Машинное обучение уже играет важную роль в Интернете. Спам-фильтры уже упоминались: благодаря постоянному обучению фильтры для нежелательной электронной почты становятся все лучше и надежнее, когда дело доходит до изгнания спама из вашего почтового ящика. То же самое касается интеллектуальных мер защиты от вирусов и вредоносных программ, которые более эффективно защищают компьютеры от вредоносных программ. Алгоритмы ранжирования поисковых систем — особенно RankBrain от Google — также являются самообучающимися системами. Даже если алгоритм не знает, что делать с введенными пользователем данными (потому что никто еще не искал их), он может сделать предположение о том, что должно соответствовать запросу.

Персональные помощники

Компьютерные системы, способные постоянно обучаться, играют важную роль и в вашем доме. Так простые дома превращаются в умные дома. Например, компания Moley Robotics разрабатывает интеллектуальную кухню, которая использует свои механические руки для приготовления еды. Персональные помощники, такие как Google Home и Amazon Echo [Google Home vs. Amazon Echo — ein Vergleich] (https://www.ionos.de/digitalguide/online-marketing/web-analyse/google-home-vs-amazon-echo-ein-vergleich/), также используют технологии машинного обучения, помогающие им лучше понимать своих пользователей. Но многие люди теперь постоянно носят своих помощников с собой: С помощью Siri, Cortana или Google Assistant пользователи могут использовать голосовое управление для отправки команд и вопросов на свои смартфоны.

Игры

С самого начала исследований в области искусственного интеллекта ученых очень интересовало, насколько хорошо машины умеют играть в игры. Самообучающиеся системы соревновались с людьми в шахматах, шашках и китайской игре Го (вероятно, самой сложной настольной игре в мире). Разработчики компьютерных игр также используют машинное обучение, чтобы сделать свои игры более интересными. Разработчики игр могут использовать машинное обучение для создания максимально сбалансированного игрового процесса и обеспечения того, чтобы компьютерные противники разумно адаптировались к поведению игроков.

В целях защиты вашей конфиденциальности видео не будет загружаться, пока вы не нажмете на него.

Оцените статью
cdelat.ru
Добавить комментарий