Контролирано, неконтролирано и обучение с подсилване са три различни подхода в областта на машинното обучение. Всеки подход използва различни техники и алгоритми за справяне с различни видове проблеми и постигане на конкретни цели. Нека проучим разликите между тези подходи и да предоставим изчерпателно обяснение на техните характеристики и приложения.
Наблюдаваното обучение е вид машинно обучение, при което алгоритъмът се учи от етикетирани данни. Маркираните данни се състоят от входни примери, съчетани със съответните им правилни изходни или целеви стойности. Целта на контролираното обучение е да се обучи модел, който може точно да предвиди изхода за нови, невиждани входове. Алгоритъмът за обучение използва етикетираните данни, за да изведе модели и връзки между входните характеристики и изходните етикети. След това обобщава тези знания, за да прави прогнози за нови, немаркирани данни. Наблюдаваното обучение обикновено се използва при задачи като класификация и регресия.
Например, в проблем с класификацията, алгоритъмът се обучава върху набор от данни, където всяка точка от данни е обозначена със специфичен клас. Алгоритъмът се научава да класифицира нови, невиждани точки от данни в един от предварително дефинираните класове въз основа на моделите, които е научил от обозначените примери. В регресионен проблем алгоритъмът се научава да прогнозира непрекъсната числова стойност въз основа на входните характеристики.
Неконтролираното обучение, от друга страна, се занимава с немаркирани данни. Целта на неконтролираното обучение е да се открият скрити модели, структури или връзки в данните без предварително познаване на изходните етикети. За разлика от контролираното обучение, алгоритмите за неконтролирано обучение нямат изрични целеви стойности, които да ръководят процеса на обучение. Вместо това те се фокусират върху намирането на смислени представяния или клъстери в данните. Обучението без надзор обикновено се използва при задачи като групиране, намаляване на размерността и откриване на аномалии.
Клъстерирането е популярно приложение на обучение без надзор, при което алгоритъмът групира подобни точки от данни заедно въз основа на техните присъщи свойства. Например, при сегментирането на клиенти, алгоритъм за неконтролирано обучение може да се използва за идентифициране на отделни групи клиенти въз основа на тяхното поведение при покупка или демографска информация.
Обучението с подсилване е различна парадигма, при която агент се научава да взаимодейства с околната среда, за да увеличи максимално кумулативния сигнал за награда. При обучението с подсилване алгоритъмът се учи чрез процес на проба и грешка, като предприема действия, наблюдава състоянието на околната среда и получава обратна връзка под формата на награди или наказания. Целта е да се намери оптимална политика или набор от действия, които максимизират дългосрочната награда. Обучението с подсилване обикновено се използва в задачи като игра на игри, роботика и автономни системи.
Например, в играта на шах агентът за обучение за подсилване може да се научи да играе, като изследва различни ходове, получава награди или наказания въз основа на резултата от всеки ход и коригира стратегията си, за да увеличи максимално шансовете за победа.
Наблюдаваното обучение използва етикетирани данни, за да обучи модел за задачи за прогнозиране, неконтролираното обучение открива модели и структури в немаркирани данни, а обучението с подсилване се учи чрез взаимодействие с околната среда, за да увеличи максимално сигнала за награда. Всеки подход има своите силни и слаби страни и е подходящ за различни видове проблеми и приложения.
Други скорошни въпроси и отговори относно EITC/AI/GCML Google Cloud Machine Learning:
- Какво е текст към реч (TTS) и как работи с AI?
- Какви са ограниченията при работа с големи набори от данни в машинното обучение?
- Може ли машинното обучение да окаже някаква диалогична помощ?
- Какво представлява детската площадка TensorFlow?
- Какво всъщност означава по-голям набор от данни?
- Кои са някои примери за хиперпараметри на алгоритъма?
- Какво представлява ансамбълното обучение?
- Какво става, ако избраният алгоритъм за машинно обучение не е подходящ и как може човек да се увери, че е избрал правилния?
- Нуждае ли се моделът за машинно обучение от надзор по време на обучението си?
- Какви са ключовите параметри, използвани в алгоритми, базирани на невронни мрежи?
Вижте още въпроси и отговори в EITC/AI/GCML Google Cloud Machine Learning