Процесът на обучение на модел за машинно обучение включва излагането му на огромни количества данни, за да може да научи модели и да прави прогнози или решения, без да бъде изрично програмиран за всеки сценарий. По време на фазата на обучение моделът за машинно обучение претърпява поредица от итерации, при които коригира вътрешните си параметри, за да минимизира грешките и да подобри ефективността си при дадена задача.
Надзорът по време на обучението се отнася до нивото на човешка намеса, необходимо за насочване на учебния процес на модела. Нуждата от надзор може да варира в зависимост от вида на използвания алгоритъм за машинно обучение, сложността на задачата и качеството на данните, предоставени за обучение.
При контролираното обучение, което е вид машинно обучение, при което моделът се обучава върху етикетирани данни, надзорът е от съществено значение. Маркираните данни означават, че всяка входна точка от данни е свързана с правилния изход, което позволява на модела да научи картографирането между входове и изходи. По време на контролирано обучение се изисква човешки надзор, за да се осигурят правилните етикети за данните за обучение, да се оценят прогнозите на модела и да се коригират параметрите на модела въз основа на обратна връзка.
Например, в контролирана задача за разпознаване на изображения, ако целта е да се обучи модел да класифицира изображения на котки и кучета, човешкият надзорник ще трябва да обозначи всяко изображение като котка или куче. След това моделът ще се научи от тези обозначени примери, за да прави прогнози за нови, невиждани изображения. Надзорният орган ще оцени прогнозите на модела и ще предостави обратна връзка, за да подобри неговата точност.
От друга страна, алгоритмите за обучение без надзор не изискват етикетирани данни за обучение. Тези алгоритми научават модели и структури от входните данни без изрични указания. Неконтролираното обучение често се използва за задачи като групиране, откриване на аномалии и намаляване на размерността. При обучение без надзор машината може да се учи самостоятелно, без да е необходимо човешко наблюдение по време на обучението.
Полуконтролираното обучение е хибриден подход, който съчетава елементи както на контролирано, така и на неконтролирано обучение. При този подход моделът се обучава на комбинация от етикетирани и немаркирани данни. Маркираните данни осигуряват известно наблюдение за насочване на процеса на обучение, докато немаркираните данни позволяват на модела да открие допълнителни модели и връзки в данните.
Обучението с подсилване е друга парадигма на машинното обучение, при която агентът се научава да взема последователни решения чрез взаимодействие с околната среда. При обучението с подсилване агентът получава обратна връзка под формата на награди или наказания въз основа на своите действия. Агентът се научава да максимизира своята кумулативна награда с течение на времето чрез проба и грешка. Докато ученето с подсилване не изисква изрично наблюдение в традиционния смисъл, може да е необходимо човешко наблюдение, за да се проектира структурата на възнаграждението, да се определят учебните цели или да се прецизира учебният процес.
Необходимостта от надзор по време на обучението за машинно обучение зависи от използваната парадигма на обучение, наличието на етикетирани данни и сложността на задачата. Наблюдаваното обучение изисква човешки надзор, за да предостави етикетирани данни и да оцени ефективността на модела. Обучението без надзор не изисква надзор, тъй като моделът се учи независимо от немаркирани данни. Полуконтролираното обучение съчетава елементи от контролирано и неконтролирано обучение, докато обучението с подсилване включва учене чрез взаимодействие с околната среда.
Други скорошни въпроси и отговори относно EITC/AI/GCML Google Cloud Machine Learning:
- Какво е текст към реч (TTS) и как работи с AI?
- Какви са ограниченията при работа с големи набори от данни в машинното обучение?
- Може ли машинното обучение да окаже някаква диалогична помощ?
- Какво представлява детската площадка TensorFlow?
- Какво всъщност означава по-голям набор от данни?
- Кои са някои примери за хиперпараметри на алгоритъма?
- Какво представлява ансамбълното обучение?
- Какво става, ако избраният алгоритъм за машинно обучение не е подходящ и как може човек да се увери, че е избрал правилния?
- Какви са ключовите параметри, използвани в алгоритми, базирани на невронни мрежи?
- Какво е TensorBoard?
Вижте още въпроси и отговори в EITC/AI/GCML Google Cloud Machine Learning