Маркираните данни в контекста на изкуствения интелект (AI) и по-специално в домейна на Google Cloud Machine Learning се отнасят до набор от данни, който е анотиран или маркиран със специфични етикети или категории. Тези етикети служат като основна истина или справка за обучение на алгоритми за машинно обучение. Чрез свързване на точки от данни със съответните им етикети, моделът за машинно обучение може да се научи да разпознава модели и да прави прогнози въз основа на нови, невиждани данни.
Маркираните данни играят решаваща роля в контролираното обучение, което е често срещан подход в машинното обучение. При контролирано обучение моделът се обучава върху етикетиран набор от данни, за да научи връзката между входните характеристики и съответните им изходни етикети. Този процес на обучение позволява на модела да обобщи знанията си и да направи точни прогнози за нови, невиждани данни.
За да илюстрираме тази концепция, нека разгледаме пример за задача за машинно обучение в областта на разпознаването на изображения. Да предположим, че искаме да изградим модел, който може да класифицира изображения на животни в различни категории като котки, кучета и птици. Ще ни трябва етикетиран набор от данни, където всяко изображение е свързано с правилния етикет. Например, изображение на котка ще бъде означено като "котка", изображение на куче като "куче" и т.н.
Маркираният набор от данни ще се състои от колекция от изображения и съответните им етикети. Всяко изображение ще бъде представено от набор от функции, като стойности на пиксели или представяния от по-високо ниво, извлечени от изображението. Етикетите ще показват правилната категория или клас, към който принадлежи всяко изображение.
По време на фазата на обучение моделът за машинно обучение ще бъде представен с етикетирания набор от данни. Ще се научи да идентифицира модели и връзки между входните характеристики и съответните етикети. Моделът ще актуализира вътрешните си параметри, за да сведе до минимум разликата между своите прогнози и истинските етикети в данните за обучение.
След като моделът бъде обучен, той може да се използва за правене на прогнози за нови, невиждани изображения. Като се има предвид немаркирано изображение, моделът ще анализира характеристиките му и ще предвиди най-вероятния етикет въз основа на своите научени знания от етикетирания набор от данни. Например, ако моделът прогнозира, че дадено изображение съдържа котка, това означава, че той е разпознал модели в изображението, които са показателни за котка.
Маркираните данни са основен компонент в обучението на модели за машинно обучение. Той предоставя необходимата информация, от която моделът да се учи и да прави точни прогнози. Чрез свързване на точки от данни с техните съответни етикети, моделът може да се научи да разпознава модели и да обобщава знанията си към невиждани данни.
Други скорошни въпроси и отговори относно EITC/AI/GCML Google Cloud Machine Learning:
- Какво е текст към реч (TTS) и как работи с AI?
- Какви са ограниченията при работа с големи набори от данни в машинното обучение?
- Може ли машинното обучение да окаже някаква диалогична помощ?
- Какво представлява детската площадка TensorFlow?
- Какво всъщност означава по-голям набор от данни?
- Кои са някои примери за хиперпараметри на алгоритъма?
- Какво представлява ансамбълното обучение?
- Какво става, ако избраният алгоритъм за машинно обучение не е подходящ и как може човек да се увери, че е избрал правилния?
- Нуждае ли се моделът за машинно обучение от надзор по време на обучението си?
- Какви са ключовите параметри, използвани в алгоритми, базирани на невронни мрежи?
Вижте още въпроси и отговори в EITC/AI/GCML Google Cloud Machine Learning