Cloud Machine Learning Engine (CMLE) е мощен инструмент, предоставен от Google Cloud Platform (GCP) за обучение на модели за машинно обучение по разпределен и паралелен начин. Той обаче не предлага автоматично придобиване и конфигуриране на ресурс, нито обработва изключване на ресурс след приключване на обучението на модела. В този отговор ще разгледаме подробностите за CMLE, неговите възможности и необходимостта от ръчно управление на ресурсите.
CMLE е предназначен да опрости процеса на обучение и внедряване на модели за машинно обучение в мащаб. Той предоставя управлявана среда, която позволява на потребителите да се съсредоточат върху разработването на модели, а не върху управлението на инфраструктурата. CMLE използва силата на инфраструктурата на GCP, за да разпредели обучителното натоварване между множество машини, което позволява по-бързо време за обучение и обработка на големи масиви от данни.
Когато използват CMLE, потребителите имат гъвкавостта да избират вида и броя на ресурсите, необходими за тяхната обучителна работа. Те могат да избират тип машина, брой работници и други параметри въз основа на техните специфични изисквания. CMLE обаче не придобива и конфигурира автоматично тези ресурси. Отговорност на потребителя е да осигури необходимите ресурси, преди да започне обучението.
За да придобият ресурсите, потребителите могат да използват GCP услуги като Compute Engine или Kubernetes Engine. Тези услуги предоставят мащабируема и гъвкава инфраструктура, която да поеме натовареността от обучение. Потребителите могат да създават екземпляри или контейнери на виртуална машина, да ги конфигурират с необходимите софтуерни зависимости и след това да ги използват като работници в CMLE.
След като заданието за обучение приключи, CMLE не изключва автоматично ресурсите, използвани за обучение. Това е така, защото може да се наложи обученият модел да бъде разгърнат и обслужван за целите на извода. От потребителя зависи да реши кога и как да прекрати ресурсите, за да избегне ненужни разходи.
За да обобщим, CMLE предлага мощна платформа за паралелно обучение по модел на машинно обучение. Той обаче изисква ръчно придобиване и конфигуриране на ресурси и не обработва изключване на ресурс след приключване на обучението. Потребителите трябва да предоставят необходимите ресурси с помощта на GCP услуги като Compute Engine или Kubernetes Engine и да управляват своя жизнен цикъл въз основа на техните специфични изисквания.
Други скорошни въпроси и отговори относно Напредък в машинното обучение:
- Какви са ограниченията при работа с големи набори от данни в машинното обучение?
- Може ли машинното обучение да окаже някаква диалогична помощ?
- Какво представлява детската площадка TensorFlow?
- Режимът на нетърпение предотвратява ли разпределената изчислителна функционалност на TensorFlow?
- Могат ли облачните решения на Google да се използват за отделяне на компютри от съхранение за по-ефективно обучение на ML модела с големи данни?
- Възможно ли е да се обучават модели за машинно обучение върху произволно големи набори от данни без проблеми?
- Когато използвате CMLE, създаването на версия изисква ли да посочите източник на експортиран модел?
- Може ли CMLE да чете от данни за хранилище в Google Cloud и да използва определен обучен модел за извод?
- Може ли Tensorflow да се използва за обучение и извеждане на дълбоки невронни мрежи (DNN)?
- Какво представлява алгоритъмът за усилване на градиента?
Вижте още въпроси и отговори в „Напредък в машинното обучение“.